Hugging Face, американская компания, которая стремится демократизировать искусственный интеллект благодаря открытому коду и открытой науке, считается самым авторитетным независимым контролером моделей ИИ.
Модели Falcon 40B удалось обойти такие устоявшиеся модели, как LLaMA от Meta (в том числе модель 65B), StableLM от Stability AI и RedPajama от Together, достигнув вершины рейтинга. Рейтинг учитывает четыре основных показателя Eleuther AI Language Model Evaluation Harness, объединенной платформы, которая оценивает генеративную языковую модель по таким параметрам: AI2 Reasoning Challenge (25 пунктов), набор вопросов на уровне начальной школы; HellaSwag (10 пунктов), проверка естественного вывода, простого для людей, но сложного для моделей SOTA; MMLU (5 пунктов), измерение многозадачной точности текстовой модели; и TruthfulQA (0 пунктов), измерение верности языковой модели в ответах на вопросы.
Рейтинг больших открытых языковых моделей Hugging Face – это объективное средство оценки, открытое сообществу ИИ, которое отслеживает, упорядочивает и оценивает большие языковые модели и чат-боты по мере запуска.
Обученная на триллионах токенов, модель Falcon 40B знаменует серьезную поворотную точку для ОАЭ в стремлении страны к лидерству в области ИИ, обеспечивая широкий доступ к исследовательскому и коммерческому использованию модели. Новый рейтинг подтверждает высокое качество модели, которая делает ИИ более прозрачным, инклюзивным и доступным на благо всего человечества.
Благодаря этой последней разработке Институт технологических инноваций открыл для ОАЭ место в высшей лиге генеративных моделей ИИ, дав возможность присоединиться к списку стран, которые работают над инновациями и сотрудничеством в области ИИ.
Оригинальный текст данного сообщения на языке источника является официальной, аутентичной версией. Перевод предоставляется исключительно для удобства и должен рассматриваться в привязке к тексту на языке источника, который является единственной версией, имеющей правовое значение.
Контактная информация
Дженнифер Дуан (Jennifer Dewan)
Старший директор по коммуникациям
Источник: Институт технологических инноваций
|