Мета добавила два новых лингвистические модели в его серию: Лама 3 8Б e Лама 3 70Б. Они обещают превосходную производительность в мире искусственного интеллекта. Самая яркая новость? Наличие 8 миллиардов и 70 миллиардов параметров соответственно. Эти цифры отражают сложность и способность модели обрабатывать и обрабатывать информация.
Llama 3 — это не просто две модели: скоро появится еще больше материалов
Мета не останавливается на достигнутом; планирует выпустить больше моделей серии Llama 3, но без указания даты. Эта стратегия создает ожидание, а также демонстрирует стремление компании постоянно совершенствовать свои предложения.
I новые модели лам их описывают как скачок по сравнению с предыдущими моделями. Это улучшение частично связано с использованием два пользовательских кластера графических процессоров, каждый из которых имел 24.000 XNUMX единиц, что позволило более эффективно и точно обучать модели. Мета утверждает, что из-за количества параметров эти модели являются среди лучших доступных сегодня для генеративного искусственного интеллекта.
Производительность Llama 3 измерялась с помощью различных тестов искусственного интеллекта — стандартизированных тестов, используемых для оценки возможностей моделей искусственного интеллекта. К ним относятся ММЛУ для знаний, ARC для приобретения навыков, е DROP для рассуждений о блоках текста. Хотя существуют разные мнения о полезности этих тестов, они остаются распространенным методом оценки и сравнения возможностей моделей ИИ.
В частности, Llama 3 8B превзошла по производительности аналогичные модели с открытым исходным кодом с меньшим количеством параметров, такие как Mistral и Гугл Джемма, как минимум в девяти различных тестах. Сюда входят тесты на общие знания, рассуждение и конкретные навыки в таких областях, как биология, физика, химия и даже генерация кода и математические задачи. С чем, например, GPT-4 не очень хорошо справляется.
Самая крупная модель Llama 3 70B не только конкурирует, но и в некоторых случаях превосходит флагманские модели, такие как Близнецы 1.5 Pro от Google в различных тестах, доказав, что, несмотря на сильную конкуренцию, он может противостоять даже гигантам отрасли. Однако важно отметить, что, хотя он и превосходит некоторые флагманские модели, такие как Клод 3 Сонет от Anthropic в ряде тестов он не достигает производительности более совершенной модели Claude 3 Opus.