Социальная сеть Meta вступит в новую цифровую эру, вскоре выпустив Llama 3. Выход этой долгожданной технологической жемчужины анонсирован в начале 2024 года.
Тайна вокруг разработки Llama 3
Слух вокруг Llama 3 растёт. На самом деле это модель искусственного интеллекта, которую Meta планирует запустить в 2024 году. Это вызвало много любопытства и спекуляций в гонке за доминирование в области искусственного интеллекта. Предыдущая модель Meta, Llama 2, уже завоевала позиции на рынке с момента ее выпуска в июле. Сеть Meta пока официально не подтвердила эти слухи. Но Марк Цукерберг недавно намекнул на будущее языковых метамоделей (LMM). Он признал, что Llama 3 сейчас находится в стадии разработки. В интервью подкасту об искусственном интеллекте и Метавселенной Цукерберг упомянул, что они постоянно обучают новые модели и что Llama 2 была выпущена как модель с открытым исходным кодом.
- Слухи вокруг выхода Llama 3 в начале 2024 года
- Llama 2, успех Меты
- Цукерберг намекнул на разработку «Ламы 3»
Признаки, которые подпитывают спекуляции
Согласно истории циклов разработки моделей в Meta, пользователь Reddit по имени llamaShill представил подробный анализ. Это подтверждает гипотезу о выпуске Ламы 3 в начале 2024 года. По его словам, Лама 1 обучалась с июля 2022 года по январь 2023 года, затем Лама 2 до июля 2023 года. Это предполагает обучение Ламы 3 в период с июля 2023 года по январь 2024 года. Кроме того, эти выводы совпадают с желанием Meta сохранить поул-позицию против OpenAI и ее конкурирующей модели GPT-4.
- Тщательный анализ циклов разработки исторических моделей.
- Возможное соперничество с OpenAI и GPT-4
- Инвестиции в ИИ, чтобы не отставать от конкурентов
Прочное партнерство с Dell
Анонимный источник утверждает, что у Meta будет достаточная вычислительная мощность. Этой мощности достаточно для обучения не только Llama 3, но и потенциальной Llama 4. Таким образом, Méta также может предложить их с открытым исходным кодом. Партнерство с Dell демонстрирует стремление компании к улучшению данных и безопасности. Это должно помочь защитить бизнес-пользователей от локальных версий моделей Llama.
- Мощные вычисления для тренировки Ламы 3 и Ламы 4
- Приверженность безопасности и конфиденциальности данных
Llama 3 может стать открытым исходным кодом
Цукерберг выдвигает идею создания Llama 3 с открытым исходным кодом. Эта идея поможет стимулировать дискуссии об амбициях Меты в этой области.
Сила настроек
Метрики играют решающую роль в эффективности LLM. Они определяют способность модели понимать и генерировать язык. Кроме того, их количество часто коррелирует со сложностью и качеством производства модели. Таким образом, Meta обучила свой ИИ на основе массива из 2 триллионов токенов, что позволило ему генерировать тексты, похожие на человеческие сочинения, на различные темы и контексты.
- Основные параметры для улучшения понимания и генерации языка
- Корпус из 2 триллионов токенов для эффективного ИИ
Крупные инвестиции в оборудование искусственного интеллекта
По информации, предоставленной Decrypt, Meta занимается оснащением одного из своих дата-центров. Для обучения ИИ будут использоваться высокопроизводительные аппаратные средства Nvidia H100. Эти инвестиции подтверждают активное внимание Meta к достижению своих целей в области искусственного интеллекта. При этом также учитываются время обучения, требования к оборудованию и важнейший вопрос доступности открытого исходного кода.
Надежная новая инфраструктура для многообещающего будущего
Учитывая эти различные достижения, кажется очевидным, что Meta продолжает концентрироваться на интеграции искусственного интеллекта в свои продукты. Разработка Llama 3 может оказаться решающей для технологического развития компании и, прежде всего, для сохранения конкурентоспособности по отношению к конкурентам, также стремящимся доминировать на рынке искусственного интеллекта.