Раздел Технологии выходит при поддержке Favbet Tech
В сервисе LMSYS Chatbot Arena обновился рейтинг больших языковых моделей искусственного интеллекта. Он позволяет оценить, какие модели сейчас лучше всего справляются со своими задачами.
LMSYS Chatbot Arena — это краудсорсинговая открытая платформа для оценки больших языковых моделей (LLM). Для составления рейтинга оцениваются более 300 тыс. человеческих отзывов о работе моделей по системе рейтинга Эло.
Как работает тест — люди вводят запрос и выбирают лучший ответ из нескольких вариантов от разных моделей. На основе тысяч пользовательских тестов формируется и ранжируется топ.
Как показывает новый рейтинг чатбот-арены, лидером среди LLM в настоящее время является GPT4. Недавние утверждения Claude, что их модель лучше, не подтвердились. Она заняла третье место. Сразу за ней расположилась модель Bard (Gemini Pro) от Google. Все эти модели получили рейтинг Эло более 1200.
Ознакомиться с подробными актуальными результатами ранжирования имеющихся больших языковых моделей можно по следующему адресу.
Раздел Технологии выходит при поддержке Favbet Tech
Favbet Tech – это IT-компания со 100% украинской ДНК, которая создает совершенные сервисы для iGaming и Betting с использованием передовых технологий и предоставляет доступ к ним. Favbet Tech разрабатывает инновационное программное обеспечение через сложную многокомпонентную платформу, способную выдерживать огромные нагрузки и создавать уникальный опыт для игроков. IT-компания входит в группу компаний FAVBET.
Продолжается конкурс авторов ИТС. Напиши статью о развитии игр, гейминг и игровые девайсы и выигрывай профессиональный игровой руль Logitech G923 Racing Wheel, или одну из низкопрофильных игровых клавиатур Logitech G815 LIGHTSYNC RGB Mechanical Gaming Keyboard!