9 Сентябрь 2023 Новые технологии
7 сентября, крупнейшая интернет-компания Китая Tencent, представила чат-бот Hunyuan — свою многоязычную модель искусственного интеллекта. Пока он открыт для тестирования компаниями и организациями. Самым большим преимуществом нового чат-бота на данны...
Аморфный Постер
Время на прочтение: 3 минут(ы)
7 сентября, крупнейшая интернет-компания Китая Tencent, представила чат-бот Hunyuan — свою многоязычную модель искусственного интеллекта. Пока он открыт для тестирования компаниями и организациями. Самым большим преимуществом нового чат-бота на данный момент является то, что он опирается на китайский язык.
Более 1,4 миллиарда человек говорят на китайском как на родном языке (1,3 миллиарда из них проживают в Китае, что логично). Хотя чат-бот GPT поддерживает мандаринский язык, он недоступен в Китае. Этот факт заставляет огромное количество китайских пользователей, прежде всего компаний, которые не могут официально использовать популярные зарубежные чат-боты, активно искать собственных разработчиков.
Tencent, которой принадлежит приложение WeChat, заявила, что Хуньюань владеет китайским языком лучше не только других моделей искусственного интеллекта, но и некоторых людей. Оценка Hunyuan превысила показатель GPT-4 на вступительном экзамене в китайский университет, заявил Цзян Цзе, вице-президент Tencent, на бизнес-саммите в Шэньчжэне во время первой публичной демонстрации Hunyuan.
По другому критерию, оценке понимания китайского языка, чат-бот Hunyuan набрал рекордные 86,918 балла, в то время как AliceMind от Alibaba — 86,685 балла. Проходящие тест люди показали результат чуть ниже AliceMind.
Tencent также утверждает, что Hunyuan выдает меньше ошибок — или “галлюцинаций”, при которых модели искусственного интеллекта генерируют неверную информацию и представляют ее как факты.
Цзян Цзе, вице-президент Tencent:
По сравнению с [другими] моделями с открытым исходным кодом, распространенными на рынке в настоящее время, [наш] метод эффективно снижает частоту галлюцинаций на 30-50 процентов.
Правда стоит отметить, что журналисты не смогли найти подтверждения этому утверждению. Но опровергнуть тоже не смогли.
ChatGPT и дезинформация
Специалисты отмечают, что есть много недоработок в ChatGPT на китайском — пунктуация и терминология. Но грамматика — не единственный его недостаток. Опытным путем было обнаружено, что ChatGPT на китайском языке распространяется больше дезинформации, чем на английском.
Например, когда бота спросили о протестах в Гонконге на английском языке, в ответ он назвал их “подлинным и народным движением”. Однако тот же вопрос на китайском языке вызвал более обтекаемый, неточный ответ о том, что “протесты в Гонконге были «цветной революцией», направляемой Соединенными Штатами».
В отдельном случае ChatGPT подделал резюме, когда его спросили о профессоре Пекинского технологического института.
2 триллиона — количество токенов в данных предварительного обучения Hunyuan. В 2020 году у GPT-3 было 300 миллиардов.
50 — количество коммерческих решений с поддержкой крупных языковых моделей, которые Tencent уже внедрила совместно с клиентами в различных секторах, таких как финансы, медиа, путешествия и образование.
Пока Пекин разрабатывает правила для разработчиков искусственного интеллекта, балансируя между конкурентоспособностью своей отрасли и необходимостью контролировать Интернет, несколько китайских технологических гигантов добились прогресса не только в борьбе с «попсовым» ChatGPT, но и с другими конкурентами.
Другие позитивные новости по теме
Китай смягчает правила для искусственного интеллекта
Использованы материалы:
https://www.reuters.com/technology/chinas-tencent-says-large-language-ai-model-hunyuan-available-enterprise-use-2023-09-07/
https://www.barrons.com/news/tencent-claims-new-ai-chat-bot-skills-comparable-to-chatgpt-9d90ca97
https://www.scmp.com/tech/big-tech/article/3233753/tencent-unveils-hunyuan-foundation-ai-model-enterprises-public-debut-internet-giants-chatbot-remains