логотип

Мосбиржа, 14:30 (по МСК)

  • USD000000TOD

    USD

    93.05
  • EUR_RUB__TOD

    EUR

    99.3
  • IMOEX

    IMOEX

    3470.88
  • MGNT

    MGNT

    8181
Новости23 июня 2022

«Яндекс» опубликовал нейросеть для текстов

Она используется в «Поиске», голосовом помощнике «Алиса» и чатах с поддержкой

Фото новости: "«Яндекс» опубликовал нейросеть для текстов"

Фото: «Ведомости» // Максим Стулов

«Яндекс» выложил в открытый доступ нейросеть YaLM 100B для генерации и обработки текстов на русском и английском языках, говорится в сообщении компании. 

YaLM 100B работает так: она определяет принцип построения текста и генерирует новые, опираясь на законы лингвистики и знания о мире. Нейросеть может создавать стихи, ответы, поздравления, идеи для рекламных кампаний, описания товаров и др. YaLM 100B содержит 100 млрд параметров — самая большая из существующих моделей для русского языка и самая большая GPT-подобная модель в свободном доступе, утверждает «Яндекс». Самая мощная существующая языковая модель нейросети в мире — GPT-3 (создана OpenAI), построенная на более чем 175 млрд параметров, но для пользователей она не бесплатная. 

YaLM 100B обучали на суперкомпьютерах «Яндекса». Нейросеть обработала около 2 ТБ текстов из открытых датасетов и интернета на английском и русском языках. Обучаясь генерировать тексты, она сначала запоминала, как устроен язык, а потом — реальные факты о внешнем мире, объяснял «Яндекс» в блоге на Habr. 

YaLM может учиться новому всего на нескольких примерах, говорилось в описании запущенной год назад демоверсии нейросети — «Балабоба» (сейчас не работает). Сервис мог генерировать тексты в разных стилях. Чтобы написать осмысленный отзыв на фильм или тост для застолья, YaLM нужно от пяти до нескольких десятков образцов. 

Нейросеть используется в «Поиске» «Яндекса», в чатах поддержки и др. Например, «Поиск» «Яндекса» умеет выдавать «объектные ответы» — короткие выдержки информации по запросу. Их генерирует YaLM 100B на основе описаний из «Википедии», говорится в блоге компании на Habr.

YaLM 100B также генерирует ответы для «Алисы». голосового помощника «Яндекса». Для этого нейросеть обучалась на диалогах людей из соцсетей, а потом на ответах, которые писали редакторы «Яндекса». 

Кроме нейросетей для текстов, существуют и другие их виды. Нейросети используют интернет-магазины, кадровые агентства, банки, букмекеры, колл-центры, онлайн-кинотеатры и видеосервисы, фармкомпании, писал в колонке Inc. эксперт по нейронным сетям «Битрикс24» Александр Сербул. Так, онлайн-магазины рассчитывают с помощью нейросетей бизнес-метрики, а фармацевтические компании улучшают состав лекарств.

14 июня 2022 г. нейросеть в открытый доступ также выложил «Сбер». Она называется Kandinsky и генерирует картинки по описанию на русском языке.

Ранее «Сбер» представлял и языковую модель (760 млн параметров) », в открытом доступе находится ее бета-версия.

Популярное

за неделю
0