Она используется в «Поиске», голосовом помощнике «Алиса» и чатах с поддержкой
«Яндекс» выложил в открытый доступ нейросеть YaLM 100B для генерации и обработки текстов на русском и английском языках, говорится в сообщении компании.
YaLM 100B работает так: она определяет принцип построения текста и генерирует новые, опираясь на законы лингвистики и знания о мире. Нейросеть может создавать стихи, ответы, поздравления, идеи для рекламных кампаний, описания товаров и др. YaLM 100B содержит 100 млрд параметров — самая большая из существующих моделей для русского языка и самая большая GPT-подобная модель в свободном доступе, утверждает «Яндекс». Самая мощная существующая языковая модель нейросети в мире — GPT-3 (создана OpenAI), построенная на более чем 175 млрд параметров, но для пользователей она не бесплатная.
YaLM 100B обучали на суперкомпьютерах «Яндекса». Нейросеть обработала около 2 ТБ текстов из открытых датасетов и интернета на английском и русском языках. Обучаясь генерировать тексты, она сначала запоминала, как устроен язык, а потом — реальные факты о внешнем мире, объяснял «Яндекс» в блоге на Habr.
Читать также:
YaLM может учиться новому всего на нескольких примерах, говорилось в описании запущенной год назад демоверсии нейросети — «Балабоба» (сейчас не работает). Сервис мог генерировать тексты в разных стилях. Чтобы написать осмысленный отзыв на фильм или тост для застолья, YaLM нужно от пяти до нескольких десятков образцов.
Нейросеть используется в «Поиске» «Яндекса», в чатах поддержки и др. Например, «Поиск» «Яндекса» умеет выдавать «объектные ответы» — короткие выдержки информации по запросу. Их генерирует YaLM 100B на основе описаний из «Википедии», говорится в блоге компании на Habr.
YaLM 100B также генерирует ответы для «Алисы». голосового помощника «Яндекса». Для этого нейросеть обучалась на диалогах людей из соцсетей, а потом на ответах, которые писали редакторы «Яндекса».
Кроме нейросетей для текстов, существуют и другие их виды. Нейросети используют интернет-магазины, кадровые агентства, банки, букмекеры, колл-центры, онлайн-кинотеатры и видеосервисы, фармкомпании, писал в колонке Inc. эксперт по нейронным сетям «Битрикс24» Александр Сербул. Так, онлайн-магазины рассчитывают с помощью нейросетей бизнес-метрики, а фармацевтические компании улучшают состав лекарств.
14 июня 2022 г. нейросеть в открытый доступ также выложил «Сбер». Она называется Kandinsky и генерирует картинки по описанию на русском языке.
Ранее «Сбер» представлял и языковую модель (760 млн параметров) », в открытом доступе находится ее бета-версия.
Популярное
Логистический оператор Exmail подал иск к «Авито» на 1 млрд руб. из-за сворачивания пунктов выдачи
США внесли «Авито» и VK в список распространителей контрафакта и пиратского контента
Правительство запустило сельхозгрант для ветеранов спецоперации