Блог Яндекса для вебмастеров

NER в навыках Алисы, или как Алиса научилась распознавать именованные сущности за вас

Пост в архиве.

Порой кажется, что при создании чат-ботов всегда можно задать чёткий вопрос, например, «когда вам привезти пиццу». Однако в реальной жизни даже при такой постановке вопроса пользовали отвечают на свой лад:

Навык: Когда вам привезти пиццу?

Пользователь:

— завтра

— послезавтра в 9 утра

— послезавтра в 9 часов 40 минут

— через два часа

— 4 октября в 18 часов

— в 6 часов вечера

Как видно из примеров, поддержка «парсинга» всех возможных вариантов даты, времени, адресов и других сущностей — очень трудозатратная задача. И чтобы навык не ответил как-то так:

— Представьтесь, пожалуйста

— А ну это, Иван Иванов

— Я запомнила, что вас зовут «А ну это, Иван Иванов»

нужно подключать распознавание именованных сущностей. Так ваш навык станет сильно умнее, и вы сможете постичь дзен NLU.

Поэтому мы решили поделиться технологией Яндекса, которая решает эти задачи для наших сервисов. Теперь Алиса может не просто передавать вам текст, продиктованный пользователем, а выделять из него конкретные сущности с помощью NER (named-entity recognition):

  • имена (фамилия, имя, отчество);
  • указания на местоположение;
  • даты и время;
  • целые и дробные числа.

Подробная инструкция по работе с этим инструментом уже в нашей Документации. И интересный рассказ о самой технологии в блоге Яндекса на Хабре.

Благодаря этому внедрению от команды Яндекс.Диалогов, ваш навык сможет общаться с пользователями на более живом языке при существенно меньшем объеме разработки.

Команда Яндекс.Диалогов и Алиса

P. S. Подписывайтесь на наши каналы
Блог Яндекса для Вебмастеров
Канал Яндекса о продвижении сайтов на YouTube
Канал для владельцев сайтов в Яндекс.Дзен

21 комментарий
Константин Ануфриев
5 октября 2018, 11:30
Отлично, направлял в поддержку запрос по поводу распознавания бренда и не раз, до сих пор нет ответа, может тут подскажите?)
Комментарий удалён
baf762,
да они те еще слоупоки, если они три месяца исправляли произношение "сет номер 1" у папы джонс.... которого пиарили
Обновлено 5 октября 2018, 15:33
Елена Першина
Сотрудник Яндекса5 октября 2018, 20:05
baf762,
я несколько раз попросила не оскорблять модераторов. Простите, но это бан. 
Елена, что у вас с командой турбо-страниц? Ответ от поддержки приходит через месяц... я уже и забыл о чем спрашивал и они отвечают, их там что 2 человека? это очень неудобно... и постоянно ошибка какая-то в Вебмастере типа нету турбо страниц и приводится их список, смотришь в выдаче, все окей, турбо страницы есть. Писать в поддержу и ждать месяц ответ желания никакого нет. 
Руслан Филонов
7 октября 2018, 23:49
vadimkalasnik7,
поддерживаю. Время идёт, а проблемы не решаются. Ждем от поддержки разбирательств, связанных с появлением ошибки на всех проектах "Предупреждение обновления". 
platon
Сотрудник Яндекса9 октября 2018, 10:11
vadimkalasnik7,
всем ответят, но нужно подождать, к сожалению :(
Амёбу учат секретарскому делу.:)) А почему не разработать контроль  общей логики диалога чтобы не получать ответы приведённые выше ?
Обновлено 5 октября 2018, 18:17
tim-nasedkin,
Поддерживаю
Рапакс Строй
5 октября 2018, 22:30
Что это за понятие такое "именованные сущности"? Очень режет слух. Представляется оно очень неудачным и можно было бы выбрать для описания более удачное понятие.
Алису на сайт можно встроить? Как голосовой поиск?
myWEBpc,
 поиск в любом виде Яндекс оставит себе, увы но это так. Задача Алисы - привлечение пользователей к сервису Яндекса через бизнес партнёров... А сайты как всегда будут полагаться на усилия их владельцев...
Елена Першина
Сотрудник Яндекса7 октября 2018, 13:16
myWEBpc,
Алису встроить на сайт пока нельзя.  Поиск, кстати, можно, в виде Поиска для сайта:  https://site.yandex.ru/ 
Доставка воды в СПб
9 октября 2018, 13:12
Елена Першина,
Вы не думали вместо ТОП 10 сделать ТОП 5 или 8? Это бы дало больше кликов по рекламе и топовым сайтам в органике.

Заметил, что Вы тестируете топ 15 и ...это как то неудачно для сайтов. Клики и заказы размазываются на большее количество фирм. Организации просто начнут клепать больше сайтов.
Сегодня использовал Алису, но она так и не поняла слово "Волокдент", подумав, что это вологда, кому-писать, куда жаловаться?
Елена Першина
Сотрудник Яндекса8 октября 2018, 14:05
handleftman,
это ведь вопрос распознавания голоса, а не именованных сущностей. Я так понимаю, вы про бренд говорите? Про бренд вот тут: https://yandex.ru/blog/dialogs/nauchite-alisu-uznavat-vash-brend 
Елена Першина,
 спасибо за быстрый ответ, попробуем решить это.
Константин Мищенко @frendsmans Санкт-Петербург
10 октября 2018, 16:17
А я вот не в тему просто. Но по Яндекс музыке, 2 года подписчик. 10 раз писал в службу поддержки. Бесполезно. С августа не могу добавлять композиции в плелисты. ЧТо же делать? Алису спрашиваю, а она то же молчит.
Елена Першина
Сотрудник Яндекса11 октября 2018, 15:19
Константин Мищенко @frendsmans Санкт-Петербург,
А можно номер обращения в поддержку? Я проверю. 
Константин Мищенко @frendsmans Санкт-Петербург
11 октября 2018, 20:25
Елена Першина,
а как бы посмотреть? Там простоя уходят сообщение или второй случай, к странице нет доступа.
Елена Першина
Сотрудник Яндекса11 октября 2018, 21:14
Константин Мищенко @frendsmans Санкт-Петербург,
а ответа нет? Откуда писали, через какую форму? Логин этот? 
Константин Мищенко @frendsmans Санкт-Петербург
11 октября 2018, 21:30
Елена Першина,
этот логин. Форма. https://yandex.ru/support/music/troubleshooting/player.html#player и там рядышком есть. Да же однажды нажимал для правообладателей и что-то там связанное не могу прослушать. Сегодня один трек закинул, но это стало редким явлением.