Интервью с маской: раз бот, два бот, три бот... чат-бот

Под ником Разенбот скрывается вполне конкретный человек – просто по каким-то причинам он не готов подписывать свои откровения настоящим именем. Сегодня мы беседуем с ним о чат-ботах и рисках, которые приходят с ними.

«Приказывать, спрашивать, рассказыват, болтать - в той же мере часть нашей натуральной истории, как ходьба, еда, питье, игра»
Людвиг Витгенштейн

!БДИ: Последние полтора года только и слышно: «Чат-боты, румяненькие, с пылу с жару! Хватай, торопись, на деньги не скупись!». Что происходит?

Разенбот: Коль мы заговорили о горячих пирожках, давайте танцевать от печки.

Мессенджеры существуют давно, но с массовым распространением смартфонов и мобильного Интернета произошло странное. Мессенджеры стали платформой для создания мобильных приложений, которые успешно эксплуатируют вместо классического интерфейса модель чата.

Все началось в октябре 2010 г. Пять сотрудников телекоммуникационной компании Tencent, имевшей к тому моменту самый популярный в Китае мессенджер QQ, создали мобильный мессенджер. Что в нем было необычного? В WeChat впервые была реализована идея «привязки» пользователя при помощи дополнительных функций, ранее не присущих приложениям обмена сообщениями.

Это похоже на модель «Все включено» в туриндустрии. Пользователи WeChat могут получать банковские выписки, оплачивать коммунальные услуги, покупать музыку и книги,  знакомиться с находящимися поблизости людьми, пересылать деньги, проверять информацию с фитнес-трекера, записываться на прием к врачу, искать скидочные купоны, получать новости, играть, заказывать билеты в кино и еду, вызывать такси и проходить регистрацию в аэропорту. Это – целая экосистема, отвязывающая пользователей от мобильной платформы и привязывающая их к мессенджеру.

По стопам WeChat сейчас следуют все разработчики популярных мессенджеров. Только, в отличие от WeChat, они предлагают API, на базе которых третья сторона может разрабатывать собственные чат-боты, используя облачные сервисы и внешние для мессенджера библиотеки.

Огромная и быстро растущая аудитория мессенджеров уже привлекла на этот рынок социальные сети, финансовые организации, коммуникационные компании и пр. Например, в апреле 2016 г. ежемесячная аудитория самых популярных приложений обмена информацией выглядела так (см. диаграмму).

Думаю, причины популярности мессенджеров кроются в естественности интерфейса и появлении целого поколения людей, для которых смартфон – основной инструмент коммуникаций. Это поколение сталкивается с интерфейсом стационарных компьютеров намного позже, чем с интерфейсом телефонов и планшетов. В итоге мы видим рождение диалогового интерфейса как сервиса.

Количество активных пользователей мессенджеров в апреле 2016 г. (ststista.com)

!БДИ: Как устроены чат-боты?

Разенбот: Чат-боты – это диалоговые системы, технология автоматизации различных диалогов. Кратко рассказать о технологиях и библиотеках, используемых в таких системах, довольно сложно. Диалоговые системы могут быть специализированными (например, виртуальный ассистент call-центра), которые делятся на персональные и групповые, и универсальными, подразумевающими возможность просто болтать на какие-то темы.

Специализированные и универсальные системы строятся немного по-разному. При этом в специализированную систему для привлечения клиентов могут добавляться элементы универсальной. Не существует какой-либо универсальной архитектуры. В самом общем виде такие системы содержат модули обработки естественного языка. Они могут применять или не применять подсистемы распознавания и генерации речи, быть самообучающимися и/или задействовать готовое дерево ответов. Самые современные диалоговые системы используют рекуррентные нейронные сети и работают с конкретными языковыми парами.

 

!БДИ: Часто говорят, что чат-боты используют искусственный интеллект. Что это означает?

Разенбот: Не люблю словосочетание «искусственный интеллект», оно вызывает эмоции, мешающие понимать, что это такое. Я предпочитаю термин «машинное обучение».

Как говорит Эндрю Ын, один из ведущих в мире специалистов по машинному обучению, мы живем в эпоху «нового электричества». Про беспилотные автомобили, позор мастеров игры Го, проигрыш профессиональных игроков в покер, программу Libratus, вероятно, не слышали только в племенах Амазонии.  И это «новое электричество» сейчас активно применяется везде, где только можно, в том числе в чат-ботах.

В диалоговых системах используются разные алгоритмы из арсенала машинного обучения, но в последние годы наилучшие результаты получаются в русле «глубокого обучения» (deep learning). Это – разновидность машинного обучения на основе определенным образом построенных искусственных нейронных сетей. На deep learning базируются системы распознавания речи, объектов и, что важно для диалоговых систем, обработчики естественного языка и классификаторы сообщений.

Для потребителя все это похоже на магию: сказал правильные слова, и секретная дверь открылась. А разработчики видят за секретной дверью несметные богатства. Но это – просто технология, которая может привести проект как к успеху, так и к фиаско. Она еще не стала рутинной, и готовых универсальных рецептов пока не существует.

 Для успешного обучения таких систем крайне важно наличие больших массивов информации. Если есть такие накопленные и размеченные массивы информации, из которых можно подготовить data set для обучения, то есть шансы на успех. А если нет, то специалистам просто не на чем будет обучать нейронную сеть.

Эксперты советуют собирать данные как можно раньше, в том числе – впрок. Но и тут не все просто. Нужно понимать, какие именно данные собирать. Например, для обучения чат-бота понадобятся огромные массивы диалогов службы поддержки за предыдущие годы. Самое заметное развитие происходит там, где уже есть исторически накопленные большие массивы данных (диалогов служб поддержки клиентов, фотографий товаров в Интернет-магазинах и т. п.).

Известен успешный кейс сотрудничества Яндекса с «МегаФоном» по созданию с использованием  технологий машинного обучения виртуального ассистента «Елена», уже запущенного в эксплуатацию в Москве. «Елена» может вести диалоги с клиентами и обращаться к биллингу, самостоятельно принимать решения о рекомендациях и предложениях для каждого клиента. «МегаФон» сообщает, что «Елена» обслуживает 60% клиентских запросов, а остальные переводит на операторов.

Кроме того, важны четкая формализация всех процессов, которые ранее выполнял человек, и наличие ясных метрик для оценки результатов (больше клиентов, выше выручка и пр.).

 

!БДИ:  Получается, мы «приплыли»? Боты будут руководить компаниями, состоящими из других ботов?

Разенбот: Пока нет. Человек ставит цели, определяет качество результатов и принимает окончательные решения. Сейчас мы даже теоретически не представляем, как это может делать машина. Но, нужно признать, ситуация стремительно меняется в пользу машин.

 

!БДИ: Какие риски здесь есть?

Разенбот: Я не буду говорить про риски, присущие мессенджерам и облачным сервисам, это – отдельная тема. Поговорим о некоторых специфических рисках.

Во-первых, это прослушивание помещения. Если голосовой чат-бот все время ожидает команду, то высока вероятность такого прослушивания. Атаки на голосовые интерфейсы уже предпринимались.

Во-вторых, «серые» схемы сбора информации о пользователях для дальнейшей перепродажи. Известен случай создания приложения в виде бесплатного чат-бота, сортирующего и проставляющего автоматические теги на телефоне клиента. Создатели программы сформировали базу данных из профилей клиентов, добытых при доступе к личным фотографиям, и продавали ее.

В-третьих, фишинговые боты могут отправлять вас на фишинговые сайты, вести диалоги для выуживания важных данных, подсовывать специально сформированную информацию. Могу себе представить и «спамовые» чат-боты, преднамеренно и неявно вплетающие рекламную информацию в диалог.

В-четвертых, юридические риски. Скажем, бот выдал вам информацию. Если она специально искажена или подделана, то можно подать в суд на разработчиков. Но если рекомендация является результатом действия нейронной сети, а разработчик лишь подобрал специально сформированный data set для ее обучения, то кто отвечает за результат и с кем судиться? Юристы уже задумались об этом. В декабре 2016 г. началось обсуждение проекта закона «О робототехнике». Автором проекта является Дмитрий Гришин из Mail.ru Group, который написал его при поддержке юриста Виктора Наумова из Dentons.

Прошло чуть больше полвека, и фантастический мир, описанный Айзеком Азимовым, начал приходить в повседневную жизнь. Честно говоря, до 2012 г. я в это не верил.

!БДИ: Что с этим делать?

Разенбот: Думаю, специальные боты будут контролировать другие боты. Появятся дополнительные модули в антивирусах, анализаторы диалогов для выявления фишинга, спама и вероятности мошенничества. Все это станет заботой групп безопасников, включающих в себя инженеров с совершенно новыми для ИБ специализациями – chat-bot security. Данную сферу деятельности только предстоит создать.

И не стоит ждать чудес. Предстоит большая кропотливая работа по формализации и автоматизации многих стандартных рутинных операций. Вот такая «Кибериада»!

Тэги: 
Оцените материал:
Total votes: 10

Другие статьи
Поделиться:
 
 
Комментарии в Facebook
 

Вы сообщаете об ошибке в следующем тексте:
Нажмите кнопку «Сообщить об ошибке», чтобы отправить сообщение. Вы также можете добавить комментарий.