Местный
Регистрация: 22.12.2010
Сообщений: 1,663
Репутация: 1805
|
Что умеет искусственный интеллект сегодня? И чего от него ждать завтра?
Цитата:
А. Плющев
― Московское время 22 часа 10 минут, добрый вечер. Вас приветствует Александр Плющев, и здесь же управляющий партнер компании Notamedia Сергей Оселедько. Добрый вечер.
С. Оселедько
― Добрый вечер.
А. Плющев
― В полном составе мы сегодня поговорим об искусственном интеллекте. Ну, потому что очень много бывает в новостях, сообщают, там: искусственный интеллект сделал то-то, искусственный интеллект сделал то-то, ученые достигли уже в освоении искусственного интеллекта того-то… Ну, и много всего. Что же такое искусственный интеллект, что он умеет сегодня, чего от него ожидать завтра? Так мы решили озаглавить нашу сегодняшнюю программу. Мы будем об этом разговаривать с Анатолием Старостиным, руководителем группы исследования технологий извлечения информации ABBYY. Добрый вечер.
А. Старостин
― Добрый вечер.
А. Плющев
― И с Александром Крайновым, руководителем службы компьютерного зрения и технологий машинного интеллекта Яндекса. Добрый вечер, Саша.
[Лучшие тактические часы спецназа дешево + 2 подарка на выбор]
Лучшие тактические часы спецназа дешево + 2 подарка на выбор
Реклама
""
А. Крайнов
― Добрый вечер.
А. Плющев
― Отлично. Вот, собственно, с вопроса, что умеет искусственный интеллект сегодня – у нас две части в программе, давайте первую часть – что умеет сегодня, а вторую – чего от него ждать завтра.
Если серьезно, я бы хотел прямо с Яндекса начать, если позволите. У вас же была выдающаяся вещь, которую и на нашей радиостанции освещали тоже, ну, и вообще широко прокатилась, это альбом Егора Летова, написанный искусственным интеллектом. Это прямо самая граница, к которой подошел искусственный интеллект и самое главное направление? Или это, ну, какой-то фан, я не знаю, с помощью которого можно это явление популяризировать?
С. Оселедько
― Ну, да, что хотели сказать-то этим? Главный вопрос.
А. Крайнов
― Скорее второе. Это все-таки был фан. И что, собственно, было сделано нейронной сетью? Нейронная сеть написала стихи. Нейронная сеть обучилась на стихах Егора Летова и написала стихи в стиле Егора Летова, ну, насколько смогла нейронная сеть написать стихи в стиле Егора Летова. В чем здесь состоит такой трюк, почему это вообще возможно?
Дело в том, что в стихах не содержится зачастую, по крайней мере, не содержится такого последовательного какого-то изложения четкого внятного смысла. Мы сами додумываем, стихи – это некий повод нам о чем-то подумать и придумать смысл самим. И тексты или какие-то несвязанные парадоксальные порой между собой фразы, которые звучат в стихах, мы считаем вполне нормальными и допустимыми. Если это написать в прозе, это будет выглядеть как некий бред. Нейронная сеть научилась…
С. Оселедько
― Я прямо чувствую, как поэты напряглись после такой…
А. Крайнов
― Нейронная сеть научилась таким образом комбинировать и сочетать между собой фразы, что это действительно похоже на поэзию. Это действительно похоже на задумчивые философские стихи, нам так кажется, там затрагиваются какие-то тонкие темы, какие-то аналогии, ассоциации. Но на самом деле их скорее там нет. То есть, это не стихи, это стилизация под стихи. Сделать стилизацию под стихи, под человека, который пишет стихи, намного проще, чем попытаться сделать стилизацию под человека, который пишет прозу.
С. Оселедько
― Вообще искусственный интеллект – это что такое в понимании Яндекса?
А. Крайнов
― Ох, сложно представить, что есть такое… ну, как бы нету такого понимания Яндекса, чтобы Яндекс сидел в коллективе и думал, что такое искусственный интеллект. Я даже не уверен, что…
С. Оселедько
― Вот я должность вашу читаю: служба компьютерного зрения и технологий машинного интеллекта. Вот мне здесь обе фразы не очень понятны.
А. Крайнов
― Хорошо, давайте я расскажу, где я для себя провожу границу, что есть искусственный интеллект и что все-таки нет искусственного интеллекта. Машину очень давно учат принимать решения, и машина всегда принимала решения, даже там простой конечный автомат – и тут же принятие решений. Но с моей точки зрения – я могу быть неправ, заблуждаться, довольно спорное мнение, но все-таки – искусственный интеллект – это такой end-to-end обучения. Это тогда, когда мы машине даем некий набор вводных данных и говорим: разбирайся с ними сама, научись сама принимать решения на основе этих данных. То есть, очень долго в машинном обучении, в обучении машины принятию каких-то решений, выполнению каких-то задач, люди поступали таким образом, что готовили какие-то факторы, какие-то основания для принятия решений, они это делали за машину, говорили, составляли такой некий довольно четкий алгоритм – если вот так, то так; если вот так, то этак. То есть, алгоритм все-таки составлялся.
Сейчас в той области, которую мы называем машинным или искусственным интеллектом, ситуация обстоит несколько не так. Машине готовят примеры для обучения, машине ставят некую цель, которую она должна достичь, а дальше она, анализируя эти примеры, учится сама составлять такой алгоритм, который приведет ее к успеху. И вот такая способность к самообучению…
С. Оселедько
― К самопрограммированию.
А. Крайнов
― К самопрограммированию фактически, да, мне кажется, за такую способность вполне можно присвоить почетное звание искусственного интеллекта тому, что делает машина.
А. Старостин
― Если позволите…
А. Плющев
― Да, присоединяйтесь, да.
А. Старостин
― Хочу просто детализировать вот мысль коллеги последнюю на конкретном примере. Вот, например, мы можем вспомнить, как развивалась область компьютерных шахмат. Долгое время люди, еще начиная с 50-х годов ХХ века разрабатывали программы, которые должны играть в шахматы. Они изучали – ну, правила шахмат известны, ну, вот они пытались, разговаривая, видимо, с профессиональными шахматистами, думая над тем, как это все делать, пытались написать программу, которая хорошо играет в шахматы. И в результате к середине 90-х люди такую программу написали, и компания IBM выпустила своего Deep Blue, который обыграл Гарри Каспарова, и это в тот момент тоже была первая победа, ее называли победой искусственного интеллекта.
С. Оселедько
― Это прямо искусственный интеллект был?
А. Старостин
― Как раз в данном случае никакого автоматического обучения не было, была просто программа, которая очень долго программировалась хорошими программистами, в которую было заложено очень много так называемых эвристик. А сегодняшняя картинка – и тут мы сразу вспоминаем недавнюю новость с игрой Го и с компанией Гугл, она принципиально отличается от этого, потому что игра в Го еще более комбинаторно сложна, там пространство перебора, там как бы трудно сравнивать одну бесконечность с другой, но она гораздо более бесконечная, чем в шахматах.
А. Крайнов
― Но в Го как-то посчитали, там количество вариантов в игре больше, чем атомов во вселенной.
А. Старостин
― И всем было понятно, что как бы просто запрограммировать так же как с шахматами, не получится, и Го считалась игрой, которая совершенно для людей.
А. Плющев
― Уж тут-то мы не отдадим. Но нет.
А. Старостин
― Потому что мастера игры в Го, они не столько перебираются в пространстве, сколько у них очень сильно развита интуиция.
А. Крайнов
― Я здесь могу добавить, как играют люди в Го? Дело в том, что в Го нету внезапной смерти, как в шахматах – в шахматах мат – это внезапная смерть. То есть шахматы заканчиваются в какой-то момент времени. В Го часто невозможно понять…
А. Плющев
― Просто один из соперников умирает от старости.
(смех)
А. Крайнов
― … стало лучше или стало хуже после довольно большого количества ходов. И игроки начинают это чувствовать, ну, проявляют какую-то свою интуицию – вот так стало лучше, так стало хуже, так у меня больше, так у него меньше, у него тут переконцентрация или еще что-то. Оценивать какие-то визуальные образы, формы. То есть, есть перебор ходов, для того чтобы прийти к какой-то позиции, а дальше можно эту позицию оценить – стало лучше или хуже. То есть, на каждом этапе проявляется некая интуиция. Интуиция заменяет в какой-то момент времени способность перебирать или уменьшает количество вариантов для перебора.
То есть, можно на интуитивном уровне предположить, куда лучше пойти, сделать, выбрать 10, 15, 20 вариантов лучшего хода, потому что вообще в игре Го нормальных вариантов может быть больше ста следующего хода. Все их обсчитывать очень тяжело, потому что от следующей сотни идет следующая сотня, а сужение выбора – это…
А. Старостин
― Все верно. Я хотел вывод как бы сделать из этого: почему сейчас получилось? Почему машина обыграла в Го мастера, мирового мастера, чемпиона мира по Го? Потому что сработали как раз вот эти новые алгоритмы машинного обучения, базирующиеся на нейросетях, которые смогли – машина обучалась на примерах, во-первых, у нее было энное количество примеров успешных партий хороших, и во-вторых, поскольку это формально игра, в нее можно играть сколько угодно, машина могла играть сама с собой. То есть, можно запустить, и она играет бесконечное количество партий, вот нажмешь кнопку – она перестанет играть. И они вот так и сделали, они дали хороших партий, запустили эту симуляцию, и все это время нейросетевой алгоритм как бы впитывал вот эту информацию, и таким образом им как бы удалось смоделировать эту самую интуицию. То есть, получается, нейросетевые алгоритмы сегодня могут как бы работать с интуицией игрока так, как раньше было совершенно невозможно.
А. Крайнов
― А давайте попробую даже упростить. У меня есть один прекрасный пример – все время его привожу – который объясняет разницу между, где искусственный интеллект, а где нет. Есть такая задача распознавание образов, если спрашивают, что такое компьютерное зрение – это распознавание образов. И представим себе, что перед нами стоит задача распознавать, что на листочке бумажки нарисован кубик, такая совсем простая задача. Начнем решать ее в лоб. То есть, кубик же может быть нарисован, самый простой способ нарисовать кубик – это рисовать квадрат, и мы опишем, что если нарисован квадрат, то скорее всего кубик, а как описать квадрат, мы знаем. Ну, принцип – равные стороны, прямые углы. Дальше. Кубик может находиться в изометрии, тогда просто квадрат не работает, и мы начинаем составлять какие-то довольно сложные – ветвистое дерево принятия решений, что линии должны быт такие-то, тут они должны быть параллельными, могут быть перспективные искажения, и тогда линии вот такие, можем посчитать, сколько должно быть углов, и в результате такой долгой кропотливой работы за неделю мы напишем правило, по которому станет понятно, кубик это или нет, и можем запрограммировать это правило, и машина с некой вероятностью сможет отличать, кубик это или нет. Довольно сложно, согласитесь, называть такую программу искусственным интеллектом.
А можем поступить по-другому. Мы возьмем сумасшедшее огромное бешеное – тысячи, миллионы – изображений кубиков и такое же количество изображений не кубиков, загрузим это в нейронную сеть, нажмем кнопочку и скажем: учись. Нейронная сеть будет сама пытаться извлечь изображение и признаки до тех пор, пока она не научится довольно уверенно отличать кубик от не кубика. И чем больше у нас будет данных для обучения, тем точнее она это будет делать.
Причем, мы потом можем ей помочь. Когда мы посмотрим, на каких случаях машина ошибается, мы именно таких случаев ей добавим в обучение. Скажем, вот посмотри, все-таки это кубик, а вот это ты ошибочно принимала за него, это не он.
А теперь обратите внимание, как мы учим ребенка отличать, что такое кубик, а что такое нет. Конечно, никто не будет в здравом уме и твердой памяти двухлетнему ребенку объяснять про прямые углы, грани и вот это вот все. Ровно так же, например, то есть, мы начинаем называть машинное обучение искусственным интеллектом в тот момент, когда она начинает учиться примерно так же, как учится естественный интеллект.
С. Оселедько
― А только ли нейронные сети лежат в основе вот этого механизма обучения, или еще есть какие-то другие подходы? Искусственный интеллект и нейронная сеть сейчас – это синонимы практически в современном мире?
А. Крайнов
― Мне кажется, да.
А. Старостин
― Но вот тут я как раз хотел бы сказать. Мне кажется, что в современном мире, да, это действительно так, и сейчас это прямо вот ассоциация такая первая, которая возникает: искусственный интеллект – нейронная сеть. И мне лично кажется, что это не совсем хорошо, что это не совсем правильно, что люди немножко даже замкнулись на нейросетевых сейчас алгоритмах, очень полюбили слово «deep learning» (глубокое обучение), и это те же нейросети, просто еще сложно иерархически организованные. И этого настолько стало много, что люди действительно как-то ассоциируют именно нейронные сети с искусственным интеллектом.
А на самом деле не случайно коллега сейчас рассказывал про задачу классификации. Потому что это действительно основная задача, которую все сейчас решают, это задача классификации, отличить одно от другого, хорошее от плохого, красное от зеленого, кубик от не кубика, собачку от не собачки. И, в общем-то, строго говоря, это всего лишь одна из функций нашего интеллекта, мы еще умеем, например, производить логический вывод, мы умеем читать, например, и понимать…
С. Оселедько
― Мне кажется, логику запрограммировать вообще не сложно, она же такая прямо вся формальная, так легко ложится на…
А. Старостин
― Но это тоже не совсем так, просто мне хочется подчеркнуть в данном случае, что искусственный интеллект, наверное, может быть каким-то образом декомпозирован на множество задач классификации. То есть, можно как бы сказать, что вот если мы все задачи классификации научимся решать хорошо, то потом мы их как-то все скомбинируем, и у нас получится искусственный интеллект. Но на самом деле вопрос того, как их комбинировать, он ничуть не более простой, чем решение отдельных задач. То есть, на самом деле большой искусственный интеллект на сегодняшний день – это пока еще очень большая проблема, о которой как бы не особенно… нет, кто-то уже думает, пишут люди и так далее, но это совсем область науки. А мы в основном все, что мы слышим – это на самом деле разного рода узкий искусственный интеллект (narrow artificial intelligence), и разные задачи, которые мы сегодня затрагивали, это различные интеллектуальные задачи, которые часто сводятся к задаче классификации, и вот в этих задачах сегодня действительно бум нейросетевых алгоритмов, которые хорошо с ними справляются.
С. Оселедько
― Возвращаюсь к исходному вопросу: до чего сегодня-то мы дошли, что мы уже умеем? Вот что вы в Яндексе уже умеете? Ну, то есть, кроме…
А. Плющев
― Кроме Песни Егора Летова.
С. Оселедько
― Ну, то есть, до чего прогресс-то дошел? Удивите нас.
А. Крайнов
― Сейчас попробую, хотя тут такая область, что удивлять довольно тяжело, потому что если это только вчера появилось первый раз, то сегодня уже человек считает, что это привычно и не какое-то удивление – нормальная история.
Научились распознавать изображения, научились распознавать изображения с точностью, зачастую превышающую точность распознавания изображения человека. То есть, совсем еще недавно, года 4 назад, была сверхзадача научиться отличать кошку от собаки – не умели, то есть, на этом алгоритмы компьютерного зрения плохо очень работали. То сейчас алгоритмы довольно уверенно различают и классифицируют различные породы собак, отличая легко сибирскую лайку от хаски и различные породы спаниелей между собой, что и человеку сделать тяжело. Или различные виды рыб, животных – все что угодно. То есть, при наличии большого количества данных для обучения размеченных данных – а их сейчас все больше и больше, нейронная сеть справляется с задачей лучше человека. Нейронная сеть способна узнавать человека лучше, чем это делает человек, при следующих условиях. Конечно, мы лучше способны узнать нашего знакомого, которого мы видели много раз, но если нам показать фотографию не знакомого нам человека и найти его же среди множества других фотографий, то нейронная сеть с этой задачей справляется сейчас уже лучше, чем человек. Кроме распознавания изображений есть такая вещь, как распознавание речи.
С. Оселедько
― А в потоковом видео, там, с камер наблюдения, уже нормально это все работает?
А. Крайнов
― Конечно.
С. Оселедько
― То есть, условно говоря, если человек в розыске, его прямо можно в режиме налету распознавать?
А. Крайнов
― Можно. Здесь скорее вопрос в том, где…
С. Оселедько
― Я просто смотрю сериалы…
А. Плющев
― Ну, да, естественно, там уже…
С. Оселедько
― Вот это уже есть, или?..
А. Крайнов
― Большой вопрос, где взять большое количество изображений человека в розыске, то есть, для начала нужно все-таки составить большую базу. Это первый момент.
А. Плющев
― Как где? В его социальной сети, в его аккаунте.
А. Крайнов
― А следующий момент заключается еще в том, что это все требует огромнейших вычислительных ресурсов.
С. Оселедько
― Я к этому-то и вел.
А. Крайнов
― Да-да, обрабатывать больше количество изображений с видеокамер, все вот это потоковое видео на всех всегда, это невероятной сложности задача. Я не специалист в области криминалистики, в системах безопасности, я не знаю, насколько все распознается с камер, но могу предположить следующее, что скорее всего анализ идет в том случае, если что-то случилось. А такая история, как упреждать, как заранее понимать, что человек, который сейчас прошел мимо этой камеры, возможно, он террорист и плохой, задумал что-то недоброе, то что алгоритмы, которые это делают, разрабатываются, это абсолютно точно, и они какие-то результаты показывают, но насколько это прямо сейчас внедрено – не знаю, и здесь вопрос такой коммерческо-финансовый, это очень-очень дорого.
А. Старостин
― Тут надо еще прокомментировать, что не все понимают, с чем связан последний бум этих нейросетей, а он на самом деле пошел с 2007 года приблизительно, когда вдруг поняли, что считать, обсчитывать нейронные сети можно эффективно, как это ни странно, на видеокартах. Потому что в видеокартах, которые для компьютерных игр изначально использовались, там математика заранее аппаратная зашита, и в этот момент алгоритмы, которые многие были придуманы еще в конце 80-х – в начале 90-х, они заново актуализировались, потому что стало понятно, что это можно делать. И с того момента крупнейшие компании, например, компания NVIDIA, они поняли, что в эту сторону надо двигаться. И сейчас железо, оно тоже каждый день улучшается, выходят новые версии этих видеокарт, и там своя гонка вооружений происходит, поэтому предсказать, какие вычислительные мощности у нас будут, там, через год, через два, мне, например, трудно, я тоже в этой области не совсем специалист. Но то, что в это вкладываются большие очень деньги, и вычислительные мощности ориентированы на задачи обсчета нейронных сетей, эти вычислительные мощности все время растут, это, наверное, можно констатировать. Поэтому, возможно, уже через несколько лет какие-то такие вещи, которые сейчас кажутся все-таки еще лабораторными, уже станут выходить. Ну, вот пример с Prisma, которая недавно вышла, и многие ее скачали, посмотрели.
А. Плющев
― Для тех, кто вдруг пропустил, это программа-приложение, которая позволяет обрабатывать фотографии в стиле разных художников, там, в разных стилях.
А. Старостин
― Почему этот пример является таким важным звоночком? Потому что люди, изначально не имевшие отношения к нейронным сетям, они просто придумали приложение, и я точно знаю, что, грубо говоря, обычные программисты, обычные люди, которые просто решили сделать некоторое популярное приложение на App Store, они смогли организовать такую инфраструктуру, которая запускает вот эти нейронные алгоритмы регулярно на каждого пользователя, а пользователей миллионы возникли. И это стало возможным. Вот еще 2 года назад такое приложение просто нельзя было сделать, потому что было непонятно, какую надо инфраструктуру организовать, чтобы это происходило и держало такой поток пользователей. А сейчас вот люди уже взяли и смогли. И это так будет происходить теперь все время. Чем дальше мы будем двигаться, тем больше мы будем видеть случаев использования нейронных алгоритмов прямо в продакшне, то есть, в живых приложениях.
А. Плющев
― Это вы слышали Анатолия Старостина, руководителя группы исследования технологий извлечения информации ABBYY. У меня потом отдельным будет вопросом, почему у тех, кто занимается искусственным интеллектом, такие названия должности у всех. Александр Крайнов, который подтверждает эту закономерность, руководитель службы компьютерного зрения и технологий машинного интеллекта Яндекса.
Мы сейчас прервемся на пару минут, а вы можете отсылать свои вопросы +7-985-970-45-45, Твиттер аккаунт @vyzvon или веб-форма на нашем сайте. Есть уже несколько довольно интересных вопросов, присоединяйтесь к ним, присоединяйтесь к нам, поговорим, обсудим. Через 2 минуты.
РЕКЛАМА
А. Плющев
― Мы продолжаем программу «Точка», здесь представители Яндекса и ABBYY, я только что их называл, поэтому как-нибудь еще раз назову чуть позже.
Мы разговариваем об искусственном интеллекте, что умеет искусственный интеллект сегодня, чего от него ждать завтра. И ваши вопросы, если вам что-то непонятно об искусственном интеллекте, о нейронных сетях, задавайте сейчас, потому что осталось буквально 20 минут, пока Анатолий Старостин и Александр Крайнов у нас побудут и могут ответить на все эти вопросы. Пока еще у нас полно вопросов.
С. Оселедько
― Да, мы остановились на распознавании речи. Может, продолжим эту тему. Так что с распознаванием речи?
А. Крайнов
― В распознавании речи сейчас достигнут огромный прогресс, с компьютером, наконец, стало можно разговаривать, можно ему диктовать какие-то тексты, которые он будет записывать. Совсем хорошо распознавание речи работает в случаях, если понятная и достаточно узкая зона, в которой нужно распознавать – в навигаторах, например, уже многим стало привычно. Я не знаю, замечали или нет, я замечал, что вообще все таксисты стали вводить запрос голосом.
А. Плющев
― Рублиншлейна, да.
А. Крайнов
― Да. Кстати, распознает. Ради интереса после этого клипа попробовали, как мы только ни пытались назвать улицу – распознает всегда.
С. Оселедько
― Телефонный разговор хорошо уже распознается? Там специфичное все-таки качество звука.
А. Плющев
― Да, распознает, это правда, Сережа не зря сказал об этом. Потому что распознает, потому что у него ограниченная вариабельность, да, как у вас это называется, ограниченное число вариантов. Он думает, что вы ищете, и Рублинштейна – он, понятное дело, найдет Рубинштейна. А вот когда телефонный разговор, он не знает, искусственный интеллект не очень знает, о чем вы.
С. Оселедько
― Тут недавно была информация о том, что чуть ли не миллион человек автоматически, ну, суды выдали более миллиона разрешений на прослушку граждан, соответственно, понятно, что просто нет такого количества сотрудников спецслужб, чтобы это воспринимать как бы человеческим мозгом. Соответственно, напрашивается, можно ли это распознавать с помощью нейронных сетей, и уже как бы на базе этого выделять, преобразовывать в текст, выделять какой-то смысл оттуда и так далее?
А. Крайнов
― Здесь две большие задачи. Одна задача – распознать речь. Что такое распознать речь? Это перевести голос в текст. Эта задача решается, и решается успешно. Не только для областей, где нам заранее известен набор слов, там просто работает чуть лучше, там ошибка меньше, но и для произвольного разговора, для произвольной речи тоже. То есть, можно успешно перевести речь в текст. А дальше начинается следующая задача. Сам текст сам по себе не очень интересен, интересно, о чем там шла речь. Интересен смысл. И дальше начинается задача по переводу текста в некий смысл, а вот она уже несравнимо, несопоставимо сложнее.
А. Старостин
― Про эту задачу много могу я рассказать.
А. Плющев
― Давайте. Ну, ABBYY – понятное дело.
А. Старостин
― Да. Начинали мы тоже с распознавания текста просто из картинки вот именно в тот же самый текст, это еще одна задача оптического распознавания и здесь у ABBYY все очень сейчас хорошо, и всегда было хорошо. И были всегда на передовой, и есть ABBYY FineReader, я думаю, что многие, и в том числе наши слушатели, им наверняка пользовались. Но когда мы уже имеем дело с распознанным текстом, неважно, откуда он пришел, из распознавания звука или из распознавания изображений, как правильно Александр сказал, там огромное пространство возможностей, потому что никакого универсального языка смысла, как бы универсального языка, моделирующего произвольный фрагмент реального мира, его не существует. Его очень трудно придумать, и на самом деле не факт, что вообще возможно. Там начинаются философские проблемы, что чуть ли не у каждого человека в голове своя немножко так называемая антология.
Вот в компании ABBYY мы к этому как бы начали идти, и в рамках этого движения была создана технология ABBYY Compreno, которая понимает текст достаточно глубоко, то есть, гораздо глубже, чем другие методы обработки текста на естественном языке. То есть, это уже, вообще про это можно рассказывать долго, я даже не знаю, как сейчас уложиться во время, я попробую сейчас обозначить основные моменты, основные проблемы, которые возникают…
А. Плющев
― Про это довольно подробно Давид Ян у нас рассказывал в интервью нашей программе. Так что можно просто напомнить о нем и отослать к расшифровке.
А. Старостин
― Анализ текста – это такой как бы многослойный процесс, сначала мы должны просто подробить текст на какие-то понятные кусочки, слова, цифры и так далее, это называется токенизация, дальше мы должны произвести морфологический анализ, то есть, понять, какие слова, найти исходные формы слов и понять грамматические характеристики. После этого мы должны начать связывать слова между собой, то есть, мы должны производить так называемый синтаксический анализ. И только после этого, строго говоря, параллельно со всем тем, что я сказал, мы приходим к семантике, к тому, что за текстом находится.
Кроме того, мы должны по дороге решать разные задачи, связанные с кореференцией, то есть, мы должны понимать, что эти элементы текста относятся к одному и тому же объекту, как, например, если в тексте много раз упоминается одна и та же фамилия, надо понимать, что это один и тот же человек. Это самый простой случай. А если там местоимение – он, его, своего – надо находить так называемых антецедентов этих местоимений, это еще более сложная задача и так далее. В общем, если коротко говорить, то сам процесс анализа текстов – это многослойный процесс, в рамках которого решается очень много задач…
С. Оселедько
― … шире проблема, сейчас уже насколько хорошо мы можем понимать смысл текста?
А. Старостин
― Эта проблема до конца, конечно, не решена еще, то есть, потому что, я говорю, там за кадром как бы бесконечность именно в области антологической, в области моделирования реального мира. Но если не брать на себя задачу смоделировать всю эту бесконечность, а говорить: давайте ограничимся некоторой предметной областью, например, будем читать тексты про бизнес или политику. Или будем читать тексты про медицину, или еще про что-то. Вот в этот момент довольно часто возникают ограниченные модели, которые хотя бы можно себе представить и понятно, как построить, и тексты на заданные темы таким образом можно анализировать довольно качественно, извлекать из них действительно ценную информацию. И мы в компании ABBYY все это делать умеем, более того, у нас есть, с помощью ABBYY Compreno мы создали такую как бы фабрику так называемых инфо-экстракторов, и весь процесс идет следующим образом: условный заказчик, он может из разных мест прийти, говорит: у меня такие тексты, они вот про это, и мне надо извлекать из текстов вот это. И мы рисуем вот эту схему того, что надо извлекать из текстов, это называется антологии, и после этого мы учим нашу Compreno извлекать из его текстов такую информацию.
И это сейчас уже работает, и, кстати говоря, возвращаясь к теме машинного обучения, конечно, хорошо это работает с использованием машинного обучения, и программировать руками все это довольно кропотливая задача, поэтому мы в данный момент уже используем и ручное программирование, и машинное обучение, все в комбинации.
С. Оселедько
― У нас не так много времени остается. Хотелось бы подойти к вопросу, а что нас ждет впереди. Вот интересный вопрос Рамиля из Уфы: «А вы сами-то, уважаемые интервьюеры, видя, какими шагами развивается ваша индустрия, не боитесь, что очень скоро компьютер будет вершить наши судьбы?»
А. Плющев
― Видимо, интервьюируемые. Мы-то только боимся, что нас заменит говорящая машинка, больше ничего мы с Оселедько не боимся.
А. Крайнов
― Не боюсь по двум причинам. Первая – что мне бояться, это меня кормит, мой хлеб. А вторая причина заключается в следующем. Всегда интересно сравнить, кто сильнее, человек или машина, такие вот возможности потенциальные. В случае искусственного интеллекта или, уточнив, в случае нейронной сети, такой параметр, по которому пускай приблизительно, но все-таки можно сравнить потенциальную мощность, это количество нейронных связей, связей между нейронами в системе.
С. Оселедько
― А правда, что в мозгу у человека их больше, чем атомов во вселенной? Связей.
А. Крайнов
― Я не знаю, сколько атомов во вселенной, но вот сейчас я назову цифры. У современной такой продвинутой, большой, глубокой, как говорят, искусственной нейронной сети их порядка 10 миллионов. У человека – я долго искал эту информацию, она несколько разрозненная, но в основном все сходятся к тому – точной оценки никто не знает, она очень приблизительная, но порядок можно оценить – это 800 триллионов. У меня не хватает моей разрешающей способности, для того чтобы как бы одновременно увидеть эти две цифры, они очень разные, но если провести сравнение, если сравнивать диаметры, то если диаметр Земли – это интеллект человека, то тогда интеллект искусственной сети – это диаметр баскетбольного мячика. Поэтому отвечаю на этот вопрос – нет, пока не страшно. Пока мы имеем дело с интеллектом, который способен периодически имитировать интеллект мощный довольно убедительно, если говорить о каких-то таких пиар-акциях, пиар-задачах, а если говорить о практических задачах, то он способен решать все-таки довольно механистические задачи, которые может решать любой человек после относительно недолгого обучения, человек отличается способностью не уставать и не увеличивать ошибку свою со временем.
А. Старостин
― И в этом смысле я хочу сказать, что, может быть, когда говорят о вершении судеб человечества, весь вопрос, что понимают под этим. То, что искусственный интеллект будет сильно влиять на общую судьбу человечества в ближайшее время, наверное, надо все-таки констатировать, что да, просто это не будет порабощение или какие-то страшные вот эти вещи.
С. Оселедько
― А может быть массовая безработица, например?
А. Старостин
― Не знаю, может быть, конечно, но с другой стороны, если людям не нужно будет делать одну работу, начнут делать другую. Мне кажется, что не надо этого так бояться. То есть, да, безусловно, во многих сферах, где есть какие-то простые задачи, которые еще несколько лет назад нельзя было автоматизировать, их уже автоматизировать будет можно. И людям придется перестраиваться.
А. Плющев
― Чего, возможно, боятся люди. Потому что даже здесь Дмитрий Гришин из Мейл.ру выступил с такой программной статьей, можно сказать, «пять идей об интернете будущего», и на это откликнулся один из отцов-основателей интернета Антон Носик, которому не понравилось среди прочего то, что интернет, как он понял Гришина, будет контролировать, что пользователю следует есть, что пить, когда ему позаниматься спортом или записаться к врачу. Ну, потому что он анализирует все, и здоровье, и состояние, и время суток, и окружающую среду, и видит, что человек собирается есть, чем собирается позаниматься и так далее. И вот, надо сказать, это такое довольно неприятное будущее-то, когда мне, вроде бы из хороших соображений, из лучших соображений, но постоянно будут так или иначе мне рассказывать, что мне делать, как есть и так далее.
И еще одна история. Это история выдачи. Тот же Гришин сказал, что уже сейчас мы – и это не секрет, не он придумал – уже сейчас мы видим разный интернет, то, что по-разному настраивается веб под нас, а будет все больше и больше. Каждый будет видеть вообще разный интернет, на него исключительно ориентироваться. Вот чего боятся люди, двух этих обстоятельств, мне кажется.
А. Старостин
― Мне кажется, первого обстоятельства бояться не стоит, потому что все-таки всегда у людей будет возможность не использовать – ну, не хочешь ты, чтобы тебе давление меряли, ну, отключаешься и, я не знаю, можно представить себе какие-то страшные сценарии тоталитаризма, когда всех будут заставлять обязательно ходить в этих вещах, ну, как бы это немножко уже не про искусственный интеллект, а про другое. А в целом, ну, что, есть некая технология, которая помогает – я был бы не против, если бы мне что-то такое подсказывали. А другой против – ну, он отключит. А вот с выдачей сложнее.
А. Крайнов
― Я вначале про вещи добавлю, есть же сейчас уже фитнес-браслеты, что-то я не слышал, чтобы люди с ними воевали и выкидывали. И есть навигаторы, которые рассказывают, куда ехать, и я знаю целую категорию людей, которые ставят навигатор не для того, чтобы ехать куда он ведет, а для того чтобы поругаться с ним и получить от этого удовольствие. Люди, которые бы страдали от того, что вообще в природе существуют навигаторы – ну, кажется, нет, не нравится – выключи. Что касается поисковой выдачи, такая ситуация была всегда, и хотя бы потому, что…
А. Плющев
― Да не только поисковая. Просто открываешь ты веб – у одного человека одни ему ссылочки подтягиваются и одно содержание страницы, а другому другое. Потому что он знает, что это женщина 35-ти лет, а та – бабушка, а тот младенец.
А. Крайнов
― Вы считаете, что это плохо?
А. Плющев
― Ну, я считаю, что это для вас, может быть, хорошо, особенно для Яндекса. А мне кажется, что это может быть и не очень-то здорово. То есть, какие-то вещи от меня же прячут, понимаете, в чем дело. А какие-то навязывают.
С. Оселедько
― Да, контекстная реклама отлично работает.
А. Плющев
― … ну, контекстная реклама, это у нас в каждой передаче с тобой возникает…
С. Оселедько
― У меня коллега лайфхак предложил, он всякий раз, когда его начинает задалбливать контекстная реклама, он заходит ищет красивое женское белье, и после этого какое-то время наслаждается выдачей.
А. Плющев
― Кому что нравится, конечно. Извините.
А. Крайнов
― Здесь же ситуация какая? Поисковая система отвечает пользователю десятью ссылками, вот ответ пользователю – это 10 ссылок. Если пользователь не увидел ответ на свой вопрос, он уходит. Это хорошо видно, это хорошо заметно, людей, которые переходят на следующую страницу выдачи, очень не много. И человек способен, часто задает запрос такой однозначный типа «пицца». И на этот вопрос прямо сейчас ему нужно дать абсолютно релевантный для него, то есть, точный для него ответ, который он ожидает. Или почитать сериал. Вопросы могут быть такие: человеку нужно отвечать сразу и однозначно. Если в десяти ответах не было нужного ему, значит поисковая система не справилась с задачей.
И, конечно, нужно учитывать, кто этот человек, какого он возраста, откуда пришел, для того чтобы в первые результаты положить правильный ответ. В чем сложность любой поисковой системы? Ее элементарно поменять. Номер телефона поменять сложно. Модель телефона поменять сложно, сложно поменять автомобиль, почтовую систему, а поисковую систему – одним кликом. Не понравилось – ушел к другому. Может быть, будет у него. Поэтому нужно, конечно, учиться давать ответ максимально точный, нужный человеку. Это не способ спрятать информацию, это скорее способ найти информацию из бесконечного множества страниц в интернете, которых, поверьте…
С. Оселедько
― У вас тоже нейронные сети уже в алгоритмах?
А. Крайнов
― Там тоже нейронная сеть.
С. Оселедько
― Вы сами-то уже понимаете, как она работает? Или она уже чему-то сама научилась и живет своей жизнью?
А. Крайнов
― Нет, мы, конечно, прекрасно понимаем, как она работает, и относительно недавно в Яндексе стали активно внедряться именно в поиске текста, в том числе, в картинках это существует довольно давно, а в текстовом поиске стали появляться нейронные сети, для того чтобы определить близость релевантной страницы запроса пользовательского. Ведь дело в том, что, как работает обычный поиск, когда ищем те слова, которые были в запросе? Следующий этап, когда этого недостаточно, попробуем применить в запросы все возможные расширения, перевести на разные языки, исправить опечатки, найти синонимы, такие более-менее механические правила, и дальше найти все слова в интернете с учетом вот этих дополнений и расширений. Но существенно более интересная задача, и она работает, и она дает свой вклад в качество поиска, это напрямую с помощью обученной нейронной сети сопоставить потенциальный результат поиска и запрос, найти общее между страницей, между текстом страницы ищем и запросом не по набору символов, не по содержимому слов, а по смыслу. И вот это делается…
С. Оселедько
― У нас буквально 2 минуты осталось. Скажите, что такого самого прекрасного случится в ближайшие 5-10 лет с точки зрения искусственного интеллекта? Что он нам даст, какое новое качество он нам даст?
А. Крайнов
― Я выберу две такие вещи, которые нам стоит ожидать. Первая – это такая прекрасная вещь, как беспилотные автомобили, которые ездят без людей. И за этим стоит очень много. Возможно, совсем изменится ситуация на дорогах, она станет другой, это довольно сильно способно поменять наше поведение.
И вторая мощнейшая вещь – это диалоговые системы и общение человека с машиной. Общение голосовое – Siri, Google Assistant, Cortana, Amazon's Alexa – сейчас такого очень много, любая серьезная компания, и Яндекс в том числе, конечно, делает такие продукты. Но дело даже не в том, кто их сделает, а дело в том, как это войдет в нашу жизнь. Это будет у всех, это будет в каждом домохозяйстве, это будет в каждом телефоне. Мы наконец станем общаться с машиной голосом и вести с ней нормальный человеческий диалог.
А. Плющев
― Наконец-то будет с кем поговорить.
С. Оселедько
― Те самые силиконовые домохозяйки-андроиды, про которых Василий спрашивал.
А. Старостин
― Я бы все-таки выразил некоторый скепсис именно по долгосрочности. Вы сказали – в ближайшие сколько лет?
А. Крайнов: 5
―10 лет.
А. Старостин
― Я совершенно не уверен, что через 10 лет мы будем вести с машиной диалог вот так, как мы разговариваем сейчас с вами. И это все-таки, мне кажется, это чуть более далекая перспектива. И все-таки главная проблема машинного обучения на сегодняшний день, а, соответственно, проблема искусственного интеллекта, это обучающие выборки, которые в области как раз диалоговых систем и всего остального собирать уже гораздо-гораздо сложнее, и с этим проблемы будут. Поэтому, конечно, в долгосрочной перспективе Александр прав. В конечном счете это будет. Просто у меня другие оценки по срокам.
А. Плющев
― Быстро время у нас закончилось, к сожалению, и на многие вопросы мы не успели ответить, это хороший повод еще как-нибудь собраться, я надеюсь, наши гости не откажутся составить нам с Сергеем Оселедько компанию.
Напомню, сегодня у нас были Анатолий Старостин, руководитель группы исследования технологий извлечения информации ABBYY и Александр Крайнов, руководитель службы компьютерного зрения и технологий машинного интеллекта Яндекса.
Большое спасибо, и счастливо, до свидания!
А. Старостин
― Спасибо, всего доброго.
А. Крайнов
― Пока.
|
|