Может быть пора поворачивать? Интервью с президентом Cognitive Technologies Ольгой Усковой

Может быть пора поворачивать?  Интервью с президентом Cognitive Technologies Ольгой Усковой
Разработчик компьютерного зрения рассказал нам о перспективах беспилотного вождения.

Многие компании сегодня ринулись в сферу высоких технологий, и каждая объявляет себя лидером. Однако ничего, кроме новостей об очередной аварии с Tesla или Uber, пока не слышно. В России этой темой занимаются «КАМАЗ», «НАМИ», «Яндекс», и даже студенты Бауманки. Если так пойдёт, то скоро в магазинах автозапчастей появится «Набор для беспилотного вождения». При этом до сих пор непонятно, что именно называется беспилотником. К примеру, луноход или, скажем, радиотанк времён советско-финской войны беспилотники?

Решения для беспилотного транспорта, которые создаются сегодня, никак не связаны со сталинскими радиотанками или луноходом. Это были несистемные поделки. У нас перед офисом стоит памятник Ленину. Так вот, Владимир Ильич говорил, что революция происходит тогда, когда случается глобальное изменение средств производства. Сейчас на наших глазах происходит очередная революция, и не в отдельно взятой стране, а во всём мире. Человека убирают из технологического процесса. Искусственный интеллект заменяет его в рутинных операциях. И когда мы говорим о беспилотниках, то подразумеваем искусственный интеллект, который лучше, чем человек (и это главное!), решает задачу перемещения из точки А в точку B. И здесь существуют всего два уровня качества, как с осетриной, – либо 0 %, либо 100 %.

Что вы имеете в виду?  

Если ты заявляешь, что твоя система технического зрения распознаёт объекты на дороге с точностью 95 %, то это значит, её просто нет, потому что пять процентов – это потенциальные аварии и жертвы. Такую систему нельзя выпускать на улицу.

Понятно, но что Вы скажете о количестве игроков в этой сфере? Почему их так много, а результаты пока мало впечатляют?  

Есть тема промышленных систем и тема развлекательных аттракционов для публики. Так вот, некоторые компании занимаются аттракционами. Это тоже важно, чтобы привлечь внимание к новой технологии. Для замены гужевого транспорта на автомобили потребовалось двадцать лет. Люди не были готовы садиться в чёртову коляску. Поэтому любой аттракцион с машиной, на борту которой написано «Беспилотник», полезен. Это создаёт среду доверия, но к реальной промышленной истории отношения не имеет. Серьёзный проект должен быть экономически оправдан, ведь стоимость автомобилей не может расти бесконечно. Например, «аттракционы» часто используют для обнаружения объектов сразу несколько лидаров – лазерных излучателей, стоимость которых выходит за пределы разумного...

Да, но они выражают надежду, что производство лидаров станет дешевле.

Но ведь это фикция. Об этом много лет говорят и сами производители лидаров. Хотя, даже если бы это было так, есть другие проблемы: уровень точности распознавания дорожной сцены, надёжность устройств. Мы разрабатываем систему компьютерного зрения, которая строится на нейронных сетях глубокого обучения, работает в любую погоду, и наша технология значительно превосходит человеческие возможности. Никто из «аттракционов» ничего подобного не показал. Те же лидары деградируют в условиях дождя, снега или тумана. Они состоят из механических компонентов, которые ненадёжны и ломаются. А мы уже ставим свои «мозги» на промышленные трамваи, комбайны, автомобили. Единственный сдерживающий фактор – ограничение в применении с учётом существующего законодательства.

Чем ещё вы отличаетесь от «аттракционов»?

У нас есть готовый продукт, у него есть конкретная цена, и мы его уже продаем. Это комплект – «мозги» на плате, камера и радар. При запуске в серию от миллиона единиц он будет стоить несколько десятков долларов на автомобиль.

Что, кроме программного обеспечения, является вашей ключевой технологией?

Мы разработали собственный 4D-радар. С помощью радиоволн он определяет координаты объекта, его форму и скорость. Ему не мешают ни снег, ни дождь, ни грязь. Мы первые на рынке беспилотных автомобилей, кто сделал это серийно. Обычные радары различать форму и тип объектов не умеют. Они не способны отличить автомобиль от пешехода или приближающийся мост от фуры и не справляются с распознаванием наложенных друг на друга изображений, таких, например, как человек, стоящий у забора. Вот почему для получения необходимой информации о дорожной сцене многие компании вынуждены использовать дорогостоящие лидары.

Когда мы увидим всё это на конвейере?

Беспилотные комбайны уже работают. В конце августа мы показали реальные внедрения в Томской области. У нас есть действующий контракт с одним из крупнейших в России агрохолдингов «Русагро», парк техники которого насчитывает порядка 800 единиц. Если говорить об авторынке, то мы завершили контракт с Hyundai Mobis, работаем с целым рядом других автопроизводителей и Tier-компаний из Европы и Азии. Результаты можно будет увидеть в 2021–2022 годах. На ближайшие двадцать лет беспилотники стоят в планах абсолютно всех мировых автопроизводителей. Рынок огромен.  

Речь идёт о полноценных беспилотниках пятого уровня?  

Если кто-то заявляет, что у него 5-й уровень – это шарлатан. Сегодняшняя классификация такова, что с 0 по 2-й – это лишь подсказки системы в виде звуковых сигналов и активная помощь водителю. На 3-м уровне в определённых режимах возможна автономность. На 4-м – человек должен присутствовать, но руки на руле он держит не всегда. На 5-м – ликвидируется место водителя. Как вы понимаете, пятый уровень пока невозможен, потому что это уже совокупность технических, юридических и иных факторов, которые ещё должны быть соблюдены на всех дорогах мира. То есть речь идёт не только о блоке, который всё видит и понимает, но и об изменениях ПДД, законодательных регламентов, определяющих, кто виноват в ДТП и в каких случаях, межгосударственных соглашениях, страховом законодательстве. И эта часть самая сложная. Поэтому пока у разработчиков ориентир – 4-й уровень. Мы сейчас делаем интеллектуальные компоненты именно для него. Цикл внедрения довольно долгий – не менее пяти лет.

Робот безопаснее, надёжнее, быстрее, дешевле. И, кроме того, он не бывает пьяным. Какие проблемы, кроме безопасности на дорогах, может решить беспилотная революция?

При сегодняшнем безумном транспортном потоке есть две большие проблемы: пробки и парковка. Сюда же можно добавить хранение, ведь во многих городах оно сильно ограничено. И Москва – не самый страшный город в этом плане. Посмотрите на Лос-Анджелес! Экстенсивно этот узел уже не развязать. Только изъяв водителя из-за руля, можно как-то решить проблему. Почему образуются пробки? В том числе и из-за нарушения правил. Как только появляется один человек, который ездит «по своим понятиям», он сбивает структуру движения. А беспилотник всегда следует ПДД. Когда все едут по правилам, поток становится равномерным и поступательным. Американцы считают, что автономное движение сократит пробки на 40 %.

 В чём преимущество ваших программистов?

Сегодня российская школа искусственного интеллекта – одна из самых сильных в мире. Так же, как и в ядерной физике. Она зарождалась в Советском Союзе в начале 1960-х. Мы собрали лучшее, что было в лабораториях Института системного анализа РАН и Института проблем управления. Оттуда были и первые руководители наших R&D-центров, участники проектов мирового уровня. Это фундаментальная наука, школа, которую невозможно создать за одно поколение. Россия – для нас идеальный плацдарм с точки зрения разработок и кадров.

А у конкурентов, как я понимаю, в основном индийские программисты?

Совершенно верно, у наших конкурентов 80 % штата – индийские программисты. Я люблю индусов, но у них совсем другая культура, и другая математика. Они большей частью занимаются кодированием, и им не всегда под силу прорывные, творческие задачи. Наиболее сильная конкуренция идёт из Израиля.

Чем ещё отличаются российские кадры?

Недавно мы делали показательную уборку пшеницы в Томской области на беспилотных комбайнах. Приехало более 40 международных изданий плюс потенциальные клиенты из Бразилии и США. Были губернатор и полпред президента. И вдруг, за неделю до презентации, полил дождь. Комбайну запрещено работать в таких условиях – зерновые намотаются на жатку. В результате наши планы по обучению нейронки на этом поле (а мы как раз хотели потратить на это неделю) сорвались. Солнце выглянуло только за 20 часов до показа. И наша команда всё успела!

Каков средний возраст ваших разработчиков?

Примерно 25 лет, поэтому у них нет комплексов. Они смеются, говорят, сегодня превращают объекты в мыслящие субъекты, моделируют искусственную интуицию, а завтра совесть им запрограммируем. Для них это игра, драйв, желание самореализоваться. Вот почему Cognitive Technologies смогла создать такую систему компьютерного зрения, которая позволяет с одной видеокамерой достичь тех же результатов, что и ведущие западные бренды с тремя-четырьмя сенсорами.

Непростые условия российских дорог, на которых вы обучали искусственный интеллект, сильно затрудняли работу?

Наоборот, это помогло. Мы развивали нейронные сети в более сложных условиях, чем наши калифорнийские коллеги. Езда по дорогам Набережных Челнов в ноябре-декабре и езда по Сан-Франциско – две большие разницы. Требовалась очень сложная математика для безопасной работы на заснеженных дорогах, направлениях без разметки, ямах. Мы делали это семь лет – с 2012 года. В итоге оказалось, что зима – не чисто российская проблема, и дороги в мире неидеальные. Везде есть колдобины, трещины и проблемы с разметкой. Работали много, но зато по силе алгоритмов мы теперь далеко впереди.

Ну хоть в чём-то вы отстаёте?

Мы отстаём в микроэлектронике. Нам не хватает современных высокопроизводительных вычислителей. Их можно купить только за границей. Хотя даже если просто производить «мозг» для беспилотников – всего лишь один узел – и продавать на мировом рынке, объёмы которого уже сейчас десятки миллиардов долларов, а через 10–15 лет будут триллионными, этого будет достаточно, чтобы быть в лидерах отрасли. Чипы без софта никому не нужны.

Вы занимались темой бездорожья?

Да, есть такая тема, как вахтенное обслуживание трубопроводов на Севере. Человеку там тяжело, да и опасно. Лучше пустить беспилотный вездеход. Но, поверьте, это гораздо легче, чем делать автомобиль для дорог общего пользования.

Как происходит машинное обучение?

Система развивается почти так же, как наш мозг. Когда человек рождается, он видит вокруг себя мир и начинает выделять какие-то предметы. Его родители дают этим предметам названия. Предметы группируются в классы, и в какой-то момент человек понимает, что вокруг него происходит: это стол, это стул, а это чашка. Предметы обрастают смыслами. У него возникает представление о сцене и связи происходящего: на стуле сидят, из чашки пьют, и она может разбиться. Это до двух лет. Дальше, с 2 до 5, из этих смыслов он как бы вынимает собственное я. То есть воспринимает себя как отдельный смысл. Так развивается человек, и так же развивается искусственный интеллект. Вы понимаете, что, как только он начнёт осознавать себя как отдельную сущность и самостоятельно принимать решения, среди этих решений может быть всё, что угодно.

Ну не пугайте!

Как-то на полигоне мы отключили все системы, кроме распознавания разметки. Территория была огорожена, однако какой-то водитель выскочил со своей тарантайкой прямо в бок нашему автомобилю. Мы, как в кино, замерли в ожидании катастрофы. Но беспилотник ушёл на обочину, объехал препятствие и сам избежал аварии. Понимаете, что это значит? А теперь представьте, что будет, когда это станет обыденностью...

Текст Дмитрий Леонтьев