05 Февраля 2020

Зачем Сбербанку 2,4 тыс. DS/AI-задач. Интервью с главой CDS Максимом Еременко

О том, во что лучше инвестировать в сфере AI, о трудностях и достижениях Сбербанка по AI-направлению и о том, как устроен новый Центр исследования данных Сбербанка (CDS), — в интервью старшего управляющего директора CDS Максима Еременко.

— На встрече с президентом РФ Владимиром Путиным в рамках международной конференции по искусственному интеллекту AI Journey Герман Греф говорил о важности национальной AI-стратегии. Она должна помочь России выйти в мировые лидеры в этой сфере. Где мы сейчас?

— На конференции AI Journey мы и ведущие технологические компании обсудили перспективы индустрии и вызовы, которые стоят перед нами. Среди важных направлений, в которые стоит вкладывать силы и средства — патенты. Например, за 2018 год в России были получены десятки патентов в области искусственного интеллекта (ИИ). А в США, Китае и Южной Корее такие патенты ежегодно регистрируются десятками тысяч.
Работа над инфраструктурой — вторая задача. Примерно 200 строчек из top-500 в рейтинге суперкомпьютеров занимают системы из Китая, еще 100 — из США, а 200 оставшихся — из стран, в числе которых Германия, Франция, Южная Корея, Япония, Великобритания и др. При этом Россия представлена там только тремя позициями (по информации на ноябрь 2019 года): Christofari от Сбербанка занимает 29-е место, Lomonosov-2 от МГУ — на 107-м месте и суперкомпьютер главного вычислительного центра Росгидромета — на 465-м. Если сравнить объемы инвестиций в развитие технологий ИИ в России и, скажем, в США и Китае, то наши цифры будут более чем скромными.

— Если мыслить категориями национальной AI-стратегии, то, во что сейчас следует инвестировать прежде всего?

— К слову, на AI Journey научный руководитель Swiss AI Lab IDSIA Юрген Шмидхубер сказал, что первый алгоритм обучения нейросетей был опубликован в работах советских ученых, а сам термин deep learning появился только в 1986 году. Но его развитию помешало отсутствие вычислительных мощностей. Развитие стало возможным только в начале 2000-х годов, когда массово стали появляться чипсеты с возможностью параллельного вычисления. На мой взгляд, мы можем оказаться в лидерах, если начнем инвестировать в это направление.
Решение кадрового вопроса тоже остается приоритетным. Мы сейчас нуждаемся в менеджерах и владельцах продуктов, которые понимают ценность использования ИИ в рабочих процессах и сервисах, способных собирать людей. Наука остается одним из важных пунктов для инвестиций. Наша академическая математическая школа — одна из лучших в мире. Но мы всё же отстаём от наших зарубежных коллег, у которых более высокие результаты в исследованиях и разработках.

— Что делает Сбербанк в рамках национальной стратегии?

— Сейчас разрабатывается федеральный проект по ИИ на основе уже принятой стратегии. За его реализацию отвечает Правительство РФ. Роль Сбербанка в этом процессе — центр компетенций, который вместе с компаниям альянса по искусственному интеллекту и профессиональным сообществом, может предложить государству меры по «прокачке» ключевых факторов развития и распространения технологий ИИ в России — например, кратный рост выпускаемых специалистов по ИИ, стимулирование научных исследований, повышение популярности российских библиотек и фреймворков для работы с технологиям ИИ, развитие облачной инфраструктуры, устранение регуляторных барьеров и совершенствование законодательства.

— Управление развития компетенций по исследованию данных появилось в Сбербанке три года назад. Как оно устроено?

— Офис CDS (Сбербанк Data Science) курирует бизнес-юниты, в которых заняты разработчики, владельцы и менеджеры продуктов на базе технологий ИИ. Мы регулируем коллаборации между работниками и внутренними командами, курируем работу платформ и лабораторий, работающих над банковскими продуктами. Общее число DS/AI-задач — примерно 2,4 тысячи. Из них 1 тыс. уже доведены до промышленной эксплуатации и активно применяются в бизнес-процессах банка. 1,4 тыс. — это бэклог, над которым сейчас работают команды в разных подразделениях банка. У нас трудятся D-people: data scientists, data-инженеры, R&D и UX/UI-разработчики. Мы также выступаем центром экспертизы и ведем разработку различных ИИ-решений и исследований внутри подразделений, оказываем услугу DS-as-a-service для других подразделений банка.

— CDS уже успел окупиться?

— Могу сказать, что да, хотя мы существенное количество времени и ресурсов инвестировали в необходимую инфраструктуру (ресурсы, обучение, методологию и пр.), data science является прибыльным для банка. Мы видим ощутимый финансовый эффект от ИИ-трансформации, которая началась несколько лет назад.

— Что считаете основной трудностью в 2019 году?

— Лучше назовем это зоной развития в уже наступившем году. В нашем случае — это более плавный и ускоренный переход от прототипа продукта к его промышленному тиражированию. Мы понимаем, что продукты на базе ИИ еще не стали обыденностью, уходит достаточно много времени на внутреннюю просветительскую работу, встраивание в существующие бизнес-процессы и интеграцию в бизнес-системы.

— А главное достижение 2019 года?

— Для индустрии в стране — утверждение Национальной стратегии развития ИИ, формирование Альянса по развитию ИИ из числа компаний – технологических лидеров России. Для Сбербанка – это переход в активную фазу программы AI трансформации, предполагающей масштабное создание продуктов для бизнеса с использованием технологий ИИ, развитие соответствующих платформ для работы с ИИ, и конечно же, запуск суперкомпьютера Сhristofari (назван в честь первого клиента Сбербанка Николая Кристофари). Его спроектировали для решения прикладной задачи — обучения моделей с использованием искусственного интеллекта. На момент анонса в ноябре 2019 года Сhristofari стал первым по мощности суперкомпьютером в России, 7-м — в Европе и 29-м — в мире.
Работа над развитием платформ также остается приоритетной. В 2018 г. у нас было всего два консолидированных платформенных ИИ-решения: NLP-платформа и платформа для распознавания речи. В начале 2020 г. мы эксплуатируем уже 8 платформ. Существенно продвинулись в части продвижения в промышленную эксплуатацию единых ИИ-платформ, на базе которых будут выстраиваться решения для банка, экосистемы и внешних клиентов.
У нас есть результаты и в работе с научным сообществом. Например, команда проекта iPavlov (инвестором проекта выступают Сбербанк и государство) во главе с Михаилом Бурцевым, заведующим лабораторией нейронных систем и глубокого обучения, в 2019 году успешно вошла в top-10 финалистов конкурса Alexa Prize Socialbot Grand Challenge 3.

— Общие планы на 2020 год?

— Будем развивать две модели облачных сервисов. Также продолжаем развивать инфраструктуру, инструменты и людей, в том числе, мы переходим в Cloud. Мы активно работаем над энейблерами, и часть наших наработок делаем доступными для пользователя. Разработка и внедрение индекса AI-maturity — ещё одна задача на 2020 г. В этом вопросе мы руководствуемся лучшими примерами из национальных стратегий по ИИ, которые были приняты в других странах.

— На каких AI-разработках планируете сделать акцент в 2020 году?

— В этом году мы планируем внедрять ИИ в наиболее важные процессы для банка: персонализация обслуживания клиентов, формирование индивидуальных предложений по новым продуктами и использование ИИ в продуктах и сервисах экосистемы Сбербанка. Мы будем использовать ИИ в процессах, в которых клиентский опыт изменится за счет сокращения времени и повышения качества на всех этапах. Мы планируем, что со временем число и доля моделей, связанных с NLP, SA, CV будет увеличиваться, поскольку эти технологии будут активно внедряться в бизнес-процессы банка.

Источник: www.futurebanking.ru