Искусственный интеллект активно внедряется в различные сферы жизни, превращая технологии будущего в реальность. В Узбекистане ключевую роль в этом процессе играет Единый Интегратор UZINFOCOM. Компания реализует передовые проекты с использованием ИИ, такие как биометрическая идентификация и голосовые помощники, адаптируя их к местным условиям. В беседе с Рустамом Алавутдиновым, начальником отдела департамента ИИ, мы обсудили, как UZINFOCOM внедряет эти инновации, сотрудничая с такими мировыми лидерами, как iFLYTEK и BYD и каким образом они способствуют технологическому развитию Узбекистана.
FinTech&Retail CA: Какие проекты с использованием искусственного интеллекта сейчас реализует UZINFOCOM?
Рустам Алавутдинов: в настоящее время в UZINFOCOM разрабатываем несколько проектов. Среди них: биометрическая система идентификации MyID, которая предназначена для удаленной идентификации клиентов в банковском и финансовом секторах, а также в государственных услугах и электронной коммерции. Благодаря MyID пользователи могут получать доступ к сервисам дистанционно, что существенно упрощает процесс взаимодействия с различными учреждениями. Внедрение этой технологии позволяет гарантировать точную и комфортную идентификацию граждан, переводя все услуги обслуживающих организаций в цифровой формат. На сегодняшний день, более 150 проектов пользуются нашим сервисом. Среди них – 28 банков, 16 платежных систем и другие. А количество успешных идентификаций перевалило за 60 млн. Ожидается, что количество пользователей до конца года превысит 12 млн.
Также мы работаем над системой голосового помощника Muxlisa AI, которая способна преобразовывать речь в текст (STT) и текст в речь (TTS) на узбекском языке. На базе этой технологии мы уже запустили чат-бот с функциями обработки и понимания естественного языка (NLP, NLU). Это позволяет существенно улучшить взаимодействие с пользователями на узбекском языке и автоматизировать многие процессы.
TTS внедрена более чем на 10 веб-сайтах, включая правительственный портал Республики Узбекистан, Министерство цифровых технологий и другие. Также в настоящее время реализуется проект интеграции функционала голосового управления (STT, TTS, NLU) без доступа к интернету в ИТ-инфраструктуру автомобилей китайского вендора BYD.
Наша команда работает над выводом следующих продуктов в промышленный запуск:
- Генератор субтитров;
- Стенограф;
- ASR c поддержкой диаризации.
Полноценный запуск продуктов Muxlisa AI однозначно должен привести к улучшению взаимодействия пользователей цифровых сервисов.
Еще одним важным проектом является система биометрической идентификации по рисунку вен на ладони — Palm Pay. Мы планируем внедрить эту технологию в Ташкентском метрополитене в ближайшие пару месяцев, что обеспечит удобный и безопасный способ оплаты проезда, а также повысит уровень безопасности пассажиров.
Хотелось бы отметить, что в июле этого года наша команда посещала ОАЭ с целью презентации продукта Palm Pay руководству Управления дорог и транспорта Дубая для внедрения его в метрополитене. В настоящее время ведутся переговоры по реализации проекта на базе Palm Pay.
FinTech&Retail CA: С какими основными препятствиями вы сталкиваетесь при внедрении технологий ИИ в Узбекистане?
Рустам Алавутдинов: В первую очередь, это нехватка датасетов и необходимость их сбора в больших количествах, а также проверка качества этих датасетов.
Для справки: Dataset — это структурированная информация, представленная в виде таблицы. В такой таблице строки называются объектами, а столбцы — признаками. Именно такие размеченные данные используются для машинного обучения.
Данные могут быть разными. Например, если вы хотите добавить голосовой поиск в свое приложение, нужно обучить нейросеть на большом наборе данных с транскрипцией речи. Чем больше и разнообразнее примеров, тем лучше ИИ будет понимать запросы. Каждый пример — это фрагмент аудиозаписи с указанием отмеченных частей и их расшифровкой, поясняющей, о чем идет речь.
FinTech&Retail CA: Как вы решаете задачи адаптации ИИ к локальным условиям и потребностям?
Рустам Алавутдинов: Мы сосредоточены на разработке решений в области компьютерного зрения и обработки естественного языка. Благодаря нашим специализированным командам мы хорошо понимаем потребности клиентов и стараемся максимально соответствовать их высоким требованиям и ожиданиям.
FinTech&Retail CA: Расскажите о вашем сотрудничестве с международными компаниями и организациями в области ИИ. В частности, какую роль играет партнерство с BYD и iFLYTEK?
Рустам Алавутдинов: iFLYTEK является нашим ключевым партнером и эксклюзивным поставщиком ИИ-решений для BYD. В конце 2023 года мы разработали и передали ПО для голосового управления автомобилями на узбекском языке, которое работает при подключении к интернету. После этого iFLYTEK обратился к нам с запросом на создание аналогичного ПО, но уже без необходимости подключения к интернету. На эту задачу команда потратила более шести месяцев активной работы. В настоящее время мы завершаем небольшие доработки и с нетерпением ждем, когда наше программное обеспечение будет использоваться в автомобилях BYD.
Новости Финтеха, ритейла и e-commerce в Центральной Азии