В Таджикистане запущен первый национальный ИИ, понимающий диалекты таджикского языка

В Таджикистане запущен первый национальный ИИ, понимающий диалекты таджикского языка

Таджикистан представил первую в истории страны языковую модель искусственного интеллекта, способную обрабатывать таджикский язык с учётом его лингвистических особенностей. Разработкой модели под названием SoroLLM занималась команда специалистов из компании zehnlab. ai.

Уникальность SoroLLM заключается в её способности не только анализировать таджикский язык, но и распознавать его многочисленные диалектные формы — от северных наречий до памирских вариантов. По словам разработчиков, акцент сделан на точную передачу особенностей синтаксиса, редкой лексики и региональных различий произношения.

Проект был официально представлен 25 июня в рамках открытия первого в республике Центра вычислительных мощностей для работы с ИИ. В мероприятии принял участие президент Эмомали Рахмон.

Инициатива стала значимым шагом в цифровом развитии страны, особенно с учётом того, что таджикский язык до этого практически отсутствовал в известных языковых моделях, таких как GPT или LLaMA.

Следующим этапом в развитии SoroLLM станет внедрение мультимодальных возможностей — искусственный интеллект научат работать с голосом и видео, расширяя границы его применения за пределы текстовой информации.