Таджикистан представил первую в истории страны языковую модель искусственного интеллекта, способную обрабатывать таджикский язык с учётом его лингвистических особенностей. Разработкой модели под названием SoroLLM занималась команда специалистов из компании zehnlab. ai.
Уникальность SoroLLM заключается в её способности не только анализировать таджикский язык, но и распознавать его многочисленные диалектные формы — от северных наречий до памирских вариантов. По словам разработчиков, акцент сделан на точную передачу особенностей синтаксиса, редкой лексики и региональных различий произношения.
Проект был официально представлен 25 июня в рамках открытия первого в республике Центра вычислительных мощностей для работы с ИИ. В мероприятии принял участие президент Эмомали Рахмон.
Инициатива стала значимым шагом в цифровом развитии страны, особенно с учётом того, что таджикский язык до этого практически отсутствовал в известных языковых моделях, таких как GPT или LLaMA.
Следующим этапом в развитии SoroLLM станет внедрение мультимодальных возможностей — искусственный интеллект научат работать с голосом и видео, расширяя границы его применения за пределы текстовой информации.