На ПЛАС-Форуме Digital Kazakhstan руководитель ML & Operations Kolesa Group Хамбар Дусалиев объяснил, почему выбор между LLM и классическим ML — это не вопрос моды, а расчёта. Он подчеркнул, что «не все задачи нужно решать ИИ» и что решение определяется стоимостью, скоростью, объёмом данных и рисками ошибок модели.
Выступая перед участниками форума, Дусалиев рассказал, как команда Kolesa Group принимает архитектурные решения в проектах, связанных с машинным обучением. Он отметил, что компанія создаёт отдельные ML-сервисы для продуктов и всегда начинает с вопроса о целесообразности:
«Не все проблемы решаются с помощью ИИ… надо понять, какую проблему вы вообще собираетесь решать».
По словам Дусалиева, большие языковые модели эффективнее, когда данные изменчивы, но контекст задачи остаётся стабильным:
«Когда у нас данные и требования меняются, но остаётся достаточно консистентный контекст — это оптимальный сценарий для LLM».
Он пояснил, что такие сценарии характерны для анализа клиентских диалогов, текстовых данных и задач, где важна гибкость.
Классическое ML, по его словам, предпочтительно при работе с большими массивами информации, где важны точные численные прогнозы:
«Если у нас слишком много данных… для этого обычно хорошо подойдёт что-нибудь своё».
Он подчеркнул, что масштабные задачи — например, рекомендательные системы — требуют собственных моделей и большого объёма подготовки данных.
Отдельно Дусалиев обратил внимание на стоимость эксплуатации и сложность инфраструктуры. Он отметил, что при работе с LLM ключевым фактором становится цена обработки токенов:
«Нам нужно ответить на вопрос, сколько стоит обработка токенов… протестировать, посчитать и жить с этой информацией».
При классическом ML основные ресурсы уходят на подготовку данных:
«90% времени — это сбор данных и тренировка моделей».
Говоря о подходах к разработке, он подчеркнул необходимость выбора между in-house и сторонними решениями:
«Если у нас нет своего ресурса разработки… то мы уже ориентируемся на LLM, потому что так будет быстрее и проще».
В завершение Дусалиев сформулировал вопросы, которые должен задать себе любой продукт или команда, прежде чем внедрять ИИ:
«Это точно задача для ИИ? Какова стоимость? Что мы будем тренировать сами, а что можем взять готовым? И что будет, когда модель начнёт ошибаться?»
