26 июня 2025

eur = 89.84 -0.30 (-0.33 %)

btc = 107 986.00$ 1 381.55 (1.30 %)

eth = 2 501.97$ 44.73 (1.82 %)

ton = 2.87$ -0.04 (-1.33 %)

usd = 78.29 -0.21 (-0.27 %)

eur = 89.84 -0.30 (-0.33 %)

btc = 107 986.00$ 1 381.55 (1.30 %)

Фёдор Минькин на GigaConf 2025: уникальность GigaChat состоит в фокусе на русскоязычных пользователей

7 минут на чтение
Фёдор Минькин на GigaConf 2025: уникальность GigaChat состоит в фокусе на русскоязычных пользователей

«Код Дурова» продолжает свою работу на IT-конференции Сбербанка GigaConf 2025. В этом интервью у нас в гостях технический директор GigaChat Сбербанка Фёдор Минькин.

В разговоре с ним обсуждаем, как устроено обучение больших языковых моделей, и в чём особенность подхода GigaChat. Также поговорили о будущем разработчиков, перспективах генеративного ИИ в корпоративной среде и роли нейросетей в жизни обычных пользователей.

Видеоверсия интервью:


— Расскажи, пожалуйста, о процессе обучения GigaChat. Насколько это сложно, долго, муторно? В общем, всё, что знаешь об этом процессе.

— Обучение GigaChat в целом состоит из нескольких стадий. Первая стадия это предобучение, за ней сейчас гонится весь мир, все большие компании Google, OpenAI и, конечно, китайские компании. Это такая фаза, когда мы берём все знания человечества, когда-либо созданные: интернет-страницы, статьи, книги, видео и вот это внедряем в модель. Модель должна выучить только полезную информацию оттуда. И там очень много разной алхимии. А как эту полезную информацию вынуть? Потому что примерно любой человек, который был в интернете, понимает, что это. Суть в том, что его надо очень хорошо профильтровать, не потеряв самую лучшую его часть, и после этого обучить модель.

И вторая фаза — это обучение. Там всё в целом проще. Чем больше модель — тем она в среднем умнее на таком же наборе данных. И её обучают на этом чистом датасете. И получается предобученная модель, это вот основа, база, из которой все произрастает. И дальше эта обученная модель много чего знает, но не совсем настроена под человека. Ты ей задаешь вопрос, она его продолжает скорее — не даёт ответ. Здесь другая фаза, надстройки. Мы называем это alignment в сфере, надстройка нейросети в правильную сферу. Там мы учим её на выверенных диалогах, которые написаны людьми, проверены ими же, профессионалами. Допустим, медицинский вопрос, медицинский ответ, правильный, идеальный, мы точно это знаем. И мы учим нейросеть на такие вопросы отвечать так, ну и вести диалог.

Туда же мы импортируем картинки, аудио, какие-то видео с разных сервисов и вот задаём вопросы по этому контенту, а затем учим модель правильно на них отвечать. Если модель достаточно умная и достаточно хорошо произошло предобучение, то всё будет хорошо и итоговая модель будет очень классной. Будет профессионально отвечать, будет отлично справляться с любыми файлами, с любыми языками и так далее. Если неправильно отфильтровать датасет, то сколько бы видеокарт у тебя ни было, сколько бы ты денег на это ни потратил, получится плохо.

Конечно, чем качественнее датасет, тем лучше модель. Её надо постоянно переобучать, потому что ты сделал датасет лучше — надо модель сделать лучше. Модель стала лучше, теперь пора датасет сделать лучше, добавив, например, её синтетические данные, или профильтровать её, чтобы она мнение выразила, хорошая это статья или нет. Такой бесконечный процесс бесконечного улучшения моделей. Нужны талантливые люди, чтобы это всё делать.

— Ты привёл несколько примеров крупных компаний, которые разрабатывают подобные GigaChat'у модели. Чем принципиально GigaChat отличается от своих аналогов?

— Я бы разделил этот вопрос на две составляющие. Первая — это наши физические клиенты, кто заходит на какой-нибудь сервис с GigaChat. И B2B-клиенты, компании, которые хотят свои процессы улучшить через GigaChat. Что касается наших клиентов, физических лиц, просто обычных людей, то, конечно, мы стараемся максимально сделать упор в русский язык. Например, китайские нейросети иногда переходят на китайский во время разговора, не понимают разные термины русские, «сельдь под шубой» — каноничный пример.

У нас прям фокус на русский язык, на славянскую культуру, соответственно, мы надеемся, что именно в этой сфере мы гораздо лучше понимаем просто русского человека, чем другие нейросети. Но, конечно, мы развиваем и знания, и разные возможности, модальности изображения, аудио и так далее, чтобы быть на нужном уровне по всему. Но я бы скорее сказал, что наше преимущество в том, что у нас есть фокус, и в том, что мы подстраиваемся под клиентов, под наших людей. Скорее всего, когда мы пользуемся какой-нибудь китайской нейросетью или, допустим, ChatGPT, мало кому есть дело там до качества ответов для нашей группы людей, у них другие цели. У нас цель конкретно для русских людей сделать лучшую нейросеть, лучший сервис для использования.

Что касается B2B-сегмента, то платформа, про которую рассказали на конференции с объединением всех сервисов и всех нейросетей Сбера - это такое уникальное предложение. Мало у кого такое есть. Например, есть отдельный DeepSeek, текстовая нейросеть, которая отличная, но у нее нет изображений, аудио, работы с видео и т. д. Конкретно наше предложение для B2B, оно уникальное, потому что содержит в себе целое сочетание: синтез речи, её распознавание, нейросети, выстроенные сервисы, референсы.
Вот мы гайд сделали недавно, как использовать мультиагентные системы — такие как GigaChat — и на других таких же больших языковых моделях в корпоративном сегменте. Потому что мало кто знает, что 60% компаний застревают на этапе прототипа с любой нейросетью. Там важно общее предложение, которое несёт одна компания другой.

— То есть по совокупности факторов B2B и B2C сегмента GigaChat превосходит сейчас все остальные нейросети, я правильно понимаю?

— Я считаю, что где-то он на уровне, где-то он превосходит, где-то он уступает. Нет сейчас прямо выраженного лидера. Гонка такая, что то OpenAI становится чуть лучше, то Google на английском языке, то DeepSeek. Мы постоянно развиваемся, где-то лучше, где-то хуже. Мы постоянно проверяем сотни метрик, с разных сторон смотрим на модель, но и фиксим её слабые стороны. Поэтому мне сложно сказать, кто лучше, но по совокупности факторов это суперклассно.

— Но мы обязательно проверим, какая нейросеть лучше, а сделаем мы это настоящим традиционным русским способом. Мы дадим запрос в каждую из нейросетей, в том числе и в GigaChat, на чём лучше делать окрошку, на квасе или на кефире. И вот посмотрим, как эти нейросети справятся. Я уверен, что GigaChat даст правильный ответ.

Скажи, пожалуйста, вот на ПМФ Сбер представил новую версию, экосистемы GigaChat, GigaChat 2.0, где, не побоюсь этого слова, была представлена функция «глубокого исследования». Расскажи, пожалуйста, о чём это вообще, что это такое и какие дальше перспективы развития у GigaChat? Какие новые функции появятся?

— Вообще, GigaChat это такая диалоговая система, то есть ты задаёшь вопрос, она отвечает, ты корректируешь её постоянно, в диалоге постоянно находишься. Но это не всегда твоя задача. Иногда задача — максимально глубоко изучить какой-то вопрос. И с этим запросом мы идём в интернет и находим там разные источники, разные статьи, причём в разной степени качества. И с помощью GigaChat на мультиагентной системе мы сопоставляем кучу разных источников, разные мнения, специально форсируем поисковые запросы, чтобы были разные мнения, за и против, какие-то исследования. Формируем объективную картинку из этого и составляем большой документ исследования вашего вопроса на основе этой системы. Где там мультиагентность вообще? Когда вы задаете туда вопрос: «Проведи мне исследование, например, на тему применимости нейросетей в бизнесе».

GigaChat порождает много агентов, которые тоже работают на нём. Один ищет информацию, допустим, про Россию, другой про мир, третий там про конкретно США и так далее. Когда они находят информацию, ещё раз итеративно идут в поиск уже с уточнениями. Не нашли ничего, например, про Китай, будут искать на других источниках и так далее. То есть они так глубоко спускаются в тему, потом поднимают все источники, всю свою информацию, и уже другие агенты пытаются из этого сочинить документ. Они сочиняют, опираясь на источники, постоянно подтверждая, то есть постоянно говоря, «вот отсюда взято», «вот отсюда, это я не соврал», «это вот мнение». И с разных сторон проводят исследования, и на выходе получается большой такой файл, уже как будто доклад какой-то или как будто реферат, в котором тема интересующего вас исследования описана подробно. То есть это отдельная система со специальными целями, которая нужна, если нужно провести глубокое исследование точек зрения

— То есть получается, что уже не универсальная нейросеть над этим работает, а конкретно та, которая нужна для этой задачи. Правильно я понимаю?

— Из интересного здесь, что нейросеть одна, это GigaChat, но мы даём ему разные роли и задачи. GigaChat это очень такая гибкая система. Мы можем задать ему так называемую системную инструкцию, где задается вот всё, инстанцируется такой диалог. И там в нашем сегменте для физических лиц, для обычных людей, написано: «Ты GigaChat, вот у тебя такие правила, вот так отвечай, вот у тебя такой стиль и так далее». А можно всё это вообще просто уничтожить и сказать: «Ты специалист агроном, ты исследуешь вот это, это, с этих точек зрения смотришь и так далее». То есть задать агента, который уже будет смотреть на одну сферу. Дать ему инструменты нужные, поиск в определённых базах данных, в книгах, файлах. И такого агента запустить, и он более вероятно найдет более точный ответ. Мы с разных точек зрения задачи рассматриваем, и получается лучше.

— В этом плане ещё актуальнее становится профессия промпт-инженера, человека, который работает с нейросетью. Мне кажется, что как раз ключевым здесь является правильный запрос. И человек, который хочет получить какой-то ответ от нейросети, должен в первую очередь правильно сформулировать вопрос и задать какие-то ТЗ, промпты. В этом плане, конечно, людям, которые работают с нейросетями, действительно нужно многому поучиться ещё, потому что просто так спросить, «как дела», ну ты получишь ответ «хорошо». Дальше нужно более детально вдаваться в какие-то подробности.

Недавно Сэм Альтман опубликовал эссе, называется оно The Gentle Singularity, о том, что ждёт нас через 5 лет. Расскажи, каково твоё мнение, что дальше будет с нейросетями, с генеративным искусственным интеллектом, как они будут развиваться в ближайшие 5 лет.

— Я очень уважаю таких людей, кто может такое мнение сильное высказать. Я более скромный, у меня нет мнения конкретного, чтобы написать книгу «Что будет через 5 лет». Но что я точно вижу: не использовать искусственный интеллект будет просто невозможно. Без него ты будешь неэффективен в любых сферах жизни. Даже недавно в организации праздников был ведущий, вот он явно написал свою речь с использованием нейросетей. Прекрасная речь, ну просто великолепная. Он заточил её настолько, чтобы я бы такую не написал. И точно через 5 лет те, кто не использует искусственный интеллект или какие-то технологии искусственного интеллекта, они будут меньше цениться, чем те, кто используют. Даже у меня в команде я вижу тех, кто прям активно их использует — у них производительность в десятки раз больше. Я каждый раз нахожу что-то новое, какую-нибудь новую особенность в применении искусственного интеллекта, о которой не знал.

Что касается ещё прогнозов, я не думаю, что будет создан самообучающийся искусственный интеллект, но я верю, что такие системы будут очень высокими. Уже сейчас нейросети во многом умнее меня. Ладно, код они ещё пишут хуже, здесь я могу что-то сделать. Хотя с развитием вайб-кодинга, наверное, скоро об этом можно будет забыть. Но уже сейчас я не могу так хорошо знать обществознание, как GigaChat, он знает лучше меня. И особенность в том, что GigaChat знает много наук лучше меня: медицину лучше меня, агрономию лучше, психологию лучше и т.д. Понятно, что я не специализируюсь в этом, но это уже сейчас реальность. Через 5 лет такие технологии будут гораздо больше знать, гораздо большим уровнем обладать. Хочется больше конкуренции, чтобы не было одной крутой нейросети.

Что касается компаний, они будут переведены на автономных агентов. Я думаю, в горизонте 5 лет мы точно это увидим. То есть какие-то функции, допустим, какие-то анализы Excel, много такой рутинной работы, они будут переведены на агентов, и компании будут вынуждены перестроиться. Вместо того, чтобы сидеть и самому мучиться с Excel, эти вкладки переключать, ты просто задаёшь задание, и всё. Но при этом надо найти свою нишу, потому что если всё, что ты делал, будет заменено, тебе придётся найти что-то новое. Соответственно, будет большой челлендж для людей в том, чтобы изучить эти нейросети и найти применение в своей работе, чтобы быть эффективным.

— Как ты считаешь, искусственный интеллект заменит разработчиков или нет?

Я считаю, что хороших нет. Но уже сейчас неконтролируемый вайб-кодинг может привести к тому, что просто люди не понимают вот эту всю систему, которую они написали. Но это не очень хорошо. И так все борются постоянно с Legacy, С bus-фактор, где один человек, который знает, все остальные ничего не знают. И когда на вайб-кодили, так скажем, будет ещё больше такого Legacy.

Скорее всего, будет какой-то гибрид, без нейросетей будет очень тяжело. Будут максимально их использовать и будет цениться реально критическое мышление, когда ты можешь понять всю систему, выйти за некоторые границы своей ответственности. Не просто я пишу что-то, а понимать как это работает и как вообще оценить это. Немножко культура должна измениться будет.

Читать первым в Telegram-канале «Код Дурова»

Важные новости коротко — от GigaChat Max 
1-bg-изображение-0
img-content-1-изображение-0

GigaChat Max: коротко о главном

Как изменился Код Дурова вместе с GigaChat Max?

Узнай о всех возможностях в FAQ-статье 
a6a82d93-5f52-423e-80c0-af90b8772fbc-изображение-0

GigaChat Max: коротко о главном

Lixiang начал блокировать неофициально ввезённые в Россию автомобили

Полная версия 
a7519e9c-5056-4bc0-91d7-c074c25a6bbf-изображение-0

GigaChat Max: коротко о главном

Фёдор Минькин на GigaConf 2025: уникальность GigaChat состоит в фокусе на русскоязычных пользователей

Полная версия 

Реализовано через GigaChat Max 

Сейчас читают
Карьера
Блоги 366
X5 Tech
Газпромбанк
билайн
Сбер
Т-Банк
МТС
Яндекс Практикум
Ozon Tech
Циан
Банк 131

Пользуясь сайтом, вы соглашаетесь с политикой конфиденциальности
и тем, что мы используем cookie-файлы

OSZAR »
OSZAR »