Как нейросети улучшают Поиск: что уже реализовано и какие у Алисы планы
Нейросети в Поиске Яндекса: как работают, что уже умеют и что ждёт впереди
21 сентября 2025Нейросети в Поиске Яндекса: как работают, что уже умеют и что ждёт впереди
21 сентября 2025Вместе с СТО Поиска и выпускницей ШАДа Екатериной Серажим обсудили, как менялся самый массовый продукт Яндекса — Поиск. Рассказали об эволюционных скачках, которые проходили технологии, и разобрали каждый этап на примере запроса о сериале «Твин Пикс». Так что наливайте чашечку чёрного кофе — и поехали. С молоком тоже наливайте
Эволюцию технологий в Поиске можно представить не как плавную линию, а как серию скачков. В биологии есть похожая картина: что-то происходит — и один фенотип расщепляется на несколько. В технологиях такой скачок — это появление новой идеи или модели, вокруг которой всё начинает быстро развиваться. Вот так это выглядело в Поиске.
Тогда Поиск работал гораздо проще, чем сейчас. На самых ранних этапах основой алгоритма ранжирования был полином — формула, составленная вручную и основанная на текстовых факторах. Он буквально сопоставлял слова из запроса с текстом на страницах. Поэтому, чтобы получить нужный результат, приходилось формулировать запрос максимально точно.
Чтобы управлять выдачей, пользователи использовали операторы — специальные символы и команды, которые помогали конкретизировать запрос. Например, знак «плюс» ставили перед словом, которое должно было быть на странице. «Минус» — чтобы исключить слово из поиска. Иногда слова заключали в кавычки, чтобы найти точную фразу.
Поиск стал учитывать поведенческие, ссылочные и текстовые фичи — начал лучше справляться с тематикой и частичными совпадениями, даже если в тексте нет всего набора слов. В основе ранжирования появился алгоритм под названием «Матрикснет» — градиентный бустинг над деревьями решений, это стало началом использования машинного обучения (ML) в Поиске.
Запрос и документ проходят через эти деревья, попадают в нужные листья — и итоговое значение получается за счёт суммирования весов. Позже алгоритм эволюционировал в CatBoost — он до сих пор используется в поисковых задачах.
Эта эпоха принесла активное развитие фича-инжиниринга. Команды придумали тысячи факторов — от простых (например, сколько раз слово встречается в документе) до более сложных поведенческих, забавных («расстояние до Магадана») и экзотических («0,9-квантиль длины лепестка в дереве поиска в пространстве Nodes Time, рассчитанный для хостов»).
Главная особенность Матрикснета в том, что он мог автоматически работать с огромным количеством таких факторов и при этом не «переобучаться». То есть формула ранжирования сайтов стала подбираться на основании всех известных факторов и знаний о том, какие страницы лучше соответствуют запросу, а какие — хуже. Обычные алгоритмы в такой ситуации начинали находить несуществующие закономерности, а Матрикснет оставался точным.
Эпоха III: нейросети и новая парадигма
Пример запроса: сериал где есть красные бархатные шторы и карлик
Основное отличие этой эпохи — смена подхода: от ручного подбора признаков к обучению моделей, которые самостоятельно находят смысловые связи между словами и документами. Раньше для приближения семантической связи инженеры составляли словари синонимов, создавали правила расширения запроса. С приходом нейросетей модель стала учитывать эти связи сама.
Первые нейросетевые модели, которые начали использовать в Поиске, — это полносвязные сети (в Яндексе их называли DSSM). Они помогали сопоставлять запросы и документы не только по формальным признакам, но и по смыслу.
Это был важный шаг: Поиск начал «понимать» пользователей на новом уровне.
Например, в старых алгоритмах запрос «сериал, где есть комната с бархатными шторами и карлик» почти невозможно было обработать, если в документах не было точного совпадения по словам. Но с приходом нейросетей появилась возможность уловить, что имеется в виду «Твин Пикс», — даже если «бархатные шторы» в документе напрямую не упоминались.
Нейросети-трансформеры благодаря своей архитектуре ещё глубже связывают тексты документов с запросами по смыслу и могут анализировать довольно глубокий контекст.
Пример запроса: сериал с бархатными шторами + странной атмосферой + снами и ещё каким-то карликом
В 2020 году началась новая глава — эпоха трансформеров. Благодаря self-attention эти модели оказались гораздо мощнее: они умеют учитывать длинный контекст целиком, а не локально, как предыдущие архитектуры.
В Яндексе трансформерная архитектура получила название YATI. К моменту внедрения трансформеров в Поиске работало около 30 различных нейросетей.
Это был скачок к ещё более глубокому пониманию языка. Поиск стал точнее улавливать смысл запроса и документов. С этого момента трансформеры стали основой многих внедрений в Яндексе. С помощью этой архитектуры мы в том числе улучшили Быстрые ответы — фрагменты текста с сайта, которые появлялись прямо под поисковой строкой и с высокой вероятностью отвечали на вопрос пользователя.
В 2023 году наступила эпоха генеративного ИИ. Главным героем этого этапа стала YandexGPT — модель, способная не только понимать запрос, но и самостоятельно формулировать ответ.
Сентябрь 2023 — в Поиске появились быстрые ответы на базе YandexGPT. Модель научилась сама генерировать короткие ответы, опираясь на источник. Раньше мы могли отвечать только связным фрагментом текста, а с возможностями YandexGPT научились генерировать ответ «словами модели». Это был большой шаг — первый релиз генеративных ответов в Поиске.
Апрель 2024 — Яндекс объединил возможности поиска и больших генеративных моделей в новом сервисе «Нейро». Главное отличие Нейро в том, что он мог сгенерировать ответ не по одному документу, а сразу по нескольким. Более того, он был способен сам сформулировать до пяти уточняющих запросов, собрать нужные документы, проанализировать их и выдать один ответ на вопрос со ссылками на источники и без галлюцинаций.
Октябрь 2024 — технологии Нейро интегрировали в Поиск. Это позволило дать десяткам миллионов пользователей доступ к ИИ-возможностям в самом массовом продукте.
Май 2025 — Поиск научился рассуждать и генерировать контент с помощью технологий Алисы, они заменили и расширили возможности Нейро. Например, попросить нейросеть «нарисовать» вишнёвый пирог из «Твин Пикс» теперь можно прямо в поисковой строке. Ответы стали более развёрнутыми, похожими на статьи: с картинками, видео и ссылками на источники, а ответить на самые сложные вопросы помогает возможность рассуждений.
Также в Поиске стало удобно искать сразу по объектам: предложениям товаров, квартир и финансовых продуктов. Теперь они собраны в специальные разделы — Темы, где удобно сравнивать и оформлять предложения. Возможности Тем есть и прямо в Поиске: алгоритмы научились определять, когда вы что-то выбираете или собираетесь купить, и показывают нужные тематические блоки — например, с выбором вкладов.
Вообще, у Яндекса есть своя сильная научная база — и у наших статей очень высокая цитируемость в сообществе. Наша собственная наука позволяет нам и другим компаниям превращать теории в практику: из науки — в технологию, из технологии — в продукт или сервис.
Поиск — это текстовая задача. Необходимо проанализировать текст запроса, связать его с текстом документов, содержимым тематических блоков и на основе этой связи предсказать оптимальный порядок. Нейросети в определённый момент стали мощным инструментом для решения задач, связанных с анализом текста, будь то перевод, классификация или, как у нас, задача ранжирования.
Чтобы нейросеть могла разбираться в сложных вопросах, нужно научить её не просто «читать» текст, а понимать смысл и логику мира. Для этого используется несколько этапов обучения.
Pretrain — учим понимать контекст и предсказывать следующее слово. На этом этапе модель читает огромное количество текстов: книги, энциклопедии, научные статьи и многое другое. В Яндексе специально отбирают качественные источники, чтобы модель впитала как можно больше точной и полезной информации.
Задача здесь простая: модель читает текст и учится предсказывать следующее слово. Она запоминает разнообразные взаимосвязи, причём не только синтаксические и лексические: модель учится логике, контексту и базовому пониманию мира.
Даже такая, казалось бы, простая логическая цепочка требует некоторых знаний о физическом мире.
Supervised Fine-Tuning (SFT) — учим отвечать. На этапе SFT модель получает первые задания: вопрос и правильный ответ. Здесь она всё так же предсказывает следующее слово — но уже не просто в тексте, а в паре «вопрос-ответ».
Так модель учится применять свои знания, чтобы отвечать по делу и в нужной форме.
Reinforcement Learning (RL) — учим отвечать ещё лучше. Дальше — самый интересный этап: обучение с подкреплением. Модель начинает сама формулировать ответы, а ИИ-тренеры и специалисты в разных областях поощряют нейронку за правильные ответы и учат, как исправить неправильные. Это как школьник, который сам решает задачу, а учитель ставит оценку.
Такой подход позволяет модели развивать собственный стиль, учиться объяснять и подбирать слова, которые понятны и полезны человеку.
Reasoning — учим размышлять. Относительно новое направление в развитии моделей — reasoning, или «поразмышляй перед ответом». По сути, модели дают дополнительное вычислительное время «на подумать», часто заставляя выписывать свои размышления в виде текста. Что именно писать — модель решает сама.
В таком сетапе размышления, выписанные моделью, часто очень логичны — а мы можем подсмотреть, как модель рассуждает. Например, при решении математической задачи она сначала думает над разными ветками решения, делает промежуточные шаги, может попробовать разные стратегии, а уже потом пишет финальный ответ. Это заметно повышает качество ответа (особенно в сложных темах, где важна логика и цепочка размышлений) и помогает пользователю уточнить вопрос, исходя из результата размышлений.
Сначала появился Нейро как отдельный сервис — весной 2024 года. Тогда команда Кати просто хотела посмотреть, как люди будут им пользоваться, какие задачи туда принесут, насколько такой инструмент окажется полезным. И оказалось, что он востребован, да ещё как! Из интересного — особенно активной оказалась аудитория школьников.
Именно тогда стало понятно, что такие технологии должны быть внутри Поиска.
Нужно было сделать так, чтобы модель работала быстро, эффективно и была доступна бесплатно — всем пользователям Яндекса. В результате Поиск с Нейро изучал все доступные источники в интернете и выдавал краткий, структурированный и понятный ответ со ссылками.
В мае 2025 года мы расширили эти возможности с помощью технологий Алисы. За счёт этого теперь прямо в Поиске можно:
получать развёрнутые ответы с иллюстрациями, видео и ссылками на источники — прямо как мини-статья по запросу;
включать режим рассуждений для глубокого анализа темы;
генерировать тексты и изображения прямо в поисковой строке;
выбирать технику и товары с помощью подробных рекомендаций.
Также благодаря VLM и визуальному поиску можно задавать вопросы картинкой с текстом. Например, можно сделать фото растения и без уточнения названия спросить, почему у него пожелтели листья. Или показать кадр из фильма и спросить, какой там сюжет.
Важно понимать: ответы Алисы в Поиске не заменяют классическую поисковую выдачу, а работают вместе с ней. Они автоматически появляются только на тех вопросах, где ответ от ИИ будет наиболее полезным и нужным. Например, если пользователь хочет перейти на сайт магазина, Алиса не подключается: здесь достаточно обычной выдачи. При этом возможность вызвать ответ Алисы есть при любом запросе — достаточно нажать кнопку под поисковой строкой.
Это действительно впечатляет: нажимаешь кнопку — и уже через секунду получаешь готовый ответ. И это не случайность, а результат целого ряда оптимизаций: например, использовали архитектуру Encoder-Decoder, которая хорошо работает в условиях длинного контекста, а это важно для Поиска. Никто не готов ждать ответа даже несколько секунд, не говоря уже о «подумать полминуты».
Поэтому команда сознательно фокусировалась на производительности — чтобы Алиса встраивалась в привычный ритм поиска и не заставляла ждать.
Всё идёт к тому, что Поиск будет сам решать задачи пользователя — от начала до конца, без лишних усилий со стороны человека.
Раньше пользователь должен был буквально «программировать» свой запрос — добавлять плюсики и минусики, чтобы получить хоть что-то релевантное. Потом появились дополнительные инструменты, которые показывали информацию из интернета в более удобном виде, чем ссылки.
Представим, что человек впервые собирается на горнолыжный курорт и хочет купить лыжи. Он не знает, какие они бывают, как выбрать, сколько они стоят. Чтобы разобраться, ему нужно изучить огромный объём информации, распределённой по всему интернету.
И вот здесь — будущее Поиска: провести всю работу за пользователя и собрать лучшие решения. Нейросеть должна уметь анализировать тексты, видео и комментарии, понимать запрос и уточнять детали, а затем выдавать удобный и точный ответ. Причём не просто текстовое объяснение, а рекомендацию с конкретными примерами из разных источников: какие лыжи подойдут именно тебе, почему, сколько они стоят, где их выгодно купить — и желательно сразу с кнопкой покупки.
Поиск будущего — это не просто информация. Это прямое решение запроса или задачи, даже если они максимально нечётко выражены. Нейронки отлично подходят для решения таких задач уже сейчас — а что будет дальше, мы и представить себе не можем (но подумать об этом приятно).