Нейросети в Поиске Яндекса: как работают, что уже умеют и что ждёт впереди

Загрузка

Нейросети в Поиске Яндекса: как работают, что уже умеют и что ждёт впереди

Вместе с СТО Поиска и выпускницей ШАДа Екатериной Серажим обсудили, как менялся самый массовый продукт Яндекса — Поиск. Рассказали об эволюционных скачках, которые проходили технологии, и разобрали каждый этап на примере запроса о сериале «Твин Пикс». Так что наливайте чашечку чёрного кофе — и поехали. С молоком тоже наливайте

Как развивался Поиск?

Эволюцию технологий в Поиске можно представить не как плавную линию, а как серию скачков. В биологии есть похожая картина: что-то происходит — и один фенотип расщепляется на несколько. В технологиях такой скачок — это появление новой идеи или модели, вокруг которой всё начинает быстро развиваться. Вот так это выглядело в Поиске.

Эпоха I: до Матрикснета
Пример запроса: сериал + дэвид + линч

Тогда Поиск работал гораздо проще, чем сейчас. На самых ранних этапах основой алгоритма ранжирования был полином — формула, составленная вручную и основанная на текстовых факторах. Он буквально сопоставлял слова из запроса с текстом на страницах. Поэтому, чтобы получить нужный результат, приходилось формулировать запрос максимально точно.

Чтобы управлять выдачей, пользователи использовали операторы — специальные символы и команды, которые помогали конкретизировать запрос. Например, знак «плюс» ставили перед словом, которое должно было быть на странице. «Минус» — чтобы исключить слово из поиска. Иногда слова заключали в кавычки, чтобы найти точную фразу.

То есть, чтобы найти сериал «Твин Пикс», нужно было тщательно продумать запрос, а лучше точно знать название или имя режиссёра. Иначе Поиск просто не понимал, о чём речь.

Эпоха II: Матрикснет и фича-инжиниринг
Пример запроса: сериал про лору палмер

Поиск стал учитывать поведенческие, ссылочные и текстовые фичи — начал лучше справляться с тематикой и частичными совпадениями, даже если в тексте нет всего набора слов. В основе ранжирования появился алгоритм под названием «Матрикснет» — градиентный бустинг над деревьями решений, это стало началом использования машинного обучения (ML) в Поиске.

Он работает так: строится множество решающих деревьев, на листьях которых находятся условия, основанные на различных признаках (фичах).

Запрос и документ проходят через эти деревья, попадают в нужные листья — и итоговое значение получается за счёт суммирования весов. Позже алгоритм эволюционировал в CatBoost — он до сих пор используется в поисковых задачах.

Эта эпоха принесла активное развитие фича-инжиниринга. Команды придумали тысячи факторов — от простых (например, сколько раз слово встречается в документе) до более сложных поведенческих, забавных («расстояние до Магадана») и экзотических («0,9-квантиль длины лепестка в дереве поиска в пространстве Nodes Time, рассчитанный для хостов»).

Главная особенность Матрикснета в том, что он мог автоматически работать с огромным количеством таких факторов и при этом не «переобучаться». То есть формула ранжирования сайтов стала подбираться на основании всех известных факторов и знаний о том, какие страницы лучше соответствуют запросу, а какие — хуже. Обычные алгоритмы в такой ситуации начинали находить несуществующие закономерности, а Матрикснет оставался точным.

(01)

И технологии мощные, и коты милые. Про котов не обманываем, смотрите сами.Смотреть

Эпоха III: нейросети и новая парадигма
Пример запроса: сериал где есть красные бархатные шторы и карлик

Основное отличие этой эпохи — смена подхода: от ручного подбора признаков к обучению моделей, которые самостоятельно находят смысловые связи между словами и документами. Раньше для приближения семантической связи инженеры составляли словари синонимов, создавали правила расширения запроса. С приходом нейросетей модель стала учитывать эти связи сама.
Первые нейросетевые модели, которые начали использовать в Поиске, — это полносвязные сети (в Яндексе их называли DSSM). Они помогали сопоставлять запросы и документы не только по формальным признакам, но и по смыслу.

(02)

Рассказываем об этом в ХэндбукеЧитать в Журнале

Это был важный шаг: Поиск начал «понимать» пользователей на новом уровне.

(03)

Рассказали подробнее, как же он так начал.Читать

Например, в старых алгоритмах запрос «сериал, где есть комната с бархатными шторами и карлик» почти невозможно было обработать, если в документах не было точного совпадения по словам. Но с приходом нейросетей появилась возможность уловить, что имеется в виду «Твин Пикс», — даже если «бархатные шторы» в документе напрямую не упоминались.

Эпоха IV: трансформеры и YATI

Нейросети-трансформеры благодаря своей архитектуре ещё глубже связывают тексты документов с запросами по смыслу и могут анализировать довольно глубокий контекст.

Пример запроса: сериал с бархатными шторами + странной атмосферой + снами и ещё каким-то карликом
В 2020 году началась новая глава — эпоха трансформеров. Благодаря self-attention эти модели оказались гораздо мощнее: они умеют учитывать длинный контекст целиком, а не локально, как предыдущие архитектуры.
В Яндексе трансформерная архитектура получила название YATI. К моменту внедрения трансформеров в Поиске работало около 30 различных нейросетей.

(04)

Чтобы YATI заработал, модели переварили буквально терабайты данных.

Трансформеры оказались настолько мощными, что смогли заменить их все — и при этом дать ощутимый прирост качества.

Это был скачок к ещё более глубокому пониманию языка. Поиск стал точнее улавливать смысл запроса и документов. С этого момента трансформеры стали основой многих внедрений в Яндексе. С помощью этой архитектуры мы в том числе улучшили Быстрые ответы — фрагменты текста с сайта, которые появлялись прямо под поисковой строкой и с высокой вероятностью отвечали на вопрос пользователя.

Эпоха V: генеративные нейросети
Пример запроса: что за сериал, где заходят в комнату с красными шторами и всё как во сне

В 2023 году наступила эпоха генеративного ИИ. Главным героем этого этапа стала YandexGPT — модель, способная не только понимать запрос, но и самостоятельно формулировать ответ.

Всё развивалось уже не за годы, а буквально за месяцы.

Сентябрь 2023 — в Поиске появились быстрые ответы на базе YandexGPT. Модель научилась сама генерировать короткие ответы, опираясь на источник. Раньше мы могли отвечать только связным фрагментом текста, а с возможностями YandexGPT научились генерировать ответ «словами модели». Это был большой шаг — первый релиз генеративных ответов в Поиске.

Апрель 2024 — Яндекс объединил возможности поиска и больших генеративных моделей в новом сервисе «Нейро». Главное отличие Нейро в том, что он мог сгенерировать ответ не по одному документу, а сразу по нескольким. Более того, он был способен сам сформулировать до пяти уточняющих запросов, собрать нужные документы, проанализировать их и выдать один ответ на вопрос со ссылками на источники и без галлюцинаций.

Октябрь 2024 — технологии Нейро интегрировали в Поиск. Это позволило дать десяткам миллионов пользователей доступ к ИИ-возможностям в самом массовом продукте.

Май 2025 — Поиск научился рассуждать и генерировать контент с помощью технологий Алисы, они заменили и расширили возможности Нейро. Например, попросить нейросеть «нарисовать» вишнёвый пирог из «Твин Пикс» теперь можно прямо в поисковой строке. Ответы стали более развёрнутыми, похожими на статьи: с картинками, видео и ссылками на источники, а ответить на самые сложные вопросы помогает возможность рассуждений.

Также в Поиске стало удобно искать сразу по объектам: предложениям товаров, квартир и финансовых продуктов. Теперь они собраны в специальные разделы — Темы, где удобно сравнивать и оформлять предложения. Возможности Тем есть и прямо в Поиске: алгоритмы научились определять, когда вы что-то выбираете или собираетесь купить, и показывают нужные тематические блоки — например, с выбором вкладов.

В какой момент команда поняла, что нейросети могут улучшить работу Поиска?

(05)

Теперь достаточно написать «что за сериал, где заходят в комнату с красными шторами и всё как во сне», чтобы Нейро сгенерировал ответ про культовый проект Дэвида Линча.Читать

Яндекс всегда двигался в ногу с научным сообществом. Как только в мире появлялась новая идея, команда старалась быстро адаптировать её под свои задачи и улучшить для реального применения — так получилось и с нейросетями.

Вообще, у Яндекса есть своя сильная научная база — и у наших статей очень высокая цитируемость в сообществе. Наша собственная наука позволяет нам и другим компаниям превращать теории в практику: из науки — в технологию, из технологии — в продукт или сервис.

Поиск — это текстовая задача. Необходимо проанализировать текст запроса, связать его с текстом документов, содержимым тематических блоков и на основе этой связи предсказать оптимальный порядок. Нейросети в определённый момент стали мощным инструментом для решения задач, связанных с анализом текста, будь то перевод, классификация или, как у нас, задача ранжирования.

Какие технологии помогают нейросетям понимать сложные и нестандартные запросы?

Чтобы нейросеть могла разбираться в сложных вопросах, нужно научить её не просто «читать» текст, а понимать смысл и логику мира. Для этого используется несколько этапов обучения.

Pretrain — учим понимать контекст и предсказывать следующее слово. На этом этапе модель читает огромное количество текстов: книги, энциклопедии, научные статьи и многое другое. В Яндексе специально отбирают качественные источники, чтобы модель впитала как можно больше точной и полезной информации.

Задача здесь простая: модель читает текст и учится предсказывать следующее слово. Она запоминает разнообразные взаимосвязи, причём не только синтаксические и лексические: модель учится логике, контексту и базовому пониманию мира.

«У Маши два брата и одна сестра. Сколько всего девочек в семье?» — чтобы ответить, нейронка должна понимать концепцию семьи.

Даже такая, казалось бы, простая логическая цепочка требует некоторых знаний о физическом мире.

Supervised Fine-Tuning (SFT) — учим отвечать. На этапе SFT модель получает первые задания: вопрос и правильный ответ. Здесь она всё так же предсказывает следующее слово — но уже не просто в тексте, а в паре «вопрос-ответ».

Так модель учится применять свои знания, чтобы отвечать по делу и в нужной форме.

Reinforcement Learning (RL) — учим отвечать ещё лучше. Дальше — самый интересный этап: обучение с подкреплением. Модель начинает сама формулировать ответы, а ИИ-тренеры и специалисты в разных областях поощряют нейронку за правильные ответы и учат, как исправить неправильные. Это как школьник, который сам решает задачу, а учитель ставит оценку.

Такой подход позволяет модели развивать собственный стиль, учиться объяснять и подбирать слова, которые понятны и полезны человеку.

Reasoning — учим размышлять. Относительно новое направление в развитии моделей — reasoning, или «поразмышляй перед ответом». По сути, модели дают дополнительное вычислительное время «на подумать», часто заставляя выписывать свои размышления в виде текста. Что именно писать — модель решает сама.

В таком сетапе размышления, выписанные моделью, часто очень логичны — а мы можем подсмотреть, как модель рассуждает. Например, при решении математической задачи она сначала думает над разными ветками решения, делает промежуточные шаги, может попробовать разные стратегии, а уже потом пишет финальный ответ. Это заметно повышает качество ответа (особенно в сложных темах, где важна логика и цепочка размышлений) и помогает пользователю уточнить вопрос, исходя из результата размышлений.

А как Алиса стала частью Поиска?

Сначала появился Нейро как отдельный сервис — весной 2024 года. Тогда команда Кати просто хотела посмотреть, как люди будут им пользоваться, какие задачи туда принесут, насколько такой инструмент окажется полезным. И оказалось, что он востребован, да ещё как! Из интересного — особенно активной оказалась аудитория школьников.

Именно тогда стало понятно, что такие технологии должны быть внутри Поиска.

Это стало для нас настоящим инженерным вызовом: нужно было масштабировать всё на десятки тысяч запросов в секунду

Нужно было сделать так, чтобы модель работала быстро, эффективно и была доступна бесплатно — всем пользователям Яндекса. В результате Поиск с Нейро изучал все доступные источники в интернете и выдавал краткий, структурированный и понятный ответ со ссылками.

В мае 2025 года мы расширили эти возможности с помощью технологий Алисы. За счёт этого теперь прямо в Поиске можно:

получать развёрнутые ответы с иллюстрациями, видео и ссылками на источники — прямо как мини-статья по запросу;
включать режим рассуждений для глубокого анализа темы;
генерировать тексты и изображения прямо в поисковой строке;
выбирать технику и товары с помощью подробных рекомендаций.

Также благодаря VLM и визуальному поиску можно задавать вопросы картинкой с текстом. Например, можно сделать фото растения и без уточнения названия спросить, почему у него пожелтели листья. Или показать кадр из фильма и спросить, какой там сюжет.

Важно понимать: ответы Алисы в Поиске не заменяют классическую поисковую выдачу, а работают вместе с ней. Они автоматически появляются только на тех вопросах, где ответ от ИИ будет наиболее полезным и нужным. Например, если пользователь хочет перейти на сайт магазина, Алиса не подключается: здесь достаточно обычной выдачи. При этом возможность вызвать ответ Алисы есть при любом запросе — достаточно нажать кнопку под поисковой строкой.

Как Алиса отвечает так быстро — почти мгновенно?

Это действительно впечатляет: нажимаешь кнопку — и уже через секунду получаешь готовый ответ. И это не случайность, а результат целого ряда оптимизаций: например, использовали архитектуру Encoder-Decoder, которая хорошо работает в условиях длинного контекста, а это важно для Поиска. Никто не готов ждать ответа даже несколько секунд, не говоря уже о «подумать полминуты».

Поэтому команда сознательно фокусировалась на производительности — чтобы Алиса встраивалась в привычный ритм поиска и не заставляла ждать.

Какое будущее ждёт Поиск?

Всё идёт к тому, что Поиск будет сам решать задачи пользователя — от начала до конца, без лишних усилий со стороны человека.

Раньше пользователь должен был буквально «программировать» свой запрос — добавлять плюсики и минусики, чтобы получить хоть что-то релевантное. Потом появились дополнительные инструменты, которые показывали информацию из интернета в более удобном виде, чем ссылки.

Важно не просто найти информацию, а проанализировать источники, понять контекст и выдать готовое, полезное и понятное решение.

Представим, что человек впервые собирается на горнолыжный курорт и хочет купить лыжи. Он не знает, какие они бывают, как выбрать, сколько они стоят. Чтобы разобраться, ему нужно изучить огромный объём информации, распределённой по всему интернету.

И вот здесь — будущее Поиска: провести всю работу за пользователя и собрать лучшие решения. Нейросеть должна уметь анализировать тексты, видео и комментарии, понимать запрос и уточнять детали, а затем выдавать удобный и точный ответ. Причём не просто текстовое объяснение, а рекомендацию с конкретными примерами из разных источников: какие лыжи подойдут именно тебе, почему, сколько они стоят, где их выгодно купить — и желательно сразу с кнопкой покупки.

Поиск будущего — это не просто информация. Это прямое решение запроса или задачи, даже если они максимально нечётко выражены. Нейронки отлично подходят для решения таких задач уже сейчас — а что будет дальше, мы и представить себе не можем (но подумать об этом приятно).

Как нейросети улучшают Поиск: что уже реализовано и какие у Алисы планы

ещё по теме