Планируем GPU-нагрузку в Kubernetes: от стандартных механизмов до кастомных решений

3 декабря 2025

Краткий пересказ от YandexGPT

Макарий, как Senior SRE в Yandex Cloud не только участвовал в разработке Managed Service for Kubernetes, но и всегда любил в свободное время посмотреть, что интересного понавыпускали для «кубика». Kubernetes, как де‑факто стандарт оркестрации контейнеров, предлагает базовые механизмы для управления вычислительными ресурсами. Однако стандартный планировщик Kubernetes (kube‑scheduler) разрабатывался с учётом общих принципов балансировки нагрузки и не специализирован для уникальных особенностей рабочих GPU‑нагрузок. В статье предлагается рассмотреть весь спектр возможностей — от встроенных механизмов шедулинга K8s до специализированных планировщиков, таких как Volcano, Apache YuniKorn и KAI‑Scheduler. Также проанализиованы конкретные сценарии, в которых каждый из этих инструментов демонстрирует свои преимущества, предложены рекомендации по выбору оптимального решения для ваших рабочих GPU‑нагрузок.

Перейти

Авторы

Макарий Балашов

Яндекс Образование — Личный кабинет

Планируем GPU-нагрузку в Kubernetes: от стандартных механизмов до кастомных решений

Краткий пересказ от YandexGPT

Ещё по теме

Как и зачем мы написали собственное опенсорс-решение для бэкапов CloudNativePG в Stackland

Путь Яндекса от мониторинга до Observability Platform, Владимир Гордийчук

Автоматизированные dev-стенды и где они обитают / Аня Степко

SPQR — наше опенсорс-решение для горизонтального масштабирования Postgres

Открывашка из трубки домофона

Балансировка нагрузки в Яндексе: новые проблемы роста

System Design Interview: 60 минут до оффера / Владимир Невзоров

Почтовый Шарпей: как мы приручили 700+ шардов PostgreSQL

Как мы автоматизировали сеть в облаке и как нам с этим помогла Аннушка

Собственная инфраструктура для анализа кода

Как и зачем мы написали собственное опенсорс-решение для бэкапов CloudNativePG в Stackland

Путь Яндекса от мониторинга до Observability Platform, Владимир Гордийчук

Автоматизированные dev-стенды и где они обитают / Аня Степко