Пётр Зайдель, старший ML-инженер в Яндекс Музыке, рассказал, как ребята внедряли в сервис target-aware реалтайм-трансформер с ранним связыванием. Всё это — с деталями архитектуры модели, тонкостями пайплайна обучения, особенностями продакшен-инфраструктуры инференса и собственными инсайтами.