Но именно такие случаи и важно распознавать. Поэтому разработчики стараются применять более сложные методы, чем просто детектирование наличия лица и его сигнатуры.
Когда говорят об обучении алгоритма, обычно подразумевают обучение конкретной модели машинного или глубокого обучения. Но в случае с DeepDive были использованы уже готовые технологии, разработанные в Яндексе. Например, в компании есть отдел компьютерного зрения, предоставляющий сервис распознавания лиц, который был интегрирован в DeepDive. Эта технология применяется не только Кинопоиском, но и другими сервисами. Нейросеть не обучалась с нуля: готовая разработка была адаптирована для задач DeepDive.
Ошибки неизбежны
Распознавать лица в фильмах значительно сложнее, чем, например, в метро. В реальной жизни алгоритмы работают в контролируемых условиях: камеры размещены так, чтобы запечатлеть лицо с нужного ракурса, обеспечено хорошее освещение, а человек вынужден смотреть в объектив, например, проходя через турникет.
В кино всё иначе: актёры часто загримированы, камера может снимать со спины, сбоку или в тени, режиссёрские приёмы могут намеренно скрывать лицо, в сцене может быть злодей, личность которого нужно сохранить в тайне.
Бывают ситуации, когда два актёра проходят друг за другом, и их лица могут «перескочить»: если лицо одного актёра видно нечётко, алгоритм может ошибочно принять его за другого.