Статья студента ФТИИ — на Interspeech 2026 в Сиднее 🎉
Статья студента ФТИИ — на Interspeech 2026 в Сиднее 🎉 Студент ФТИИ из лаборатории АИСТ — Иван Вяхирев — стал соавтором научной статьи, которую приняли на Interspeech 2026, одну из главных мировых конференций по распознаванию и обработке речи (ранг A по рейтингу CORE). Проходить она будет в Сиднее, так что осенью Иван летит в Австралию ✈️ Статья — про галлюцинации Whisper. Это популярная модель распознавания речи, которая иногда «дописывает» слова, которых в аудио не было. Иван с соавторами разобрались, почему так выходит: с ростом размера модели её внутренние слои проходят фазовый переход — внимание перестаёт опираться на сам звук и начинает «сжимать» представление, отрываясь от акустики. Отсюда и выдуманные фрагменты. Тема для команды не новая: сначала RASCAR представили постер про галлюцинации Whisper на летней школе AIRI, а теперь довели исследование до полноценной статьи на конференции уровня A. Соавторы Ивана — Кирилл Бородин и Грач Мкртчян из МТУСИ. Препринт уже на arXiv: https://arxiv.org/abs/2604.08591 Поздравляем Ивана и желаем удачного выступления в Сиднее! 👏