В сентябре 2016 года Microsoft хвастался, что создал самый эффективный алгоритм распознавания речи, который давал ошибку только в 6,3% случаев. В то же время, у IBM показатель индикатора ошибки составлял 6,9% случаев.
Несколько месяцев спустя, гигант из Редмонда снова побил рекорд, снизив коэффициент ошибок до 5,9%. Компания верила тогда, что это сравнимо с возможностями человека.
Однако, компания IBM возобновила соперничество. Последний алгоритм, который используется для распознавания речи, даёт ошибку только в 5,5% случаев. Одновременно, IBM провела исследования, в котором было показано, что для человека уровень такой ошибки составляет 5,1%.
IBM объясняет, что не собирается «почивать на лаврах». Цель – достижение уровня 5,1%. Тогда искусственный интеллект будет в состоянии понимать речь в такой же степени, как двое разговаривающих друг с другом людей.
Компания получила последний результат благодаря использованию двух языковых моделей – Long Short-Term Memory и WaveNet, а также трёх акустических моделей.