Как и в случае изображений, речевые входные данные являются неструктурированными, и поэтому для распознавания речи используют контролируемое обучение, при котором закодированные слова сопоставляются с помеченными обучающими образцами речи (существует целый ряд общедоступных речевых наборов для обучения ИИ).