Просто запомните, что если что-то пошло не так, решение заключается в функции потерь, которая включает прямое распространение и вычисление значения ошибки (например, среднеквадратичной ошибки или перекрестной энтропии).
Определить, какие значения должны получаться в предыдущем слое, можно по значениям, которые должны получаться в следующем слое, умножив выход следующего слоя на матрицу весов между слоями. Таким способом последующие слои могут сообщать предыдущим, какой сигнал им нужен, чтобы в итоге выявить корреляцию с выходом. Такое перекрестное взаимовлияние называют обратным распространением.
универсальное эмпирическое правило: всегда передавать в сеть достаточный объем информации, где «достаточность» определяется довольно свободно, например, сколько потребуется человеку, чтобы сделать тот же прогноз.
Некоторые люди (например, маленькие дети) просто пытаются вставить колышек во все отверстия, пока он не встанет (параметрический подход). Ребенок постарше уже может подсчитать число сторон (четыре) у колышка и найти отверстие с тем же числом сторон (непараметрический подход). Параметрические модели обычно используют метод проб и ошибок, тогда как непараметрические модели обычно основаны на вычислениях.
ственные ему области машинного обучения, стремится автоматизировать интеллект постепенно. В последние несколько лет были достигнуты большие успехи в этой сфере, превосходящие предыдущие достижения в области компьютерного зрения, распознавания речи, машинного пе