В конце кода скринкаста есть график функции потерь в зависимости от итерации, и с некоторого момента он вышел на плато. Почему график не меняется?
Ошибка в коде
Новые градиенты малы или равны нулю, и их учёт ничего не меняет
Наш нейрон научился всему, чему мог, на данной выборке
Неправильно выбрана функция потерь — при правильном выборе график должен меняться
Другие предметыКолледжОбучение нейронных сетейграфик функции потерьитерацияошибка в кодеградиенты малынейронная сетьвыборкафункция потерьобучение моделиplateauанализ данных
Когда мы наблюдаем график функции потерь, который выходит на плато и перестает изменяться, это может свидетельствовать о нескольких возможных причинах. Давайте разберем каждую из предложенных вами причин по порядку:
В итоге, наиболее вероятными причинами, почему график функции потерь выходит на плато, являются либо малые градиенты, либо то, что модель достигла своего максимума на текущей выборке. Рекомендуется проверить размер градиентов и, возможно, попробовать изменить параметры обучения, такие как скорость обучения, или использовать более сложные архитектуры модели для улучшения результатов.