随着神经网络层数的增加,会出现梯度消失或者梯度爆炸的问题,下面细说下问什么会出现:
起初的学习率固定。
下面来看几组通过增加隐藏层层数后的学习率变化图:
本文共 130 字,大约阅读时间需要 1 分钟。
随着神经网络层数的增加,会出现梯度消失或者梯度爆炸的问题,下面细说下问什么会出现:
起初的学习率固定。
下面来看几组通过增加隐藏层层数后的学习率变化图:
转载于:https://www.cnblogs.com/DjangoBlog/p/7699559.html