深度学习从0到1
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3.5 模型的收敛条件

通常模型的收敛条件可以有以下3个:

(1)loss小于某个预先设定的较小的值;

(2)两次迭代之间权值的变化已经很小了;

(3)设定最大迭代次数,当迭代次数超过最大迭代次数时停止。

第1个条件很容易理解,模型的训练目的就是为了减小loss,那么我们可以设定一个比较小的数值,每一次训练的时候,我们都同时计算一下loss的大小,当loss小于某个预先设定的阈值时,就可以认为模型收敛了,那么就可以结束训练。

第2个条件的意思是,每一次训练我们可以记录模型权值的变化,如果我们发现两次迭代之间模型的权值变化已经很小了,则说明模型已经几乎不需要做权值的调整了,那么就可以认为模型收敛,可以结束训练。

第3个条件是用得最多的方式。我们可以预先设定一个比较大的模型迭代周期,如迭代100次,或者10000次,或者1000000次等(需要根据实际情况来选择)。模型完成规定次数的训练之后,我们就可以认为模型训练完毕。如果达到我们设置的训练次数以后我们发现模型还没有训练好,那我们可以继续增加训练次数,让模型继续训练就可以了。