为了更好的计算梯度下降,我们使用反向传播算法
梯度下降 (Gradient Descent)
$L(\theta )$ :损失函数 (Loss function)
问题在于$\bigtriangledown L(\theta )$可能是一个百万维的...
阅读全文...
公告
微博热搜
鹿晗巡演四站定档
424720
张碧晨变装完全是仙女级别
140891
分类