为了更好的计算梯度下降,我们使用反向传播算法
梯度下降 (Gradient Descent)
$L(\theta )$ :损失函数 (Loss function)
问题在于$\bigtriangledown L(\theta )$可能是一个百万维的...
阅读全文...
公告
微博热搜
孙燕姿演唱会上的肖战
209014
王源演唱会
195228
分类