权重衰退 简单地说,就是在损失函数中对权重进行惩罚 使用均方范数作为硬件限制 使用均方范数作为柔性限制 演示 参数更新法则 总结 丢弃法 动机 无偏差的加入噪音 使用丢弃法 推理中的丢弃法 总结 数值稳定性 神经网络的梯度 数值稳定性的常见两个问题 例子 梯度爆炸 梯度消失 总结