跳转至

如何让计算机知道这个数字是一个5? 人能够从形状分辨,机器用特征量学习

端到端:从原始数据(输入)中获得目标结果(输出)的意思。

用训练数据进行学习 用验证数据进行评估(泛化能力)

过拟合:只学会训练数据(监督数据)

损失函数:神经网络的性能;这个网络对监督数据有多大程度不一致

  1. 均方误差
\[ E = \frac{1}{2} \sum_{k}(y_k - t_k)^2 \]

\(y_k\)是表示神经网络的输出,\(t_k\)表示监督数据,\(k\)表示数据的维数

  1. 交叉熵误差 衡量的是模型预测的概率分布与真实标签的概率分布之间的差异。

加条公式

4.2.3 mini-batch学习

用随机选择的小批量数据(mini-batch)作为全体训练数据的近似值。

4.3 数值微分

曲线面点上切线的导数 偏导数 - 维基百科,自由的百科全书 (wikipedia.org)