目录

  1. 经验误差与过拟合
  2. 评估方法
    1. 留出法
    2. 交叉验证法
    3. 自助法
  3. 性能度量
  4. 比较检验
  5. 偏差与方差

经验误差与过拟合

  错误率:分类错误的样本数占样本总数的比例。m个样本中有a个样本分类错误,则错误率E=a/m。
  精度:分类正确的样本数占样本总数的比例。精度=1-错误率。
  误差:学习器实际预测的输出与样本的真实输出之间的差异。训练集上的误差称为“训练误差”或“经验误差”,在新样本上的误差称为“泛化误差”。
  过拟合:把训练样本自身的一些特点当做所有样本的一般性质,泛化性能下降。
  欠拟合:对训练样本的一般性质尚未学好,学习能力过低。


  我们的目标是在新样本上表现好的学习器,即泛化误差小。当学习器把训练样本学的太好时,可能会出现过拟合情况。欠拟合比较容易客服,如增加训练轮数等,而过拟合是无法彻底避免的,只能缓解或者说减小其风险。
  面对具体任务时,往往有多种算法可供选择,以及不同的参数配置。选择算法、配置参数的过程就叫做“模型选择”。理想的解决方案是对候选模型的泛化误差进行评估,选择泛化误差最小的模型。

评估方法

  训练集:用来训练学习器的数据集。
  测试集:用来测试学习器对新样本判别能力的数据集。在测试集上的“测试误差”将作为泛化误差的近似。测试集应尽可能与训练集互斥。
  现有包含m个样例的数据集D={(x1,y1), (x2,y2), …, (xm,ym)},既要训练又要测试,将D分为训练集S和测试T。

留出法

交叉验证法

自助法

性能度量

比较检验

偏差与方差