概述集成学习的基本概念、为何能降低方差与偏差、强调基学习器的多样性,并比较 Bagging、 Random Forest、 Boosting 的异同。
感知机仅对线性可分数据收敛,遇到 XOR 等非线性问题会震荡,需特征变换或引入非线性模型解决。
介绍基于规则的分类思想、规则评估与冲突处理,以及规则生成与 FOIL 信息增益方法。
涵盖分类误差与泛化、训练误差对比,解析欠拟合 / 过拟合原因、复杂度惩罚与剪枝策略,以及模型评估与交叉验证要点。
本文系统介绍了机器学习的五大框架:监督学习、非监督学习、半监督学习、强化学习及其他类型,并详细讲解了决策树等具体训练方法及其评估指标。