第一章 配置开发环境
第一节 Anaconda下载与安装
第二节 Jupyter基本操作
第三节 升级与维护
第二章 机器学习的基本概念
第一节 机器学习概念
第二节 建模准备
第三节 模型训练
第四节 建模流程
第三章 文件管理和KNN
第一节 设置工作文件夹
第二节 虚拟环境的设置
第三节 KNN算法原理
第四节 预测案例
第五节 K折交叉验证
第四章 线性回归
第一节 线性回归方程
第二节 误差分析
第三节 似然函数求解
第四节 回归求解
第五节 梯度下降
第六节 评价指标
第七节 案例
第五章 逻辑回归
第一节 Sigmod函数
第二节 逻辑回归本质
第三节 阈值
第四节 参数估计
第五节 评估指标
第六章 K—means聚类算法
第一节 聚类算法的特征
第二节 算法原理
第三节 常用参数
第四节 K—means优缺点
第七章 决策树
第一节 决策树历史
第二节 决策树原理
第三节 熵
第四节 构造实例
第五节 信息增益率和gini系数
第六节 回归决策树
第七节 剪枝方法
第八节 决策树优缺点
第八章 集成算法
第一节 随机森林
第二节 boosting算法
第三节 stacking模型
第四节 随机森林参数
第九章 AdaBoost算法
第一节 算法原理
第二节 算法流程
第三节 参数求解
第四节 AdaBoost参数
第十章 梯度提升树
第一节 GBDT’概述
第二节 数学流程
第三节 GBDT优缺点
第四节 GBDT调参
第十一章 降维算法
第一节 “维”的解释
第二节 。PCA与SvD
第十二章 朴素贝叶斯
第一节 朴素贝叶斯原理
第二节 朴素贝叶斯分类器
第三节 评估指标
第四节 朴素贝叶斯优缺点
第五节 应用场景
第十三章 LGBM算法
第一节 LGBM原理概述
第二节 LGBM相关技术
第三节 GOSS采样与直方图优化算法
第四节 LGBM数学推导
参考文献