第1篇 原理篇
第1章 数据科学思维
1.1 数据科学的工作范式
1.2 数据分析方法和流程
1.2.1 发现问题
1.2.2 近因分析
1.2.3 根因分析
1.2.4 做出预测
1.2.5 制定方案
1.2.6 验证方案
1.3 数据挖掘方法论
1.3.1 CRISP-DM方法论
1.3.2 SEMMA方法论
1.4 金融行业数据挖掘场景
第2篇 技术篇
第2章 某银行贷款产品精准营销模型
2.1 数据介绍
2.2 商业分析
2.2.1 发现问题
2.2.2 诊断问题
2.2.3 明确目标
2.2.4 定性分析
2.3 数据理解
2.3.1 建立特征体系
2.4 数据准备
2.4.1 提取被解释变量
2.4.2 提取静态特征和时点特征
2.4.3 提取时期特征
2.4.4 提取预测用数据宽表
2.5 建模和评估
2.5.1 定量客户画像与数据清洗
2.5.2 建立逻辑回归模型
2.5.3 评估模型
2.6 模型运用的准备工作
2.7 流程回顾
第3章 多维特征的客户细分
3.1 客户细分
3.1.1 客户细分定义
3.1.2 客户细分类型
3.1.3 案例:银行多维度客户画像
3.2 预处理
3.2.1 填补缺失值
3.2.2 修订错误值
3.2.3 处理离散变量
3.2.4 正态化与标准化
3.3 维度分析
3.4 聚类
3.5 簇特征的解释
第4章 信用风险预测模型
4.1 信贷全生命周期风险管理
4.1.1 贷前阶段
……
第3篇 管理篇
6.2.1 场景介绍
6.2.2 数据整理与特征工程
6.2.3 数据清洗与特征初筛
6.2.4 分箱与WoE编码
6.2.5 相关性筛选
6.2.6 逐步回归建模
6.2.7 模型评估
6.3 行为评分卡的应用
6.3.1 额度管理
6.3.2 续卡或续贷策略
6.3.3 客户留存分析和挽留
6.3.4 风险监控
第7章 贷后催收模型(C卡)
7.1 催收评分卡
7.1.1 业务理解
7.1.2 数据理解
7.1.3 特征工程与模型构建
7.2 催收评分卡的应用
7.2.1 预催收阶段
7.2.2 早期催收阶段
第8章 申请反欺诈模型
8.1 业务理解
8.1.1 申请欺诈产生的背景
8.1.2 申请欺诈的分类
8.1.3 申请欺诈的应对
8.2 案例:申请反欺诈模型
8.2.1 异常特征构造
8.2.2 网络特征提取
8.2.3 构建识别模型
第9章 算法工程化
9.1 构建合理的项目结构
9.1.1 为什么要构建合理的项目结构
9.1.2 什么是一个数据科学项目应有的项目结构
9.2 如何编写规范的数据工程代码
9.2.1 代码可读性
9.2.2 数据处理性能