前言
第1章 引言
1.1 统计分析的未来
1.2 常见统计分析软件比较
1.3 R语言软件的下载、安装及基本操作
1.3.1 下载和安装R语言软件
1.3.2 R语言软件基本操作与控制
1.3.3 常用的R程序包
1.3.4 RStudio
1.3.5 Markdown
1.4 Python语言软件的下载、安装及运行
1.4.1 下载与安装Python语言软件
1.4.2 Anaconda
1.4.3 运行Python
1.5 本章小结
1.6 练习题
1.7 实验题
第2章 R语言编程基础
2.1 R语言版的“Hello World!”
2.2 R语言脚本运行
2.3 R语言常量和变量
2.4 R语言对象基本操作
2.4.1 R语言对象属性
2.4.2 列出对象与删除对象
2.5 R语言数据类型
2.5.1 向量
2.5.2 数组
2.5.3 矩阵
2.5.4 数据框
2.5.5 列表
2.6 R语言流程控制
2.6.1 分支条件语句
2.6.2 循环语句
2.7 R语言自定义函数
2.8 本章小结
2.9 练习题
2.10 实验题
第3章 R语言数据处理
3.1 数据的输入与输出
3.1.1 终端输出
3.1.2 读取数据
3.1.3 保存数据
3.2 数据选择
3.2.1 常见数据操作函数
3.2.2 取子集
3.2.3 常见数据选择函数
3.3 数据整理
3.3.1 修改变量名称
3.3.2 增加新变量
3.3.3 彻底删除新变量
3.3.4 类型转换函数
3.3.5 排序
3.3.6 数据合并
3.3.7 缺失数据处理
3.4 本章小结
3.5 练习题
3.6 实验题
第4章 R语言可视化
4.1 R语言基础绘图
4.1.1 高级绘图函数
4.1.2 低级绘图函数
4.1.3 交互式绘图函数
4.1.4 使用图形参数
4.1.5 图形保存
4.2 ggplot2绘图包
4.2.1 ggplot语法
4.2.2 ggplot绘图函数
4.3 增强型绘图plotly包
4.3.1 将ggplot2对象转换为plotly对象
4.3.2 直接创建plotly对象
4.4 交互式动态网页Shiny包
4.4.1 Shiny简介
4.4.2 Shiny应用程序的结构
4.4.3 编写简单的Shiny应用
4.4.4 运行Shiny应用程序
4.5 本章小结
4.6 练习题
4.7 实验题
第5章 R语言随机抽样和随机数
5.1 随机变量分布
5.2 随机抽样
5.3 生成已知分布的随机数
5.3.1 R语言函数生成随机数
5.3.2 逆变换法生成随机数
5.3.3 舍选法
5.4 随机数的应用
5.4.1 估计参数
5.4.2 验证大数定律
5.4.3 验证中心极限定理
5.5 本章小结
5.6 练习题
5.7 实验题
第6章 R语言基本统计推断
6.1 R语言汇总统计量函数
6.2 R语言参数估计方法
6.2.1 点估计
6.2.2 区间估计
6.3 假设检验
6.3.1 t检验
6.3.2 二项分布的总体检验
6.3.3 泊松分布的总体检验
6.3.4 样本比例的总体检验
6.3.5 方差分析
6.4 非参数统计推断
6.4.1 K-S检验
6.4.2 Wilcoxon符号秩检验
6.4.3 Wilcoxon秩和检验
6.4.4 Pearson卡方检验
6.4.5 Fisher精确检验
6.5 本章小结
6.6 练习题
6.7 实验题
第7章 R语言回归分析
7.1 一元回归模型
7.1.1 R语言回归函数
7.1.2 一元回归分析示例
7.2 多元回归模型
7.2.1 多元回归分析示例
7.2.2 处理类别变量
7.2.3 回归系数的置信区间
7.2.4 标准化的回归系数
7.3 回归模型的拟合优度
7.3.1 R
7.3.2 调整后的R
7.4 回归模型诊断
7.4.1 残差的分类
7.4.2 线性假设诊断
7.4.3 残差分析和异常点检测
7.4.4 多重共线性检测
7.5 模型选择
7.5.1 最佳子集回归
7.5.2 逐步回归
7.6 模型的预测
7.6.1 回归模型的预测
7.6.2 标准化数据的预测
7.7 本章小结
7.8 练习题
7.9 实验题
第8章 R语言大数据分析
8.1 R语言效率编程
8.1.1 检查代码运行时间
8.1.2 优化R循环
8.1.3 向量化运算
8.1.4 优先使用base包命令
8.1.5 使用C++编程
8.1.6 使用apply族函数
8.2 内存管理
8.2.1 内存使用
8.2.2 内存清理
8.3 R 并行处理包
8.3.1 parallel软件包
8.3.2 foreach软件包
8.4 R 高效读取大数据
8.4.1 提升读取效率的函数
8.4.2 在内存外存储数据
8.5 本章小结
8.6 练习题
8.7 实验题
第9章 Python语言基础
9.1 在R中调用Python
9.2 Python入门
9.2.1 Python版“Hello World!”
9.2.2 关键字和标识符
9.2.3 变量和常量
9.2.4 Python语句、缩进和注释
9.2.5 Python数据类型
9.2.6 数据类型转换
9.2.7 运算符和操作对象
9.3 Python数据结构
9.3.1 序列
9.3.2 列表
9.3.3 元组
9.3.4 字符串
9.3.5 字典
9.4 Python流程控制
9.4.1 条件语句
9.4.2 循环语句
9.5 函数
9.5.1 调用函数
9.5.2 定义函数
9.5.3 函数参数
9.5.4 匿名函数
9.5.5 pass语句
9.5.6 Python模块
9.6 本章小结
9.7 练习题
9.8 实验题
第10章 Python数据处理
10.1 数据文件的读写操作
10.1.1 数据的读取
10.1.2 数据的写入
10.1.3 文本文件的操作
10.1.4 CSV文件的操作
10.2 NumPy科学计算库
10.2.1 NumPy的安装
10.2.2 NumPy中的数组创建
10.2.3 数组操作
10.2.4 数组索引
10.2.5 多维数组
10.2.6 ufunc函数
10.2.7 NumPy随机数
10.3 Pandas数据处理库
10.3.1 Pandas数据结构
10.3.2 Pandas数据索引
10.3.3 利用Pandas查询数据
10.4 Matplotlib绘图库
10.4.1 安装和导入Matplotlib
10.4.2 plot绘图
10.4.3 常见统计图形
10.5 本章小结
10.6 练习题
10.7 实验题
参考文献