您好,欢迎光临上海图书公司! 登录
数据仓库与数据挖掘(Python+Hadoop+Hive微课视频版题库版全国高等学校计算机教育研究会十四五规划教材)/大数据与人工智能技术丛书
ISBN:9787302625735
作者:编者:魏伟一//张国治//秦红武|责编:王冰飞//吴彤云
定价:¥59.8
出版社:清华大学
版次:第1版
印次:第1次印刷
开本:4 平装
页数:260页
商品详情
目录

第1章  绪论
  1.1  数据仓库概述
    1.1.1  数据仓库的定义及特点
    1.1.2  数据仓库与操作型数据库的关系
    1.1.3  数据仓库的组成
    1.1.4  数据仓库的应用
    1.1.5  基于Hadoop/Spark的数据仓库技术
  1.2  数据挖掘概述
    1.2.1  数据挖掘的概念
    1.2.2  数据挖掘的主要任务
    1.2.3  数据挖掘的数据源
    1.2.4  数据挖掘使用的技术
    1.2.5  数据挖掘存在的主要问题
    1.2.6  数据挖掘建模的常用工具
    1.2.7  Python数据挖掘常用库
  1.3  数据仓库与数据挖掘的区别与联系
    1.3.1  数据仓库与数据挖掘的区别
    1.3.2  数据仓库与数据挖掘的联系
  1.4  小结
  习题1
第2章  认识数据
  2.1  属性及其类型
    2.1.1  属性
    2.1.2  属性类型
  2.2  数据的基本统计描述
    2.2.1  中心趋势度量
    2.2.2  数据散布度量
  2.3  数据可视化
    2.3.1  基于像素的可视化技术
    2.3.2  几何投影可视化技术
    2.3.3  基于图符的可视化技术
    2.3.4  层次可视化技术
    2.3.5  可视化复杂对象和关系
    2.3.6  高维数据可视化
    2.3.7  Python数据可视化
  2.4  数据对象的相似性度量吕
    2.4.1  数据矩阵和相异性矩阵
    2.4.2  标称属性的相似性度量
    2.4.3  二元属性的相似性度量
    2.4.4  数值属性的相似性度量
    2.4.5  序数属性的相似性度量
    2.4.6  混合类型属性的相似性
    2.4.7  余弦相似性
    2.4.8  距离度量的Python实现
  2.5  小结
  习题2
第3章  数据预处理
  3.1  数据预处理的必要性
    3.1.1  原始数据中存在的问题
    3.1.2  数据质量要求
  3.2  数据清洗
    3.2.1  数据清洗方法
    3.2.2  利用Pandas进行数据清洗
  3.3  数据集成
    3.3.1  数据集成过程中的关键问题
    3.3.2  利用Pandas合并数据
  3.4  数据标准化
    3.4.1  离差标准化数据
    3.4.2  标准差标准化数据
  3.5  数据归约
    3.5.1  维归约
    3.5.2  数量归约
    3.5.3  数据压缩
  ……
第4章  数据仓库与联机分析处理
第5章  数据仓库设计与开发
第6章  回归分析
第7章  关联规则挖掘
第8章  分类
第9章  聚类
第10章  神经网络与深度学习
第11章  离群点检测
第12章  文本和时序数据挖掘
第13章  数据挖掘案例
参考文献

最近浏览过的书籍