第1章 绪论
1.1 研究背景与意义
1.2 Skyline查询概述
1.2.1 Skyline查询的定义
1.2.2 Skyline查询的问题
1.2.3 Skyline查询的应用
1.3 不确定数据流概述
1.3.1 不确定数据流的应用
1.3.2 不确定数据流的模型
1.3.3 不确定数据流的查询
1.4 不确定数据流的Skyline查询
1.4.1 不确定数据流的Skyline查询的应用
1.4.2 不确定数据流的Skyline查询的定义
1.4.3 不确定数据流的Skyline查询的挑战
1.5 Skyline查询的挑战
1.6 主要研究内容
1.7 组织结构
第2章 相关研究
2.1 基于不确定偏好关系的Skyline查询的研究
2.1.1 基于不确定数据的Skyline查询的研究
2.1.2 基于不完全数据的Skyline查询研究
2.1.3 基于不确定偏好关系的Skyline查询研究
2.1.4 基于数据流环境下的Skyline查询研究
2.2 并行与分布式Skyline查询研究
2.2.1 基于垂直划分的Skyline查询研究
2.2.2 基于水平划分的Skyline查询研究
2.2.3 基于角度划分的Skyline查询研究
2.3 并行Skyline查询研究
2.3.1 基于并行模型的并行Skyline查询方法研究
2.3.2 基于空间划分的并行Skyline查询方法研究
2.4 基于Skyline团组的Top-k支配查询研究
2.4.1 Skyline团组查询研究
2.4.2 Top-k支配查询研究
2.4.3 其他排序方法研究
2.5 数据流Skyline的查询研究
2.5.1 确定性数据流的Skyline查询研究
2.5.2 不确定数据流的Skyline查询研究
2.6 n-of-N Skyline查询研究
2.6.1 确定性n-of-N Skyline查询研究
2.6.2 不确定n-of-N Skyline查询研究
2.7 k-支配Skyline查询研究
2.7.1 数据集的k-支配Skyline查询
2.7.2 数据流的k-支配Skyline查询
2.8 本章小结
第3章 基于不确定偏好的Skyline查询
3.1 引言
3.2 问题定义
3.3 基于前缀的k层吸收技术
3.3.1 算法的理论基础
3.3.2 算法理论基础的不完整性
3.3.3 算法正确性的完整证明
3.4 Skyline概率计算
3.4.1 Parallel-sky算法
3.4.2 不相交集合概率计算
3.4.3 时间复杂度分析
3.5 动态算法
3.5.1 添加算法
3.5.2 删除算法
3.6 Parallel-all算法
3.7 实验
3.7.1 Parallel-sky算法性能分析
3.7.2 添加与删除算法的性能分析
3.8 本章小结
第4章 Skyline团组的并行计算方法
4.1 引言
4.2 问题定义
4.3 计算Skyline层次
4.3.1 并行计算方法
4.3.2 基于元组的分割和排序
4.3.3 Skyline层次的数据结构
4.3.4 与已知的Skyline层次相比较
4.3.5 与同一分块中的元组比较
4.3.6 更新全局Skyline层次
4.3.7 实例分析
4.3.8 时间复杂度分析
4.3.9 并行算法总结
4.4 查找Skyline团组
4.4.1 构建cell
4.4.2 并行计算Skyline团组
4.4.3 时间复杂度分析
4.5 实验
4.5.1 总体性能分析
4.5.2 计算Skyline层次性能分析
4.5.3 计算Skyline团组性能分析
4.6 本章小结
第5章 基于Skyline团组的Top-k支配查询
5.1 引言
5.2 问题定义
5.3 Skyline团组上的TKD查询
5.3.1 基于排列的Skyline团组
5.3.2 基于SUM函数的Skyline团组
5.3.3 基于MAX函数的Skyline团组
5.3.4 时间复杂度分析
5.3.5 基于MIN函数的Skyline团组
5.4 位图索引方法
5.4.1 计算团组的分数
5.4.2 位图索引压缩
5.5 实验分析
5.5.1 Skyline团组的输出大小
5.5.2 位图索引压缩比例
5.5.3 不同Skyline团组定义下的实验分析
5.5.4 不同数据分布情况下的实验分析
5.6 本章小结
第6章 基于区间树刺探的并行n-of-N Skyline查询方法
6.1 基本概念与问题描述
6.1.1 基本概念
6.1.2 问题描述
6.2 并行不确定n-of-N查询模型设计
6.2.1 并行n-of-N查询框架
6.2.2 窗口划分与流数据映射策略
6.2.3 查询区间编码策略
6.2.4 基于迭代的处理过程
6.3 并行不确定n-of-N查询算法设计
6.3.1 窗口划分算法与流数据映射算法
6.3.2 并行不确定n-of-NSkyline查询处理算法
6.3.3 查询区间计算算法
6.3.4 候选集合更新算法
6.3.5 刺探查询算法
6.4 实验结果与分析
6.4.1 实验环境设置
6.4.2 全局窗口长度对性能的影响
6.4.3 窗口滑动粒度对性能的影响
6.4.4 流数据的维度对性能的影响
6.4.5 计算节点数目对性能的影响
6.4.6 不同概率阈值对性能的影响
6.4.7 不同查询范围对性能的影响
6.5 本章小结
第7章 基于支配能力索引的并行k-支配Skyline查询方法
7.1 基本概念与问题描述
7.1.1 基本概念
7.1.2 问题描述
7.2 并行不确定k-支配查询模型设计
7.2.1 并行k-支配查询框架
7.2.2 基于窗口划分的流数据映射策略
7.2.3 基于支配能力索引结构的查询优化
7.2.4 并行迭代查询处理过程
7.3 并行不确定k-支配查询算法设计
7.3.1 基于窗口划分的流数据映射算法
7.3.2 并行不确定k-支配查询处理算法
7.3.3 流数据k-支配关系测试算法
7.3.4 局部滑动窗口更新算法
7.4 实验结果与分析
7.4.1 实验环境设置
7.4.2 查询规模对查询性能的影响
7.4.3 滑动粒度对查询性能的影响
7.4.4 数据维度对查询性能的影响
7.4.5 任务数目对查询性能的影响
7.4.6 概率阈值对查询性能的影响
7.4.7 维度范围对查询性能的影响
7.5 本章小结
第8章 结束语
8.1 工作总结
8.1.1 研究内容和创新点
8.1.2 主要贡献
8.2 研究展望
参考文献