图书介绍

数据仓库与数据挖掘【2025|PDF下载-Epub版本|mobi电子书|kindle百度云盘下载】

数据仓库与数据挖掘
  • 廖开际主编 著
  • 出版社: 北京市:北京大学出版社
  • ISBN:9787301143131
  • 出版时间:2008
  • 标注页数:252页
  • 文件大小:61MB
  • 文件页数:263页
  • 主题词:数据库系统-高等学校-教材;数据采集-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据仓库与数据挖掘PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 企业数据资源管理1

1.1数据资源的概念2

企业资源2

数据资源3

数据资源管理及其发展历程3

1.2数据资源管理的意义5

信息系统进入成熟阶段的重要标志5

解决企业内部数据不一致问题的根本途径5

数据资源的管理和应用是取得竞争优势的关键6

1.3信息资源管理的相关技术7

数据资源管理的技术框架7

技术框架中的构成要素8

技术框架中各部分的关联10

1.4企业通过数据仓库与数据挖掘获得竞争优势11

本章小结14

思考与练习19

第2章 数据仓库的概念与结构22

2.1数据仓库的概念23

数据仓库的定义23

数据仓库的特征24

数据集市26

2.2数据仓库系统27

数据源27

数据仓库管理层28

数据仓库工具集28

2.3数据仓库中的数据组织29

粒度的概念30

面向主题的数据组织30

数据分割32

元数据的管理33

本章小结36

思考与练习39

第3章 数据仓库的设计与开发42

3.1数据仓库的开发过程及特点43

数据仓库开发的生命周期44

数据仓库开发的特点45

数据仓库设计的主要内容45

3.2数据模型设计47

概念模型设计47

逻辑模型设计48

物理模型设计55

3.3数据仓库的粒度设计57

设计步骤57

设计原则59

3.4创建数据仓库的基本步骤60

建立运营环境文档60

选择数据仓库的实现技术61

设计数据仓库模型62

创建数据准备区62

创建数据仓库数据库62

从操作型系统中抽取数据62

清理和转换数据63

将数据装入数据仓库数据库63

准备显示信息64

将数据分发到数据集市64

本章小结64

思考与练习69

第4章 联机分析处理75

4.1 OLAP的基本概念76

OLAP的发展背景76

联机分析处理是数据仓库系统的一个应用77

4.2 OLAP与多维分析79

OLAP的一些基本概念79

理解数据立方80

OLAP的基本分析操作81

4.3 OLAP的分类87

ROLAP87

MOLAP87

HOLAP87

4.4 OLAP的特性与不足88

OLAP的特性88

OLAP的不足89

4.5 SQL Server 2005统一维度模型90

结构90

优点92

本章小结93

思考与练习94

第5章 数据挖掘概述98

5.1数据挖掘技术的由来100

信息爆炸但知识贫乏100

支持数据挖掘技术的基础101

从商业数据到商业信息的进化101

数据挖掘逐渐演变的过程102

5.2数据挖掘的定义102

技术角度的定义102

商业角度的定义103

数据挖掘与传统分析方法的区别103

数据挖掘和数据仓库103

数据挖掘和OLAP104

数据挖掘、机器学习和统计104

5.3数据挖掘发现的知识类型105

广义知识105

关联知识105

分类知识106

预测知识106

偏差知识107

5.4数据挖掘流程107

知识发现过程107

数据挖掘对象109

数据挖掘任务112

数据挖掘分类115

数据预处理117

5.5数据挖掘的方法和技术121

信息论方法121

集合论方法121

神经网络方法122

遗传算法122

模糊数学124

公式发现124

可视化技术124

知识表示124

本章小结126

思考与练习129

第6章 数据预处理133

6.1数据预处理的目的及方法134

原始数据中存在的问题135

数据预处理的常用方法135

6.2数据清理136

处理空缺值137

噪声数据的处理138

6.3数据集成141

模式匹配141

数据冗余142

数据冲突143

6.4数据变换143

6.5数据归约146

数据立方体聚集146

维归约147

数据压缩149

数值归约150

离散化和概念分层153

本章小结155

思考与练习157

第7章 数据挖掘中的常用算法162

7.1 Apriori算法163

基本原理163

Apriori算法的基本思想与分析164

从频繁项集产生关联规则166

7.2决策树算法167

信息论的基本原理168

ID3算法169

树剪枝172

由决策树提取分类规则173

7.3神经网络算法173

神经网络的基本原理174

反向传播模型175

定义神经网络拓扑结构178

神经网络的工作过程179

7.4聚类分析180

聚类分析的概念180

聚类分析中的数据类型180

几种主要的聚类分析方法184

K_means聚类分析算法185

本章小结187

思考与练习189

第8章 SQL Server数据仓库与数据挖掘工具及其应用197

8.1 SQL Server 2005的功能构架198

8.2 SQL Server数据仓库设计与数据挖掘准备199

SQL Server数据仓库创建思路199

SQL Server数据挖掘过程200

案例数据准备201

8.3 SQL Server集成服务203

SQL Server集成服务的作用203

控制流204

数据流204

设计和使用ETL206

8.4 SQL Server分析服务209

创建Analysis Services项目209

定义数据源210

定义数据源视图212

用Analysis Services创建维与多维数据集214

部署Analysis Services项目218

8.5 SQL Server中的数据挖掘工具与应用219

8.6 SQL Server报表服务222

创建报表222

使用报表226

本章小结227

思考与练习230

附录A 一个简易的数据挖掘工具——Weka232

参考文献252

热门推荐