简介
谷斌主编的《数据仓库与数据挖掘实务(21世纪 高职高专规划教材)》力求通过浅显易懂的语言和贴 近生活的案例,深入浅出地介绍数据仓库与数据挖掘 技术的概念和 相关理论。本书内容覆盖数据仓库的概念、结构、设 计、使用、维护、优化方法,以SQL Server分析服务 器为例 介绍了数据仓库的具体构建和使用方法。在数据挖掘 部分,本书从数据挖掘的基础工作和流程开始,对常 见 的模型和方法做了全面介绍,并利用Clementine工具 介绍了如何通过工具实施真实的数据挖掘过程。 本书适合作为高职高专类院校电子商务、信息管 理、数据库营销等专业教材,也可作为数据分析方向 培 训教材。
目录
第1章 数据仓库与数据挖掘概述1.1 数据库与数据仓库1.1.1 数据的层次性1.1.2 数据仓库出现的原因1.1.3 数据仓库的概念1.1.4 数据仓库与数据库的差异1.1.5 数据仓库的商业应用1.2 数据分析与数据挖掘1.2.1 什么是数据挖掘1.2.2 数据挖掘的商业流程1.2.3 数据挖掘的典型应用1.2.4 基于电子商务的数据挖掘技术1.2.5 典型的数据挖掘方法1.3 商务智能思考题第2章 数据仓库分析2.1 数据仓库的生命周期2.1.1 数据仓库规划分析阶段2.1.2 数据仓库设计实施阶段2.1.3 数据仓库使用维护阶段2.1.4 数据仓库开发的特点2.2 数据仓库的基本体系结构2.2.1 外部数据源2.2.2 数据抽取2.2.3 抽取存储区2.2.4 数据清洗2.2.5 数据转换2.2.6 数据集市2.3 数据仓库的构造模式思考题第3章 数据仓库设计3.1 数据仓库中数据模型概述3.2 概念模型设计3.2.1 企业模型的建立3.2.2 数据模型的规范3.2.3 常见的概念模型3.3 逻辑模型设计3.3.1 数据仓库的数据综合3.3.2 数据仓库中的时间分割3.3.3 数据仓库中的数据组织3.3.4 数据仓库的粒度设计3.4 物理模型设计3.4.1 物理模型的设计要点3.4.2 事实表的设计3.4.3 维度表的设计3.4.4 物理模型的设计对数据仓库性能的影响思考题第4章 数据仓库的使用4.1 数据仓库与联机分析处理4.1.1 联机分析处理的基本概念4.1.2 OLAP与OLTP的区别4.1.3 OLAP带来的好处4.1.4 数据仓库与OLAP4.1.5 OLAP多维数据分析4.2 元数据4.2.1 元数据的概念4.2.2 元数据的作用4.2.3 元数据的使用4.3 数据仓库的管理与维护4.3.1 数据管理4.3.2 系统管理4.4 数据仓库的优化4.4.1 索引技术4.4.2 物化视图4.4.3 其他优化手段4.5 主流的数据仓库厂商及产品4.6 基于Analysis Services的数据仓库构建过程4.6.1 数据准备4.6.2 数据仓库的构建过程4.6.3 开展OLAP分析思考题第5章 数据预处理5.1 数据预处理的重要性5.2 数据清洗5.2.1 缺失数据处理5.2.2 噪声数据的处理5.2.3 不一致数据处理5.3 数据集成与转换5.3.1 数据集成5.3.2 数据转换5.4 数据规约5.4.1 数据立方合计5.4.2 维规约5.4.3 数据压缩5.4.4 数据块的消减5.5 离散化和概念层次树生成5.5.1 数据概念层次树生成5.5.2 类别概念层次树生成思考题第6章 数据挖掘基础6.1 数据挖掘的任务6.2 数据挖掘的实施6.2.1 数据挖掘的基本过程6.2.2 数据挖掘的实施难点6.3 知识表示方法6.3.1 产生式知识表示方法6.3.2 产生式系统6.3.3 其他知识表示方法思考题第7章 数据挖掘的主要方法7.1 关联规则挖掘7.1.1 关联规则的定义和属性7.1.2 关联规则的挖掘7.1.3 关联规则的分类7.1.4 关联规则挖掘的相关算法7.1.5 关联分析的实际应用7.2 分类与预测7.2.1 分类问题与预测问题7.2.2 决策树7.2.3 人工神经网络7.2.4 其他分类方法7.2.5 预测7.2.6 分类与预测的实际应用7.3 聚类分析7.3.1 聚类的定义7.3.2 聚类分析中的数据类型与结构7.3.3 层次方法7.3.4 划分方法7.3.5 聚类的实际应用7.4 遗传算法7.4.1 遗传算法的历史和现状7.4.2 遗传算法常用的操作算子及实施步骤7.5 文本挖掘7.5.1 文本挖掘的主要应用7.5.2 文本表示方法7.5.3 中文的分词7.6 Web挖掘与电子商务7.6.1 Web挖掘定义7.6.2 web挖掘与电子商务7.6.3 web挖掘的数据来源与类型7.6.4 Web使用模式挖掘思考题第8章 大数据8.1 大数据的由来8.1.1 大数据概念8.1.2 大数据的典型特征8.2 大数据处理的相关技术8.3 大数据的作用8.3.1 数据机遇8.3.2 数据回报8.4 大数据应用案例8.4.1 塔吉特百货孕妇营销分析8.4.2 试衣问的大数据应用8.4.3 路易斯维尔利用大数据治理空气污染问题8.4.4 阿里信用贷款和淘宝数据魔方8.4.5 大数据时代的总统选举,奥巴马团队如何处理数据参考文献
数据仓库与数据挖掘实务
- 名称
- 类型
- 大小
光盘服务联系方式: 020-38250260 客服QQ:4006604884
云图客服:
用户发送的提问,这种方式就需要有位在线客服来回答用户的问题,这种 就属于对话式的,问题是这种提问是否需要用户登录才能提问
Video Player
×
Audio Player
×
pdf Player
×
