1. 首页 > 经验  > 正文

数据挖掘:概念、模型、方法和算法

数据挖掘:概念、模型、方法和算法

《数据挖掘——概念、模型、方法和算法》是一本由清华大学出版社在2004年出版的书籍。作为一本教科书,本书全面讲述了数据挖掘的概念、模型、方法和算法。本书共包括13章和2个附录,全面、详细地讲述了从数据挖掘的基本概念到数据挖掘的整个过程,以及数据挖掘工具及其典型套用领域。本书编写严谨、内容权威、结构合理科学规範、语言流畅,特别适合作为高等院校数据挖掘课程的教科书,还适合作为数据挖掘研究人员必备的参考书。

基本介绍

书名:数据挖掘:概念、模型、方法和算法作者:(美)Mehmed KantardzicISBN:9787302307143页数:403出版社:清华大学出版社出版时间:2013年装帧:平装开本:16字数:655000 

出版信息

拼音题名
shu ju wa jue
其它题名
并列题名
ISBN
978-7-302-30714-3
责任者
(美)Mehmed Kantardzic着
出版者
清华大学出版社
出版地
出版时间
2013
中图分类
TP311.13
附注
国外计算机科学经典教材

摘要

本书全面讲述了数据挖掘的概念、模型、方法和算法,包括14章和2个附录,详细讲述了从数据挖掘的基本概念到数据挖掘的整个过程,以及数据挖掘工具及其典型套用领域。

目录

第1章 数据挖掘的概念
1.1 概述
1.2 数据挖掘的起源
1.3 数据挖掘过程
1.4 大型数据集
1.5 数据仓库
1.6 数据挖掘的商业方面:为什幺数据挖掘项目失败
1.7 本书结构安排
1.8 複习题
1.9 参考书目
第2章 数据準备
2.1 原始数据的表述
2.2 原始数据的特性
2.3 原始数据的转换
2.3.1 标準化
2.3.2 数据平整
2.3.3 差值和比率
2.4 丢失数据
2.5 时间相关数据
2.7 複习题
2.8 参考书目
第3章 数据归约
3.1 大型数据集的维度
3.2 特徵归约
3.2.1 特徵选择
3.2.2 特徵提取
3.3 re1ief算法
3.4 特徵排列的熵度量
3.5 主成分分析
3.6 值归约
3.7 特徵离散化:chimerge技术
3.8 案例归约
3.9 複习题
3.10 参考书目
第4章 从数据中学习
4.1 学习机器
4.2 统计学习原理
4.4 常见的学习任务
4.5 支持向量机
4.6 knn:最近邻分类器
4.7 模型选择与泛化
4.8 模型的评估
4.9 90%準确的情形
4.9.1 保险欺诈检测
4.9.2 改进心脏护理
4.10 複习题
4.11 参考书目
第5章 统计方法
5.1 统计推断
5.2 评测数据集的差异
5.3 贝叶斯定理
5.5 方差分析
5.6 对数回归
5.7 对数—线性模型
5.8 线性判别分析
5.9 複习题
5.10 参考书目
第6章 决策树和决策规则
6.1 决策树
6.2 c4.5算法:生成决策树
6.3 未知属性
6.4 修剪决策树
6.5 c4.5算法:生成决策规则
6.6 cart算法和gini指标
6.7 决策树和决策规则的局限性
6.8 複习题
6.9 参考书目
第7章 人工神经网路
7.1 人工神经元的模型
7.2 人工神经网路的结构
7.3 学习过程
7.4 使用ann完成的学习任务
7.4.2 模式识别
7.5 多层感知
7.6 竞争网路和竞争学习
7.7 som
7.8 複习题
7.9 参考书目
第8章 集成学习
8.1 集成学习方法论
8.2 多学习器组合方案
8.3 bagging和boosting
8.4 adaboost算法
8.5 複习题
8.6 参考书目
第9章 聚类分析
9.1 聚类的概念
9.2 相似度的度量
9.3 凝聚层次聚类
9.4 分区聚类
9.5 增量聚类
9.6 dbscan算法
9.7 birch算法
9.8 聚类验证
9.9 複习题
9.10 参考书目
第10章 关联规则
10.1 购物篮分析
10.2 apriori算法
10.3 从频繁项集中得到关联规则
10.4 提高apriori算法的效率
10.5 fp增长方法
10.6 关联分类方法
10.7 多维关联规则挖掘
10.8 複习题
10.9 参考书目
第11章 web挖掘和文本挖掘
11.1 web挖掘
11.2 web内容、结构与使用挖掘
11.3 hits和logsom算法
11.4 挖掘路径遍历模式
11.5 pagerank算法
11.6 文本挖掘
11.7 潜在语义分析
11.8 複习题
11.9 参考书目
第12章 数据挖掘高级技术
12.1 图挖掘
12.2 时态数据挖掘
12.2.1 时态数据表示
12.2.2 序列之间的相似性度量
12.2.3 时态数据模型
12.2.4 数据挖掘
12.3 空间数据挖掘(sdm)
12.4 分散式数据挖掘(ddm)
12.5 关联并不意味着存在因果关係
12.6 数据挖掘的隐私、安全及法律问题
12.7 複习题
12.8 参考书目
第13章 遗传算法
13.1 遗传算法的基本原理
13.2 用遗传算法进行最佳
13.2.1 编码方案和初始
13.2.2 适合度估计
13.2.3 选择
13.2.4 交叉
13.2.5 突变
13.3 遗传算法的简单例证
13.3.1 表述
13.3.2 初始群体
13.3.3 评价
13.3.4 交替
13.3.5 遗传运算元
13.3.6 评价(第二次叠代)
13.4 图式
13.5 旅行推销员问题
13.6 使用遗传算法的机器学习
13.6.1 规则交换
13.6.2 规则概化
13.6.3 规则特化
13.6.4 规则分割
13.7 遗传算法用于聚类
13.8 複习题
13.9 参考书目
第14章 模糊集和模糊逻辑
14.1 模糊集
14.2 模糊集的运算
14.3 扩展原理和模糊关係
14.4 模糊逻辑和模糊推理系统
14.5 多因子评价
14.6 从数据中提取模糊模型
14.7 数据挖掘和模糊集
14.8 複习题
14.9 参考书目
第15章 可视化方法
15.1 感知和可视化
15.2 科学可视化和信息可视化
15.3 平行坐标
15.4 放射性可视化
15.5 使用自组织映射进行可视化
15.6 数据挖掘的可视化系统
15.7 複习题
15.8 参考书目
附录a 数据挖掘工具
附录b 数据挖掘套用

本文由'念霜少女'发布,不代表演示站立场,转载/删除联系作者,如需删除请-> 关于侵权处理说明