数据挖掘:概念、模型、方法和算法
基本介绍
书名:数据挖掘:概念、模型、方法和算法作者:(美)Mehmed KantardzicISBN:9787302307143页数:403出版社:清华大学出版社出版时间:2013年装帧:平装开本:16字数:655000出版信息
拼音题名
shu ju wa jue
其它题名
并列题名
ISBN
978-7-302-30714-3
责任者
(美)Mehmed Kantardzic着
出版者
清华大学出版社
出版地
出版时间
2013
中图分类号
TP311.13
附注
摘要
本书全面讲述了数据挖掘的概念、模型、方法和算法,包括14章和2个附录,详细讲述了从数据挖掘的基本概念到数据挖掘的整个过程,以及数据挖掘工具及其典型套用领域。
目录
第1章 数据挖掘的概念
1.1 概述
1.2 数据挖掘的起源
1.3 数据挖掘过程
1.4 大型数据集
1.5 数据仓库
1.7 本书结构安排
1.8 複习题
1.9 参考书目
第2章 数据準备
2.1 原始数据的表述
2.2 原始数据的特性
2.3 原始数据的转换
2.3.1 标準化
2.3.2 数据平整
2.3.3 差值和比率
2.4 丢失数据
2.5 时间相关数据
2.7 複习题
2.8 参考书目
第3章 数据归约
3.1 大型数据集的维度
3.2 特徵归约
3.2.1 特徵选择
3.2.2 特徵提取
3.3 re1ief算法
3.5 主成分分析
3.6 值归约
3.7 特徵离散化:chimerge技术
3.8 案例归约
3.9 複习题
3.10 参考书目
第4章 从数据中学习
4.1 学习机器
4.4 常见的学习任务
4.5 支持向量机
4.6 knn:最近邻分类器
4.7 模型选择与泛化
4.8 模型的评估
4.9 90%準确的情形
4.10 複习题
4.11 参考书目
第5章 统计方法
5.1 统计推断
5.2 评测数据集的差异
5.3 贝叶斯定理
5.5 方差分析
5.6 对数回归
5.7 对数—线性模型
5.8 线性判别分析
5.9 複习题
5.10 参考书目
第6章 决策树和决策规则
6.1 决策树
6.2 c4.5算法:生成决策树
6.3 未知属性值
6.4 修剪决策树
6.5 c4.5算法:生成决策规则
6.6 cart算法和gini指标
6.7 决策树和决策规则的局限性
6.8 複习题
6.9 参考书目
第7章 人工神经网路
7.1 人工神经元的模型
7.2 人工神经网路的结构
7.3 学习过程
7.4 使用ann完成的学习任务
7.4.2 模式识别
7.5 多层感知机
7.6 竞争网路和竞争学习
7.7 som
7.8 複习题
7.9 参考书目
第8章 集成学习
8.1 集成学习方法论
8.3 bagging和boosting
8.4 adaboost算法
8.5 複习题
8.6 参考书目
第9章 聚类分析
9.1 聚类的概念
9.2 相似度的度量
9.3 凝聚层次聚类
9.4 分区聚类
9.5 增量聚类
9.6 dbscan算法
9.7 birch算法
9.8 聚类验证
9.9 複习题
9.10 参考书目
第10章 关联规则
10.1 购物篮分析
10.2 apriori算法
10.3 从频繁项集中得到关联规则
10.4 提高apriori算法的效率
10.5 fp增长方法
10.6 关联分类方法
10.7 多维关联规则挖掘
10.8 複习题
10.9 参考书目
第11章 web挖掘和文本挖掘
11.1 web挖掘
11.2 web内容、结构与使用挖掘
11.3 hits和logsom算法
11.4 挖掘路径遍历模式
11.5 pagerank算法
11.6 文本挖掘
11.7 潜在语义分析
11.8 複习题
11.9 参考书目
第12章 数据挖掘高级技术
12.1 图挖掘
12.2 时态数据挖掘
12.2.1 时态数据表示
12.2.2 序列之间的相似性度量
12.2.3 时态数据模型
12.2.4 数据挖掘
12.3 空间数据挖掘(sdm)
12.4 分散式数据挖掘(ddm)
12.5 关联并不意味着存在因果关係
12.6 数据挖掘的隐私、安全及法律问题
12.7 複习题
12.8 参考书目
第13章 遗传算法
13.1 遗传算法的基本原理
13.2 用遗传算法进行最佳化
13.2.2 适合度估计
13.2.3 选择
13.2.4 交叉
13.2.5 突变
13.3 遗传算法的简单例证
13.3.1 表述
13.3.2 初始群体
13.3.3 评价
13.3.4 交替
13.3.5 遗传运算元
13.3.6 评价(第二次叠代)
13.4 图式
13.5 旅行推销员问题
13.6 使用遗传算法的机器学习
13.6.1 规则交换
13.6.2 规则概化
13.6.3 规则特化
13.6.4 规则分割
13.7 遗传算法用于聚类
13.8 複习题
13.9 参考书目
第14章 模糊集和模糊逻辑
14.1 模糊集
14.2 模糊集的运算
14.3 扩展原理和模糊关係
14.5 多因子评价
14.6 从数据中提取模糊模型
14.7 数据挖掘和模糊集
14.8 複习题
14.9 参考书目
第15章 可视化方法
15.1 感知和可视化
15.2 科学可视化和信息可视化
15.3 平行坐标
15.4 放射性可视化
15.5 使用自组织映射进行可视化
15.6 数据挖掘的可视化系统
15.7 複习题
15.8 参考书目
附录a 数据挖掘工具
附录b 数据挖掘套用
本文由'念霜少女'发布,不代表演示站立场,转载/删除联系作者,如需删除请-> 关于侵权处理说明。