图书介绍
R语言数据挖掘方法及应用【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

- 薛薇编著 著
- 出版社: 北京:电子工业出版社
- ISBN:9787121283277
- 出版时间:2016
- 标注页数:392页
- 文件大小:44MB
- 文件页数:406页
- 主题词:程序语言-程序设计-高等学校-教材;数据采集-高等学校-教材
PDF下载
下载说明
R语言数据挖掘方法及应用PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1篇 起步篇:R语言数据挖掘入门并不难2
第1章 数据挖掘与R语言概述2
1.1 为什么要学习数据挖掘和R语言2
1.2 什么是数据挖掘3
1.3 数据挖掘能给出什么4
1.3.1 数据挖掘结果有哪些呈现方式5
1.3.2 数据挖掘结果有哪些基本特征6
1.4 数据挖掘能解决什么问题8
1.4.1 数据预测8
1.4.2 发现数据的内在结构10
1.4.3 发现关联性10
1.4.4 模式甄别12
1.5 数据挖掘解决问题的思路14
1.6 数据挖掘有哪些典型的商业应用17
1.6.1 数据挖掘在客户细分中的应用17
1.6.2 数据挖掘在客户流失分析中的应用19
1.6.3 数据挖掘在营销响应分析中的应用20
1.6.4 数据挖掘在交叉销售中的应用20
1.6.5 数据挖掘在欺诈甄别中的应用21
1.7 R语言入门需要知道什么22
1.7.1 什么是R的包22
1.7.2 如何获得R23
1.7.3 R如何起步24
1.7.4 R的基本操作和其他29
第2章 R语言数据挖掘起步:R对象和数据组织33
2.1 什么是R的数据对象33
2.1.1 R的数据对象有哪些类型33
2.1.2 如何创建和访问R的数据对象34
2.2 如何用R的向量组织数据35
2.2.1 创建只包含一个元素的向量35
2.2.2 创建包含多个元素的向量36
2.2.3 访问向量中的元素38
2.3 如何用R的矩阵组织数据40
2.3.1 创建矩阵40
2.3.2 访问矩阵中的元素42
2.4 如何用R的数据框组织数据45
2.4.1 创建数据框46
2.4.2 访问数据框47
2.5 如何用R的数组、列表组织数据49
2.5.1 创建和访问数组49
2.5.2 创建和访问列表51
2.6 R数据对象的相互转换52
2.6.1 不同存储类型之间的转换52
2.6.2 不同结构类型之间的转换54
2.7 如何将外部数据组织到R数据对象中58
2.7.1 将文本数据组织到R对象中58
2.7.2 将SPSS数据组织到R对象中61
2.7.3 将数据库和Excel表数据组织到R对象中62
2.7.4 将网页表格数据组织到R对象中64
2.7.5 R有哪些自带的数据包65
2.7.6 如何将R对象中的数据保存起来67
2.8 R程序设计需哪些必备知识67
2.8.1 R程序设计涉及哪些基本概念67
2.8.2 R有哪些常用的系统函数68
2.8.3 用户自定义函数提升编程水平75
2.8.4 如何提高R程序处理的能力77
2.9 R程序设计与数据整理综合应用81
2.9.1 综合应用一:数据的基本处理81
2.9.2 综合应用二:如何将汇总数据还原为原始数据82
第3章 R语言数据挖掘初体验:对数据的直观印象84
3.1 数据的直观印象85
3.1.1 R的数据可视化平台是什么85
3.1.2 R的图形组成和图形参数86
3.1.3 R的图形边界和布局87
3.1.4 如何修改R的图形参数89
3.2 如何获得单变量分布特征的直观印象89
3.2.1 核密度图:车险理赔次数的分布特点是什么89
3.2.2 小提琴图:不同车型车险理赔次数的分布有差异吗92
3.2.3 克利夫兰点图:车险理赔次数存在异常吗94
3.3 如何获得多变量联合分布的直观印象96
3.3.1 曲面图和等高线图96
3.3.2 二元核密度曲面图:投保人年龄和车险理赔次数的联合分布特点是什么98
3.3.3 雷达图:不同区域气候特点有差异吗99
3.4 如何获得变量间相关性的直观印象101
3.4.1 马赛克图:车型和车龄有相关性吗101
3.4.2 散点图:这些因素会影响空气湿度吗102
3.4.3 相关系数图:淘宝各行业商品成交指数有相关性吗111
3.5 如何获得GIS数据的直观印象112
3.5.1 绘制世界地图和美国地图112
3.5.2 绘制中国行政区划地图114
3.5.3 依据地图绘制热力图:不同省市的淘宝女装成交指数有差异吗117
3.6 如何获得文本词频数据的直观印象:政府工作报告中有哪些高频词118
第2篇 数据预测篇:立足数据预测未知122
第4章 基于近邻的分类预测:与近邻有趋同的选择122
4.1 近邻分析:K-近邻法123
4.1.1 K-近邻法中的距离123
4.1.2 K-近邻法中的近邻个数124
4.1.3 R的K-近邻法和模拟分析126
4.1.4 K-近邻法应用:天猫成交顾客的分类预测129
4.2 K-近邻法的适用性及特征选择130
4.2.1 K-近邻法的适用性130
4.2.2 特征选择:找到重要变量131
4.3 基于变量重要性的加权K-近邻法133
4.3.1 基于变量重要性的加权K-近邻法的基本原理133
4.3.2 变量重要性判断应用:天猫成交顾客预测中的重要变量134
4.4 基于观测相似性的加权K-近邻法136
4.4.1 加权K-近邻法的权重设计136
4.4.2 加权K-近邻法的距离和相似性变换137
4.4.3 加权K-近邻法的R实现138
4.4.4 加权K-近邻法应用:天猫成交顾客的分类预测139
第5章 基于规则的分类和组合预测:给出易懂且稳健的预测142
5.1 决策树概述143
5.1.1 什么是决策树143
5.1.2 决策树的几何意义是什么144
5.1.3 决策树的核心问题145
5.2 分类回归树的生长过程147
5.2.1 分类树的生长过程147
5.2.2 回归树的生长过程150
5.2.3 损失矩阵对分类树的影响151
5.3 分类回归树的剪枝152
5.3.1 最小代价复杂度的测度152
5.3.2 分类回归树后剪枝过程153
5.3.3 分类回归树的交叉验证剪枝154
5.4 分类回归树的R实现和应用156
5.4.1 分类回归树的R实现156
5.4.2 分类回归树的应用:提炼不同消费行为顾客的主要特征158
5.5 建立分类回归树的组合预测模型:给出稳健的预测161
5.5.1 袋装技术161
5.5.2 袋装技术的R实现163
5.5.3 袋装技术的应用:稳健定位目标客户164
5.5.4 推进技术165
5.5.5 推进技术的R实现167
5.5.6 推进技术的应用:稳健定位目标客户168
5.6 随机森林:具有随机性的组合预测168
5.6.1 什么是随机森林168
5.6.2 随机森林的R实现170
5.6.3 随机森林的应用:稳健定位目标客户171
第6章 基于神经网络的分类预测:给出高精准的预测176
6.1 人工神经网络概述177
6.1.1 人工神经网络和种类177
6.1.2 节点:人工神经网络的核心处理器178
6.1.3 建立人工神经网络的一般步骤181
6.1.4 感知机模型:确定连接权重的基本策略182
6.2 B-P反向传播网络:最常见的人工神经网络184
6.2.1 B-P反向传播网络的三大特点184
6.2.2 B-P反向传播算法:确定连接权重187
6.2.3 学习率:影响连接权重调整的重要因素188
6.3 B-P反向传播网络的R实现和应用189
6.3.1 neuralnet包中的neuralnet函数189
6.3.2 neuralnet函数的应用:精准预测顾客的消费行为190
6.3.3 利用ROC曲线确定概率分割值194
6.3.4 nnet包中的nnet函数197
第7章 基于支持向量的分类预测:给出最大把握的预测199
7.1 支持向量分类概述199
7.1.1 支持向量分类的基本思路:确保把握程度199
7.1.2 支持向量分类的三种情况202
7.2 理想条件下的分类:线性可分问题下的支持向量分类202
7.2.1 如何求解超平面202
7.2.2 如何利用超平面进行分类预测205
7.3 一般条件下的分类:广义线性可分时的支持向量分类205
7.3.1 如何求解超平面205
7.3.2 可调参数的意义:把握程度和精度的权衡206
7.4 复杂条件下的分类:线性不可分时支持向量分类207
7.4.1 线性不可分的一般解决途径和维灾难问题207
7.4.2 支持向量分类克服维灾难的途径208
7.5 多分类的支持向量分类:二分类的拓展210
7.6 支持向量回归:解决数值预测问题210
7.6.1 支持向量回归与一般线性回归:目标和策略210
7.6.2 支持向量回归的基本思路211
7.7 支持向量机的R实现及应用213
7.7.1 支持向量机的R实现213
7.7.2 利用R模拟线性可分下的支持向量分类214
7.7.3 利用R模拟线性不可分下的支持向量分类217
7.7.4 利用R模拟多分类的支持向量分类220
7.7.5 支持向量分类应用:天猫成交顾客的预测222
第3篇 数据分组篇:发现数据中的自然群组226
第8章 常规聚类:直观的数据全方位自动分组226
8.1 聚类分析概述226
8.1.1 聚类分析目标:发现数据中的“自然小类”226
8.1.2 有哪些主流的聚类算法227
8.2 基于质心的聚类:K-Means聚类228
8.2.1 K-Means聚类中的距离测度:体现全方位性228
8.2.2 K-Means聚类过程:多次自动分组229
8.2.3 K-Means聚类的R实现和模拟分析231
8.2.4 K-Means聚类的应用:环境污染的区域划分233
8.3 PAM聚类:改进的K-Means聚类235
8.3.1 PAM聚类过程235
8.3.2 PAM聚类的R实现和模拟分析236
8.4 基于联通性的聚类:层次聚类238
8.4.1 层次聚类的基本过程238
8.4.2 层次聚类的R实现和应用:环境污染的区域划分239
8.5 基于统计分布的聚类:EM聚类241
8.5.1 基于统计分布的聚类出发点:有限混合分布241
8.5.2 EM聚类:如何估计类参数和聚类解242
8.5.3 EM聚类的R实现和模拟分析245
8.5.4 EM聚类的应用:环境污染的区域划分247
第9章 特色聚类:数据分组还可以这样做250
9.1 BIRCH聚类概述251
9.1.1 BIRCH聚类有哪些特点251
9.1.2 聚类特征和聚类特征树:BIRCH聚类的重要策略252
9.1.3 BIRCH的聚类过程:由存储空间决定的动态聚类254
9.1.4 BIRCH聚类的R实现255
9.1.5 BIRCH聚类应用:两期岗位培训的比较258
9.2 SOM网络聚类概述260
9.2.1 SOM网络聚类设计出发点260
9.2.2 SOM网络的拓扑结构和聚类原理261
9.2.3 SOM网络聚类的R实现263
9.2.4 SOM网络聚类应用:手写邮政编码识别266
9.2.5 拓展SOM网络:红酒品质预测271
9.3 基于密度的聚类模型:DBSCAN聚类275
9.3.1 DBSCAN聚类原理:密度可达性是核心275
9.3.2 DBSCAN聚类的R实现277
9.3.3 DBSCAN聚类的模拟分析277
第4篇 数据关联篇:发现数据的内在关联性282
第10章 发现数据中的关联特征:关联是推荐的依据282
10.1 简单关联规则及其测度283
10.1.1 什么是简单关联规则283
10.1.2 如何评价简单关联规则的有效性284
10.1.3 如何评价简单关联规则的实用性285
10.2 Apriori算法:发现简单关联规则的高效算法286
10.2.1 搜索频繁项集:Apriori算法的重中之重287
10.2.2 依最大频繁项集产生简单关联规则:水到渠成288
10.2.3 Apriori算法的R实现和应用示例289
10.2.4 简单关联的可视化R实现和应用示例297
10.3 Eclat算法:更快速地发现频繁项集300
10.3.1 Eclat算法原理:对等类是核心300
10.3.2 Eclat算法的R实现和应用示例301
10.4 简单关联分析的应用:商品推荐302
10.4.1 发现连带销售商品302
10.4.2 顾客选择性倾向对比304
10.5 序列关联分析及SPADE算法:发现数据中的时序关联性306
10.5.1 序列关联中有哪些基本概念306
10.5.2 SPADE算法:发现序列关联规则的高效算法308
10.5.3 序列关联分析的R实现及应用示例310
10.6 序列关联分析应用:发现网民的浏览习惯313
第11章 复杂网络分析初步:基于关系的研究316
11.1 网络的定义表示及构建:复杂网络分析的第一步317
11.1.1 网络的图论定义及R实现317
11.1.2 网络的矩阵表示方式及R实现326
11.1.3 R的网络数据文件和建立网络对象328
11.1.4 R的网络可视化334
11.2 网络节点重要性的测度:谁是网络的“主导”335
11.2.1 度和测地线距离335
11.2.2 点度中心度和接近中心度:节点“中心”作用的测度337
11.2.3 中间中心度:节点“枢纽”作用的测度340
11.2.4 节点重要性的其他方面:结构洞和关节点、特征向量中心度和PageRank得分341
11.3 网络子群构成特征研究:找到网络中的“小团体”343
11.3.1 二元关系和三元关系及R实现344
11.3.2 派系和k-核及R实现345
11.3.3 社区和组件及R实现348
11.4 网络整体特征刻画:整体关系是这样的351
11.4.1 网络整体特征的测度351
11.4.2 网络特征的各种分布和度量354
11.5 主要网络类型及特点:多姿多彩的网络世界356
11.5.1 规则网络及特点356
11.5.2 随机网络及特点358
11.5.3 小世界网络及特点360
11.5.4 无标度网络及特点362
第5篇 离群数据探索篇:发现数据中的离群点368
第12章 模式甄别:诊断异常数据368
12.1 模式甄别方法和评价概述368
12.1.1 模式甄别方法368
12.1.2 模式甄别结果及评价:风险评分371
12.2 模式甄别的无监督侦测方法及应用示例372
12.2.1 依概率侦测模式及R应用示例373
12.2.2 依距离侦测模式:DB方法及R应用示例375
12.2.3 依密度侦测模式:LOF方法及R应用示例377
12.3 模式甄别的有监督侦测方法及应用示例380
12.3.1 朴素贝叶斯分类法及示例381
12.3.2 Logistic回归及示例385
12.3.3 非平衡数据集的SMOTE处理388
12.4 模式甄别的半监督侦测方法及应用示例390
12.4.1 半监督分类:自训练分类模型390
12.4.2 自训练分类模型的R实现及应用示例391
热门推荐
- 3696212.html
- 2383276.html
- 1841936.html
- 968840.html
- 510210.html
- 3068022.html
- 3192816.html
- 2129589.html
- 3591566.html
- 1999366.html
- http://www.ickdjs.cc/book_1295608.html
- http://www.ickdjs.cc/book_2050098.html
- http://www.ickdjs.cc/book_1457432.html
- http://www.ickdjs.cc/book_3668440.html
- http://www.ickdjs.cc/book_3124950.html
- http://www.ickdjs.cc/book_1929171.html
- http://www.ickdjs.cc/book_548858.html
- http://www.ickdjs.cc/book_2597763.html
- http://www.ickdjs.cc/book_3277997.html
- http://www.ickdjs.cc/book_1664071.html