- 博客(46)
- 资源 (1)
- 收藏
- 关注
原创 看书标记【数据科学:R语言实战 8】
看书标记——R语言Chapter 8 数据可视化——绘图8.1 功能包8.2 散点图8.2.1 回归线8.2.2 lowess线条8.2.3 scatterplot函数8.2.4 Scatterplot矩阵1.splom——展示矩阵数据2.cpairs——绘图矩阵图8.2.5 密度散点图8.3 直方图和条形图8.3.1 条形图8.3.2 直方图 8.3.3 ggplot28.3.4 词云【数据科学:R语言实战】Chapter 8 数据可视化——绘图8.1 功能包car(Companion to
2024-08-17 20:02:33
957
原创 看书笔记【数据科学:R语言实战 7】
看书笔记——R语言Chapter 7 数据可视化——R图形7.1 功能包7.1.1 交互式图形7.1.2 latticist功能包1.双变量分箱显示2.测绘3.绘制地图上的点5.Google地图7.1.3 ggplot2功能包【数据科学:R语言实战】Chapter 7 数据可视化——R图形7.1 功能包classIn:包含了单变量组距ggpolot2:具有大量的图形特征gpclib:用于多边形裁剪hexbin:用于双变量数据操作latticist:R与Latticist程序之间的界面ma
2024-08-17 20:02:05
768
1
原创 看书标记【数据科学:R语言实战 6】
看书标记——R语言Chapter 6 数据分析——聚类6.1 功能包6.2 K-means聚类6.2.1 示例6.2.2 Medoids集群6.2.3 cascadeKM函数6.2.4 基于贝叶斯定理6.2.5 仿射传播聚类6.2.6 用于估测集群数量的间隙统计量6.2.7 分级聚类【数据科学:R语言实战】Chapter 6 数据分析——聚类6.1 功能包NbClust:集群指数的数量fpc:包含进行聚类的灵活程序vegan:社区生态功能包apcluster:用于仿射传播聚类操作pvclu
2024-03-28 21:28:59
1014
原创 看书标记【数据科学:R语言实战 4】
看书标记——R语言Chapter 4 数据分析——回归分析4.1 功能包4.1.1 简单回归4.1.2 多次回归4.1.3 多变量回归分析4.1.4 稳健回归【数据科学:R语言实战 】Chapter 4 数据分析——回归分析4.1 功能包chemometrics():此功能包含分析化学计量数据的工具(多变量)MASS:此功能包可以为使用S的现代应用统计4.1.1 简单回归数据集:iris数据集(包含某植物不同特点的观察值)data <- read.csv("http://archive
2024-03-08 19:37:06
436
原创 看书标记【数据科学:R语言实战 3】
看书标记——R语言Chapter 3 文本挖掘3.1 功能包创建语料库3.1.2 文本集群【数据科学:R语言实战 3】Chapter 3 文本挖掘3.1 功能包tm:文本挖掘工具XML:XML处理工具path <- "C:/Users/Dan/Documents/state-of-the-union.txt"install.packages(“tm”)library(tm)text <- readLines(path,encoding="UTF-8")vs <- Vec
2024-03-08 19:36:43
332
原创 看书标记【R语言数据分析项目精解:理论、方法、实战 9】
指定五个主题,每个主题都有收集对应的相关词汇用于描述相关主题。每涉及一项主题为0.2,满分为1。需要针对添加某些特定的词,即用户自定义词典。(自定义词典在TXT文件中,需要UTF-8编码,词典中第一行读不进去,需要从第二行开始读)#增加自定义词典wk["我喜欢量子号的邮轮"]#设定空间默认路径setwd("C:\\Users\\用户路径")#用户自定义词典名称#加载分词引擎,导入自定义词典#分词wk["我喜欢量子号的邮轮"]
2024-01-21 21:07:51
1309
原创 看书标记【R语言数据分析项目精解:理论、方法、实战 6】
看书标记——R语言Chapter 6 变量筛选技术6.1项目背景、目标和方案6.1.1项目背景6.1.2项目目标6.1.3项目方案6.2项目技术简介6.2.1变量相关性1.定类变量和定类变量2.定序变量与定类变量3.定距(连续型)变量与定距变量4.定类变量与定序变量6.2.2变量筛选1.基于变量距离的层次聚类2.基于变量距离的模糊聚类6.2.3变量降维1.主成分分析(PCA)2.因子分析6.2.4 R语言实例代码【R语言数据分析项目精解:理论、方法、实战】Chapter 6 变量筛选技术6.1项目背景
2024-01-01 21:18:51
1143
原创 看书标记【R语言数据分析项目精解:理论、方法、实战 5】
看书标记——R语言Chapter 5 用数据驱动业务——AB测试5.1项目背景、目标和方案5.1.1项目背景5.1.2项目目标5.1.3项目方案5.2项目技术理论简介5.2.1自动化分流策略5.2.2整体评估指标(Overall Evaluation Criterion)5.2.3概率论预备知识5.2.4假设检验5.2.5三个问题5.3项目实践【R语言数据分析项目精解:理论、方法、实战】Chapter 5 用数据驱动业务——AB测试5.1项目背景、目标和方案5.1.1项目背景AB测试就是为同一个目
2024-01-01 21:18:22
945
原创 看书标记【R语言数据分析项目精解:理论、方法、实战 4】
看书标记——R语言Chapter 4 指标监控系统4.1项目背景、目标方案4.1.1项目背景4.1.2项目目标4.1.3项目方案4.2项目技术理论简介4.2.1时间序列基本统计量4.2.2数据观测与描述性统计4.2.3随机性4.2.4周期性4.2.5节假日模式识别4.2.6建模数据集1.挑选建模数据集2.寻找离群点3.平滑离群点4.2.7指标监控方法(不含节假日)1.ARIMA模型2.季节乘积ARIMA模型3.指数平滑4.质量控制图5.判断异常值的方法4.2.9R语言实例代码5.均值-极差图4.3项目实践4
2023-12-29 20:19:29
918
原创 看书标记【R语言数据分析项目精解:理论、方法、实战 3】
看书标记——关于R语言chapter 3 互联网运营指标的建立3.1 项目背景、目标及方案3.1.1 项目背景3.1.2 项目目标3.1.3 项目方案3.2 项目技术理论简介3.2.1 骨灰级流量指标1.PV(page views 访问页面数)2. UV(Unique Vistors 唯一访问人数)3.Visit (会话)【R语言数据分析项目精解:理论、方法、实战】chapter 3 互联网运营指标的建立3.1 项目背景、目标及方案3.1.1 项目背景运营团队希望有一套完整的指标系统来实时监控
2023-12-29 20:19:10
1083
原创 看书标记【R语言数据分析项目精解:理论、方法、实战 2】
看书标记——关于R语言chapter 2 R语言基础2.1 安装R语言2.2 R语言基本对象2.2.2 向量用sort函数对向量进行排序,返回排完序后的向量倒序排列【R语言数据分析项目精解:理论、方法、实战】chapter 2 R语言基础R语言用高深的理论作为支撑、用简捷的语法作为工具、用清晰明了的结论作为结果。2.1 安装R语言http://www.r-project.org/>>“Download”>>“CRAN”>>“Download R for Wi
2023-07-30 19:08:08
356
原创 看书标记【R语言 商务数据分析实战9】
看书标记——关于R语言chapter 99.2 任务实现【R语言 商务数据分析实战9】chapter 9餐饮企业综合分析统计分析>>ARIMA预测销售额>>协同过滤算法对菜品进行智能推荐>>Apriori算法对菜品进行关联分析>>K-means算法进行客户价值分析>>决策树算法进行客户流失预测这几种算法是不同从不同方面得到不同的结果的独立模块,根据算法的要求,对数据进行相关的数据预处理9.2 任务实现统计餐饮数据# 【分组聚合:使
2021-03-10 09:40:57
1363
3
原创 看书标记【R语言 商务数据分析实战8】
看书标记——关于R语言chapter 88.2 任务实现【R语言 商务数据分析实战8】chapter 8电商产品评论数据情感分析网页爬虫+文本数据预处理>>对数据进行情感分析>>用LDA模型对正、负评论进行主题分析文本数据预处理主要有文本去重、文本清洗、分词、去除停用词,其中中文的分词和英文的分词会用到不同的程序包,R中关分词的程序包主要都对英文比较可爱,后期想看看关于自然语言的相关知识。8.2 任务实现获取评论页面网页源码(数据获取)# 设置工作目录setwd(
2021-03-10 09:40:28
478
原创 看书标记【R语言 商务数据分析实战7】
看书标记——关于R语言chapter 76.2 任务实【R语言 商务数据分析实战7】chapter 7电子商务网站智能推荐服务关于数据库的应用+数据清洗+实时数据识别>>探索性分析+寻找关键因素>>建立GBM(梯度提升机)模型+ROC评价模型+参数自动调节6.2 任务实对数据进行初步探索,确定关键因素,所以本章节更多的是关于数据格式和数据清洗的一个训练分析用户信息完善程度与逾期率的关系# 设置工作目录setwd()df.tr.master <- read.
2021-03-10 09:39:58
1176
原创 看书标记【R语言 商务数据分析实战6】
看书标记——关于R语言chapter 66.2 任务实现【R语言 商务数据分析实战6】chapter 6金融服务机构资金流量预测数据理解和预处理>>检验平稳性+纯随机性>>得到模型阶数建立ARIMA模型6.2 任务实现检验数的平稳性# 设置工作目录并读取数据setwd()# 快速读取数据dataFile <- data.frame(data.table::fread('./data/user_balance_table.csv'))# 日期转化为标准时间
2021-03-10 09:39:24
737
3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人