自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 关联规则笔记2

关联规则笔记1一个本地零售商有一个数据库,存储了去年夏天的10000条交易。分析数据后,数据科学家团队已经识别出了以下统计:{battery}在6000笔交易中出现{sunscreen}在5000笔交易中出现{sandals}在4000笔交易中出现{bowls}在2000笔交易中出现{battery, sunscreen}在1500笔交易中出现{battery, sandals}在1000笔交易中出现{battery, bowls}在250笔交易中出现。

2024-10-02 16:20:40 664

原创 关联规则笔记1

关联分析:基于已有数据,找到事物间的简单关联关系或序列关联关系。关联分析成果(即关联关系)的核心体现形式是关联规则,包括简单关联规则或序列关联规则。一提到关联规则,就会想到Apriori算法,又会想到啤酒尿布的故事。但我们老师说这个故事是用来吸引人用的,确实这两个事物放在一起,挺有趣的。今天先介绍一下有关简单关联规则的基本概念,这次参考的主要是薛薇. (2014). R语言数据挖掘 (3rd ed.). 中国人民大学.,收获颇多,也把好东西整理好分享给大家。之后再尝试用R语言练习一些简单的问题。

2024-09-24 17:18:46 562

原创 我的笔记3

今天公休时间比较多,看看能不能把作业整完。大致看了一下,今天的题与统计学基础知识相关。5.(1) 请生成一个向量X,其中,含有1000个随机元素(自由度为10的t分布)。请画出它的直方图或概率密度曲线,查看其分布,并与正态分布比较。(2)请写出一个函数,能够对这个向量同时完成3件事,即,求均值和方差,并将其标准化。(3)如果记标准化后的向量为Y,请计算Y的差分减去根号下Y的绝对值(保留四位小数),记为Z。画出Y和Z的散点图(尝试使用ggplot2做图)。

2024-09-19 21:24:53 1133

原创 我的笔记2

今天,记录一下相关系数中椭圆的做法。请将R自带数据集iris导出,重新命名后导入,使用ellipse包下面的plotcorr函数做前4个变量的相关图。或借上题工具制作相关关系图。今天先到这里,还留着几个问题1.order的4种形式具体按什么排序的2.col = colorRampPalette(c(“#A50F15”, “white”,“#08519C”)(8)虽然万能,但不能根据数值给出变化的颜色。3.corrplot.mixed有两种method不能自定义颜色明天或以后有时间再研究。

2024-09-18 21:38:17 960

原创 我的笔记1

原来我用的是小号注册的,现在都移到这里吧,那个号我也登不上了

2024-09-17 18:43:23 133

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除