自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 四个案例解析R剖面指数和期望值(牙膏的真假效用和产品的主要客户)

下面介绍四个案列,来讲解基本的统计学知识和剖面指数和期望值 第一个是分析男女对不同饮料的倾向 #设置工作路径setwd("D:\\数据分析\\R语言基础")Lst<-scan("drink.data",what=list("sex","type"))#table统计频数a<-table(Lst)margin.table(a,1)prop.table(a,1)...

2018-09-17 12:56:21 1427

原创 机器学习浅思

什么是机器学习呢?在我初次接触的机器学习的时候,我的想法便是机器学习一定是很高大上,很难的技术。但实际是任何高深的技术都是人类从小的方面思考过来的,都暗含着人类的经验和思考。机器学习也这样,我们可以把这个过程想象成幼儿成长的过程。机器学习的数据就是孩童成长的经验,所谓的算法是我们培养孩子的方法。所谓机器学习就是培养一个孩子,我们孩子最后的优秀程度,取决于我们给予它的经验(数据)和培养它的方法(...

2018-09-23 10:17:04 253 3

原创 R语言探索性分析及plyr数据转换包

R包dplyr可用于处理R内部或者外部的结构化数据,相较于plyr包,dplyr专注接受dataframe对象, 大幅提高了速度,并且提供了更稳健的数据库接口。 下面针对一些具体的例子介绍探索性分析和plyr数据转换包 统计diamonds(R语言自带的数据集)在不同克拉的数量#%>%管道运算符,用于传递数据集diamonds %>% count(cut_width(...

2018-09-15 22:40:07 682

原创 R作图之ggplot2包

ggplot2使用的基本框架 下面逐一介绍 1.data data是我们需要可视化的数据,在学习中,我们经常使用R语言自带的diamonds和flights数据源。在data框的范围我们也可以使用mapping(映射),在data框范围使用的属性在后面镶嵌的图层中为默认属性。exampleggplot(data=mpg,mapping=aes(y=hwy,x=class))+ ...

2018-09-14 09:27:36 1941

原创 计算思维,工程思维,数学思维的思考

在计算机基础课上,老师跟我们讲了关于数学思维,计算思维,逻辑思维的区别和联系。老师说在古希腊时代就有数学存在,可见数学思维是人类与生俱来的天赋和思维,也是人类成为万物之灵的根基,在现实生活中可以随时随地的见到这种思维,数学思维体现在我们对一件事物的权衡,能轻松解决鸡兔同笼的问题,能够在任何情况下都能准确说出1+1=2就是数学思维培养的结果关于工程思维,工程思维体现的是一种实践思想,例如基础学科...

2018-09-12 20:49:52 5727

原创 R语言构造扑克牌自动发牌,洗牌

在R语言构建自动洗牌,发牌 要求:自动洗牌、发牌 任务一:创建一副牌。学会如何使用R的数据类型和数据结构。 任务二:编写发牌和洗牌的函数。学习从一个数据集中抽取想要的数值。 首先需要创建一副牌(不包括大小王),从R语言的数据对象来看,数据框最合适。 因为花色是字符串,而点数是数字,所以能够承担数据类型不同的二维数据对象——数据框最合适。下面是创建pkp数据对象的代码pkp<-d...

2018-09-06 21:42:51 4984 6

原创 R语言分析骰子

在我认知的统计学中,任何自然事物在大量的数据统计分析中都会显示一定的规律。下面用R语言随机投掷骰子,并重复很多次,分析骰子在大量数据下分布的规律 先从投一个骰子开始,重复骰子10次,观察点数分布,y坐标是表示骰子点数的频数,x坐标表示骰子的点数 从图中观察,频数分布不均匀,差距较大,貌似是每个骰子的点数机率不是均等的,那如果再加大重复次数呢? 重复骰子100次 图像的频数是不是接近...

2018-09-05 23:37:06 8416 2

原创 R的数据对象的初步概括

在R中,最基础的两个概念是对象和函数 下面介绍R中的数据对象 R的数据对象可以初步划分为数据类型相同的:如向量,因子factors,矩阵matrix,数组array 和数据类型不同的:如列表list和数据框DataFrame 通过Is(),objects()可以查看对象。 通过rm()可以移除对象。 对于向量,向量化是R相较于其他语言最优势莫过于它的向量化,向量化也是R中最有效率的。 ...

2018-09-03 21:45:30 1435

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除