自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

素质云笔记

营销数据科学:因果推断,CDP,用户画像,短视频挖掘等

  • 博客(9)
  • 资源 (5)
  • 收藏
  • 关注

原创 R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

R语言︱数据集分组大型数据集通常是高度结构化的,结构使得我们可以按不同的方式分组,有时候我们需要关注单个组的数据片断,有时需要聚合不同组内的信息,并相互比较。一、日期分组1、关于时间的包都有很多很好的日期分组应用。2、cut()函数cut(x, n):将连续型变量x分割为有着n个水平的因子cut(x, breaks, labels = NULL, include.lowest = FALS...

2016-02-18 21:02:18 118180 2

原创 网页版Rstudio︱RStudio Server多人在线协作开发

 网页版Rstudio︱RStudio Server多人在线协作开发 想了解一下RStudio Server,太给力的应用,可以说成是代码分布式运行,可以节省时间,放大空间。 RStudio是一个非常优秀的R语言IDE。 RStudio除了在各种系统中有桌面版本外还有Server版,它可以装载在linux主机上,用户可以通过浏览器远程登录使用R进行数据分析。笔者在之前也曾经折腾...

2016-02-17 16:39:15 19697 3

原创 R语言与格式、日期格式、格式转化

每每以为攀得众山小,可、每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~R语言的基础包中提供了两种类型的时间数据,一类是Date日期数据,它不包括时间和时区信息,另一类是POSIXct/POSIXlt类型数据,其中包括了日期、时间和时区信息。基本总结如下:日期data,存储的是天;时间POSIXct 存储的是秒,POSIXlt 打散,年月日不同;日期-时间=不可运算。一般来...

2016-02-16 22:12:33 143894 2

原创 R语言数据集合并、数据增减、不等长合并

一、数据合并1、merge()函数最常用merge()函数,但是这个函数使用时候这两种情况需要注意:1、merge(a,b),纯粹地把两个数据集合在一起,没有沟通a、b数据集的by,这样出现的数据很多,相当于a*b条数据;2、merge函数是匹配到a,b数据集的并,都有的才匹配出来,如果a、b数据集ID不同,这个函数不够用。#横向合并ID<-c(1,2,3,4)name<-

2016-02-16 21:51:40 194506 7

转载 RFM模型及R语言实现

一、基本概念根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标:最近一次消费(Recency)、消费频率(Frequency)、消费金额(Monetary)。 RFM模型:R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M  (Monetary)表示

2016-02-14 13:54:21 21806

原创 R语言实现关联规则与推荐算法(学习笔记)

R语言实现关联规则笔者前言:以前在网上遇到很多很好的关联规则的案例,最近看到一个更好的,于是便学习一下,写个学习笔记。推荐算法中物品-物品用关联规则;人物-物品用协同过滤;人-人用社会网络分析;特征-物品用预测建模,分类模型。(本总结来自CDA DSC相关课程)关联规则和协同过滤算法关联规则,...

2016-02-14 13:43:39 19638 1

转载 R语言之内存管理

转载于:http://blog.csdn.net/hubifeng/article/details/41113789在处理大型数据过程中,R语言的内存管理就显得十分重要,以下介绍几种常用的处理方法。1,设置软件的内存[plain] view plain copymemory.size(2048) #设置内存大小  memory

2016-02-11 16:33:10 5084

原创 R语言︱常用统计方法包+机器学习包(名称、简介)

转载于:http://www.dataguru.cn/thread-116761-1-1.html时间上有点过期,下面的资料供大家参考基本的R包已经实现了传统多元统计的很多功能,然而CRNA的许多其它包提供了更深入的多元统计方法,下面要综述的包主要分为以下几个部分: 1) 多元数据可视化(Visualising multivariate data): 绘图方法: 基本画图函

2016-02-11 15:52:27 38686

原创 R语言实现SOM(自组织映射)模型(三个函数包+代码)

笔者前言:最近发现这个被发明于1982年的方法在如今得到了极为广泛的应用,在提倡深度学习的时候,基于聚类的神经网络方法被众多人青睐。但是呢, 网上貌似木有人贴出关于SOM模型的R语言实现,我就抛砖引玉一下。SOM模型定义与优劣:自组织映射 ( Self Organization Map, SOM )神经网络是较为广泛应用于聚类的神经网络,它是由 Kohonen提出的一种无监督学习的神经元网络模型。主要功能是将输入的 n 维空间数据映射到一个较低的维度 (通常是一维或者二维 )输出 ,同时保持数据原有的拓扑逻

2016-02-11 15:42:00 23058 5

Rstudio Server + Docker + tensorflowR的dockerfile文件

Rstudio Server + Docker + tensorflowR - 云端使用R语言与GPU深度学习

2018-09-28

数美科技李田:机器学习与在数美业务上的落地

数美科技李田:机器学习与在数美业务上的落地

2018-09-11

Prophet的案例数据

R的Prophet包的数据集

2017-02-26

VMware-player-12.0.0-part1

VMware-player-12.0.0-part1,一共两个部分。

2016-11-19

word2vec自编译函数(By Jian Li,2014-09-21)

R语言实现深度学习word2vec,word2vec包含两个模型CBOW以及Skp-gram模型,R语言实现的过程中需要配置一些内容,详情见包中附件readme。

2016-05-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除