自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

原创 R语言-计算分位数

setwd("C:\\Users\\siyuanmao\\Documents\\imdada\\【BD】\\品牌分位数")brand_gmv<-read.csv("1-9月品牌gmv.csv",stringsAsFactors=FALSE)head(brand_gmv)mon_band_gmv<-aggregate(brand_gmv$sku_gmv,by=list(brand...

2019-05-19 16:59:00 20753

原创 R语言多线程运算(解决R循环慢的问题)

已经大半年没有更新博客了。。最近都跑去写分析报告半年没有R这次记录下关于R循环(百万级以上)死慢死慢的问题,这个问题去年就碰到过,当时也尝试过多线程,but failed......昨天试了下,终于跑通了,而且过程还挺顺利step1先查下自己电脑几核的,n核貌似应该选跑n个线程,线程不是越多越好,线程个数和任务运行时间是条开口向下的抛物线,最高点预计在电脑的核数上。de

2017-09-10 17:18:33 19803 2

原创 R语言 爬数据

爬数据的两大难点:1.分析网络结构2.写正则表达式科普版:install.packages("RCurl")library(RCurl)url1='http://shenzhen.lashou.com/cate/meishi'web=readLines(url1,encoding='UTF-8')goods_name<-web[grep("goods-name",w

2016-11-30 23:44:55 2763

原创 用R修改excel内容的格式

这篇博客是用来打脸的。去年这个时候写的一篇用vba来生成excel博客提到,R无法修改excel的格式,这回脸打得响了,其实两年前这个技术已经实现,恕我无知。目前从我手上的资料来看,还有几个地方不是特别明白,所以暂时不分享整个实现方法,先占个坑,学会了再贴笔记。资料:https://cran.r-project.org/web/packages/xlsx/xlsx.pdfhttp:

2016-11-19 17:35:57 2296

原创 用R实现模糊匹配

模糊匹配:就是把相似的名词配对起来,案例如,携程爬取下来的景区名称和同城名称并不是完全一致的,但几个关键词是一致的。然后可以通过分词,投票等方法把它们匹配上。library(rJava)library(Rwordseg)setwd("D:\\Documents\\work\\匹配")total_data<-read.csv("门票景区.csv",stringsA...

2016-11-19 17:22:04 15630 13

转载 R语言绘图功能之强大

mark 学习params <- function(N, breaks, p=seq(0.001, 1, length=100)) { list(N=N, T=1/breaks, p=p, q=1-p)}pdfcomp <- function(comp, params) { n <- params$T p <- params$p q <- params$q y <-

2016-09-25 17:36:53 2264

原创 R语言培训-第三期

内容概况:* 函数* 控制流:if for* 数据重构* 自编函数setwd("D:\\Documents\\work\\R培训\\第三期")################函数############ #1.数学函数 abs() sqrt() exp() floor() ceiling() round() 三角函数 abs(c(-9,-8,-7,-

2016-09-09 13:20:16 2042

原创 R语言培训-第二期

内容概况•            重命名•            类型转换•            缺失值处理•            创建新变量 删除变量•            排序•            合并(行/列) 筛选•            vlookup•            透视表#########工作空间配置#############

2016-09-09 13:17:53 422

原创 R培训-第一期

内容概况:【R studio简介】【安装包】【包的更新】【加载包】【创建数据集】install.packages("mapproj")library(mapproj)library(devtools)install.packages("Rwordseg")install.packages("Rwordseg", repos = "http://R-Forge.

2016-09-09 13:15:00 479

原创 疑难杂症

aget_geo_position(a)aget_geo_position(a)

2016-08-30 18:28:23 404

原创 【R语言】用Shiny包搭建交互网页

哇塞,又发现一个好玩的东东,mark 。必须mark。。。用Shiny包快速搭建基于R的交互网页应用http://www.r-bloggers.com/lang/chinese/1163

2016-07-05 17:41:21 3889

原创 【R语言】文本挖掘-情感分析

先占个坑,周末习题http://www.tuicool.com/articles/amaY3izhttp://download.csdn.net/detail/hfutxrg/1063945

2016-06-30 14:48:29 5109 2

原创 用R画中国地图

如何画中国地图 install.packages("maps")install.packages("mapdata")install.packages("maptools")library(maps)library(mapdata)library(maptools)setwd("D:\\Documents\\work\\myself_learn\\地图")map&lt;-r...

2016-06-20 10:33:00 31092 2

原创 用ggplot画饼图

饼图画出来还是比较丑的dt = data.frame(A =ss$user, B = ss$usex) tag = as.vector(dt$B) myLabel = paste( round(dt$A / sum(dt$A) * 100, 2), "%", sep = "")ggplot(dt, aes(x = "", y = A, fill = B)) + geom_bar(

2016-06-16 17:37:17 1538

原创 R语言 发邮件

用R中的mailR包发送邮件1.安装mailR包:install.packages("mailR")2.自己建个函数[email protected]"),subject,msg="letter",files=array()){ library(mailR) if(is.na(files)[1]){   attach.files }els

2016-06-07 17:57:08 4840

原创 R 语言-数据处理基础

data.csvseller.csv###########安装包################install.packages("lubridate") 包含month()#install.packages("reshape") 包含reshape()library(lubridate) #?如何查找函数在哪个包library(reshape)insta

2016-05-31 14:33:30 942

原创 R markdown批量生成报告

妈蛋,搞到现在才解决---title: "main-word"output: word_document---This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more detail

2016-04-18 23:01:29 3555

原创 R Markdown生成动态分析报告(.html)

发现一个比Latex生成动态分析报告方便无数倍的R Markdown1.配置环境tools --global options--sweave的weave Rnw files using改为knitr2.新建R Markdown file,测试代码如下R CODE BY 小酥饼maomao====================== 下图是矩阵 ```{r,echo=FAL

2016-04-12 13:30:35 9433

原创 用R实现文本挖掘

互联网公司一般都有质量审核部门,这些部门专门查找违禁帖子,但网站帖子量成千上万,如何快速的查找到违禁帖子,想到的一个办法就是通过数据模型(分类算法)来解决这个问题,对帖子文本进行分析,建立数据模型,甄别出哪些有可能是违禁的帖子setwd("~/text_ming")load("~/text_ming/doc_CN.rda")library(rJava)library(Rwordseg)

2016-02-04 10:23:59 3256 1

原创 用ggplot实现双坐标轴图形

如何完成双坐标轴图(如下)R代码library(ggplot2)library(gtable)library(grid)setwd("C:\\Users\\msy\\Documents\\work\\年度")shuaxin<-read.csv("总体test.csv",stringsAsFactors = FALSE)shuaxinp1<-ggplot(shuaxin,a

2016-02-04 10:13:45 13828

原创 R-ggplot 数据可视化

plot(),lines(),gplot()等绘图方法不想记笔记,个人觉得它们的图像太丑,不想使用。Q:x轴是日期型,画图各种困扰,日期显示、日期黏连怎么办?图例想放底部,或者图像内怎么办?分类型的x上项目想换个位置怎么办?对某些特殊点想高亮想控制条形图颜色想换个背景色【图形】本主最最常用的是散点图:ggplot()+geom_point()折线图:gg

2016-01-20 18:21:18 5761

转载 R图片保存到PDF文件中顺利显示中文的方法

中文从头到尾就是个坑http://www.dataguru.cn/thread-82742-1-1.html

2016-01-13 11:05:21 1350

转载 R绘图中使用中文字体

Windows系统字体存放在:C:\Windows\FontsR 调用方法如下windowsFonts( A=windowsFont("华文彩云"), B=windowsFont("华文仿宋"), C=windowsFont("华文行楷"), D=windowsFont("华文楷体"), E=windowsFont("华文隶书"), F=wi

2016-01-11 20:34:29 3346

原创 python 安装ggplot包

python装包:pip install 包名但此包装了两个晚上才装好,因为又遇到坑了,所以来记录下比如,我要装C包,而C包呢要依附A、B两个包,顺利情况下,我pip intall  C,系统会乖乖的先装上A、B两个包,再装好C包,但这次坑来了,A包是源代码,不能识别,有两种办法:1.安装编译器,这样pip install 的时候可以把A包的源代码编译到可识别;2.安装非源代码A包,这样呢

2016-01-08 20:49:58 2912

原创 以产品调价需求为例,谈谈决策树分类算法

决策树算法:http://www.cnblogs.com/biyeymyhjob/archive/2012/07/23/2605208.html实例应用:某网站在不同的城市(city)不同的类目(category)卖一款产品,不同的城市和类目价格是不同的,现需要甄别出哪些城市的哪些类目产品的价格需要做调整,需要涨价,降价,或不调整?方法:决策树衡量指标:

2016-01-08 17:11:56 1083

原创 Excel VBA 如何生成.csv或.xlsx文件

生成.csv或.xlsx文件,本身是件easy的事情,比如可以用R,Python。。。但R有个局限不能对excel里的文字底纹格式等进行修改,如需要字体加粗、底纹为蓝等等,于是想到用excel的VBA来实现。case1生成《2015-10-08置顶价格调整方案通知.xlsx》文件Sub 调价通知() 'excel控制word,生成新文件,插入图片和文件名,保存'office

2016-01-08 14:39:35 9924

原创 R+Latex 实现动态统计报告

本主是个懒人,讨厌日报、周报、月报这类重复性的工作。目前碰到的就是每月一次的调价效果分析报告,于是乎要把它们变成自动化报表,问题来了,怎么整呢?前两篇文章是铺垫,主要介绍技术,本文是应用,把R+latex的技术应用到动态统计报告的工作中。step1:对latex要有基本语法要有了解:排版语法:\documentclass{article} \title{Hello Wor

2016-01-07 17:45:00 1652

原创 latex中如何输出中文

问题:latex 默认情况下是为英文准备的,但大多数情况下我们用到的是中文report,how to solve it?方法:step1首先需要建立一个中文环境,也就是说需要安装【CJK包】 and 【Tex字体数据库】windows环境下,本主安装的是MIKtex,发现自带这两个东东,太棒了,因为据说安装起来巨麻烦。补充下如何安装包:打开MIKtex下的package man

2016-01-05 20:53:03 14163

原创 R-Latex sweave 如何隐藏R代码

问题:R导出结果时,如何将R的code隐藏掉,但显示需要显示部分,如图表方法:采用R与latex将结合的调用sweave方法,生成pdf文件step1:R中library(utils),因为需要使用包里的sweave()函数;latex设定好sweave包,方法:打开Miktex settings( admin),点击roots,点击add,将path设置为

2016-01-04 19:10:24 3358

原创 小程序



2014-10-17 20:52:28 294

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除