自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

yanan9256

数据挖掘、机器学习、自然语义识别爱好者

  • 博客(8)
  • 收藏
  • 关注

转载 使用Python将Word文件另存为任意支持的格式

原理是利用win32com接口直接调用office API,好处是简单、兼容性好,只要office能处理的,python都可以处理,处理出来的结果和office word里面“另存为”一致。from win32com import client as wc word = wc.Dispatch('Word.Application') doc = word.Documents.Open('/Fil

2015-10-14 09:26:18 14372 2

原创 R语言_安装包

从R-Forge上安装R包示例 install.packages(“partykit”, repos=”http://R-Forge.R-project.org”)如果是二进制的包 install.packages(“CHAID”, repos=”http://R-Forge.R-project.org”, type=”source”)从git上安装包 需安装devtools包 inst

2015-09-09 21:22:05 1446

原创 R语言_xlsx包

最近的工作中,希望excel中的数据,能用R来定期更新,测试了一些“xlsx”包中的函数,记录如下:read.xlsx() 读取excel文件函数write.xlsx() 将R中数据框写入xlsx文件,可向已存在文件追加sheet,自定义表名,中文也是OK的loadWorkbook() 将xlsx文件载入R中作为对象getSheets() 将R中的xlsx对象中的表读出作为对象remove

2015-09-09 21:20:26 4007

转载 R语言_字符串处理和grep的用法

R通常被用来进行数值计算比较多,字符串处理相对较少,而且关于字符串的函数也不多,用得多的就是substr、strsplit、paste、regexpr这几个了。实际上R关于字符串处理的功能是非常强大的,因为它甚至可以直接使用Perl的正则表达式,这也是R的一个理念,作为语言就把向量计算做到极致,作为环境,就在各领域都集成最好的。R中有

2015-09-09 21:17:19 12592

原创 Kmeans算法寻找合适K值

本文介绍使用DB_Index准则评估K的最优取值。 类内离散度和类间聚类常被用来判断聚类的有效性,DB_Index准则同时使用了类间聚类和类内离散度。 <># 载入示例数据data <- read.csv("C:/path/question_cluster.csv", header = T, stringsAsFactors = F)DB_index <- funct

2015-09-09 21:13:35 1555

原创 R_Split-Apply-combine

昨天看到豆瓣上一篇文章,是作者关于读Hadley Wickham的文章The Split-Apply-Combine Strategy for Data Analysis的笔记。 文章地址自己在用R整理数据的时候,为了避免显示循环,使用apply函数族的时候,常常遇到输入类型和输出类型搞混的情况,这篇文章对R base中的 split-apply-combine有一个很好的整理。以及介绍了R社区中

2015-09-01 17:05:18 876

原创 R_分类变量构造虚拟变量

a <- factor(rep(letters[1:3], 2)) # 产生一个因子变量a## [1] a b c a b c## Levels: a b ca_dummy <- model.matrix(~factor(a) - 1)a_dummy <- as.data.frame(a_dummy)names(a_dummy) <- paste("a", 1:length(a_dummy[

2015-09-01 16:33:53 2617

原创 任意格式文件转成字符串,传输之后,还原为原文件格式

示例: 需传输文件 C:\test.rar 输出的字符串文件 C:\test.txt 传输后,还原的新文件 C:\out.rarimport base64# 编码为字符串,输出到文本文件中fin = open(r'C:\test.rar', 'rb')fout = open(r'C:\test.txt', 'w')base64.encode(fin, fout)fin.close()

2015-09-01 16:22:52 993

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除