自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (1)
  • 收藏
  • 关注

原创 R语言ETL工程:创建字段(mutate)

作者:黄天元,复旦大学博士在读,热爱数据科学与R,热衷推广R在工业界与学术界的应用。邮箱:huang.tian-yuan@qq.com.欢迎合作交流有没有一些时候你想要给表格加一个新的列?本章将会介绍如何在表格中创建新的字段。但是首先我们要知道为什么要什么做,下面是可能的一些情况: 有时候需要构造一列全部是0或1的数列,或者是给每一个记录赋予一个不同的ID; 购物数据中,含有单...

2019-01-05 21:00:26 4083 1

原创 关于动态网页的抓取

参考http://www.cnblogs.com/weibaar/p/4302870.html#3687411因为拉勾网已经改版,所以参考的案例已经失效。可能涉及到动态网络抓取的问题,后面有机会再探索,具体机制同学解释如下:关于某方面的内容所有的网址都一样,而数据在后台数据库无法直接访问,因此URL抓取已经不好用。但是每一个工作的网页还是静态的,简单粗暴可以直接抓所有的数据,然后把

2017-11-01 11:27:16 488

原创 R语言爬虫尝试

使用R语言的rvest和xml2包进行网络爬虫,其中stringr包完成了构造正则表达式的工作。

2017-11-01 11:12:04 645

生物多样性计算软件

可以计算各种生物多样性指数,包括辛普森、香农威纳等等。

2014-11-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除