- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 R语言ETL工程:创建字段(mutate)
作者:黄天元,复旦大学博士在读,热爱数据科学与R,热衷推广R在工业界与学术界的应用。邮箱:huang.tian-yuan@qq.com.欢迎合作交流有没有一些时候你想要给表格加一个新的列?本章将会介绍如何在表格中创建新的字段。但是首先我们要知道为什么要什么做,下面是可能的一些情况: 有时候需要构造一列全部是0或1的数列,或者是给每一个记录赋予一个不同的ID; 购物数据中,含有单...
2019-01-05 21:00:26 4083 1
原创 关于动态网页的抓取
参考http://www.cnblogs.com/weibaar/p/4302870.html#3687411因为拉勾网已经改版,所以参考的案例已经失效。可能涉及到动态网络抓取的问题,后面有机会再探索,具体机制同学解释如下:关于某方面的内容所有的网址都一样,而数据在后台数据库无法直接访问,因此URL抓取已经不好用。但是每一个工作的网页还是静态的,简单粗暴可以直接抓所有的数据,然后把
2017-11-01 11:27:16 488
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人