- 博客(3)
- 收藏
- 关注
原创 爬虫第二篇--豆瓣电影(Python)
爬虫第二篇–豆瓣电影上一篇写了关于requests爬虫的应用,但转换的格式为json格式的,那如果我要的数据在html代码当中呢?该如何提取?本文将提供一个思路(注:可能并非最好的方案)!1、还是获取网站的url、headers、cookies2、服务器返回响应3、使用BeautifulSoup解析(数据包含在html)4、保存本地.xls格式具体过程:1、观察url,第一页url...
2019-02-25 21:58:49 509
原创 requests爬数据--python
requests爬数据–python本人对于python用的不是很多,也无很深入的学过,但因为之前工作需要,用到python爬系统数据,自己研究了很久,查了很多资料,本人找到两篇很不错的总结(requests的用法及数据写入Excel),文章最后有链接。我用的是requests模块,简单实用,Requests模块缺陷:不能执行JS 和CSS 代码。用户获取网络数据的方式:方式1:浏览器提交请...
2019-02-25 15:24:16 726
原创 员工离职预测(logistic)(R语言)
员工离职预测(logistic)出于工作需要及个人兴趣,学习数据分析及R语言是差不多2年前,第一篇更新的文章为m久前做的员工离职预测,当时做这个项目的主要是为了学习logistic算法,数据来源为DC竞赛平台,本文章主要写的是思路及个人对logistic的理解,如有不合理或者不正确的地方,请指正!!!数据分为2部分,训练数据集及预测数据集(少了(2)Attrition)训练数据主要包括110...
2019-02-25 14:53:00 3784
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人