自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 爬虫第二篇--豆瓣电影(Python)

爬虫第二篇–豆瓣电影上一篇写了关于requests爬虫的应用,但转换的格式为json格式的,那如果我要的数据在html代码当中呢?该如何提取?本文将提供一个思路(注:可能并非最好的方案)!1、还是获取网站的url、headers、cookies2、服务器返回响应3、使用BeautifulSoup解析(数据包含在html)4、保存本地.xls格式具体过程:1、观察url,第一页url...

2019-02-25 21:58:49 507

原创 requests爬数据--python

requests爬数据–python本人对于python用的不是很多,也无很深入的学过,但因为之前工作需要,用到python爬系统数据,自己研究了很久,查了很多资料,本人找到两篇很不错的总结(requests的用法及数据写入Excel),文章最后有链接。我用的是requests模块,简单实用,Requests模块缺陷:不能执行JS 和CSS 代码。用户获取网络数据的方式:方式1:浏览器提交请...

2019-02-25 15:24:16 718

原创 员工离职预测(logistic)(R语言)

员工离职预测(logistic)出于工作需要及个人兴趣,学习数据分析及R语言是差不多2年前,第一篇更新的文章为m久前做的员工离职预测,当时做这个项目的主要是为了学习logistic算法,数据来源为DC竞赛平台,本文章主要写的是思路及个人对logistic的理解,如有不合理或者不正确的地方,请指正!!!数据分为2部分,训练数据集及预测数据集(少了(2)Attrition)训练数据主要包括110...

2019-02-25 14:53:00 3781

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除