- 博客(2)
- 收藏
- 关注
原创 python学习总结(二):通过Selenium爬取公司办公网
由于“八项规定”要求“要精简文件简报,切实改进文风,没有实质内容、可发可不发的文件、简报一律不发。”但根据个人感觉本人所在公司的文件却有增无减。为了进一步想弄清楚关系所以对公司近5年的文件标题进行了搜集分析。现将要点记录如下:1.公司办公网的登录和认证。出师不利,由于是公司内部办公网,不输入账号和密码是无法进入的。本人无法通过selenium定位弹出账号窗口元素,最后通过搜集找到了在网址中...
2018-06-25 01:34:38
428
原创 python学习总结(一);爬取今日头条图片
通过崔庆才老师的《网络爬虫开发实战》,现将自己学习要点记录如下:1.分析ajax。利用params和urlencode,构建request url。params = { 'offset': offset, 'format': 'json', 'keyword': '电影', 'autoload': 't...
2018-06-11 23:24:31
1108
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人