- 博客(3)
- 资源 (16)
- 问答 (1)
- 收藏
- 关注
原创 Python 3.6 优雅的爬取猎聘网招聘信息
1. 通过三种方式抓取字段: 招聘标题 待遇 地区 学历要求 经验 公司名称 公司的行业 职位描述2. 效果预览 3. 注意事项 * 利用xpath或者其它方式选取节点时,需要注意判断是否为None,如果在后面调用.strip()等方法肯定会报错,所以建议提取出一个共用的判断方法 * url拼接问题,当大部分详情页链接都有schema时,突然返回你一个没...
2018-03-20 22:34:05 5012 5
原创 用Python大神Kennethreitz新框架request-html爬妹纸图遇坑记
一、不了解用法的可以去了解用法 代码传送门二、这个网站不小心点开的,感觉大家应该都会喜欢,下载图片这块要仔细,其他地方按部就搬 一般下载图片都是用 req = request.Request(url, headers=headers) f.write(request.urlopen(req).read()) headers中包含了Use-Agent或者Refer...
2018-03-13 01:18:06 1801
原创 Python3.6爬虫集合 xpath bs4 re 爬51job前程无忧招聘信息 豆瓣音乐等等
总结一下这两天自己写的爬虫,之前一直用框架爬虫,感觉有必要熟练最基础的没有框架爬虫才能让我更好理解框架,代码在链接内,代码中都有详细的注释1. 发送邮件,这里选择发送网页邮件,其他邮件发送可以看廖雪峰老师的教程 * 邮件协议为SMTP,端口为25 * 需要模块 email(构造邮件) smtplib(发送邮件) * 代码传送门 * 无具体注意事项2. xpath爬取豆瓣音乐...
2018-03-09 22:55:04 1313
alarmclock
2016-06-04
几种方法实现下拉刷新,上拉加载
2016-05-02
material design的几种布局
2016-04-29
Android Studio里出现的问题,该怎么解决?
2015-11-26
TA创建的收藏夹 TA关注的收藏夹
TA关注的人