爬虫
文章平均质量分 90
一枚空指针
这个作者很懒,什么都没留下…
展开
-
Python 正则表达式 过滤html
这篇笔记适用于爬取网页信息时,选择保存整个html文件,再过滤得到其中需要的信息。用到的技术是python正则表达式处理,推荐一篇正则表达式基础文章:点击打开链接⑴通过re模块提供对正则表达式的支持⑵使用到其中的功能函数findall(),实现遍历匹配,可以获取字符串中所有匹配的字符串,返回一个列表。⑶使用到函数中的参数:re.S(DOTALL)使.匹配包括换行在内的所有字原创 2018-01-25 17:47:08 · 1455 阅读 · 0 评论 -
Python 自动查询 12306 余票并发送邮箱提醒 (selenium)
由于车票难抢,有时需要的车票已经售空,而我们需要捡漏,便可使用这个脚本。具体实现了,自动查询某一车票的余票数量,当数量产生变化时,将自动发送QQ邮件到对于的邮箱进行提醒。其中,发送邮箱的部分详情可参考我上一篇博文:Python 发送邮件 (smtp) QQ邮箱脚本使用了python + selenium + chrome webdriver,需要先配置好三者的环境。具体使用时候,需原创 2018-01-30 16:18:48 · 2980 阅读 · 0 评论