- 博客(2)
- 收藏
- 关注
转载 Python爬虫: 正则表达式
一般的正则表达式都可直接到正则生成工具处生成,http://tool.oschina.net/regex/ 为常用的在线正则表达式工具常见匹配字符re.match及其常规匹配re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。re.match(pattern, string, flags = 0)返回的为一个对象,其中span代表长度 ...
2018-06-30 20:32:05 231
转载 Python爬虫: Requests库的基本使用
基本属性requests.get是requests库的基本方法,请求的对象拥有status.code, text, cookies等基本属性,也可以通过json的形式返回结果对于想要下载的图片及视频,可以通过content的形式获取,并在本地通过with open write选择路径保存Headersrequests也有headers的参数,来模拟浏览器headers的内容,对于一般有基础反爬机制...
2018-06-30 16:00:39 211
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人