- 博客(3)
- 收藏
- 关注
转载 爬取京东乱码问题
爬取京东乱码问题 今天遇到的一个关于提取内容使用text或者是content: text和content的区别: resp.text返回的是Unicode型的数据。 resp.content返回的是bytes型也就是二进制的数据。 也就是说,如果你想取文本,可以通过r.text。 如果想取图片,文件,则可以通过r.content。 (resp.json()返回...
2019-04-23 23:31:00
689
转载 pip18.1到19.0.3的升级
我是如何安装的呢?先使用命令curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py注意,这个命令要比较久的时间 然后使用命令python get-pip.py就安装好了! 转载于:https://www.cnblogs.com/ysl-manba/p/10519582.html...
2019-03-12 20:51:00
146
转载 爬虫必备技巧
了解HTML 会使用HTML标签构造页面,知道如何解析出DOM里标签,提取想要的数据内容 了解CSS 了解CSS,会解析出样式里的数据内容 了解JS 基本JS语法,能写能读懂,并了解JS库:Jquery,Vue 等,可以对使用开发者工具调试JS 了解JSON 了解JSON数据,会序列化和反序列化数据,通过解析JSON对象获取数据内...
2018-11-21 09:54:00
41
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人