爬虫
sd6364152
这个作者很懒,什么都没留下…
展开
-
python 爬虫中文乱码问题
在爬取网站是遇到requests得到的respone为.这是因为被urlencode转码了先用import urllibimport urllib.parseurllib.parse.unquote(res.text)得到这其实已经是一段unicode编码了,只不过是将 \ 反斜杠 被换成了 % 百分号然后我们直接把% replace一下urllib.parse.unquote(res.text).replace(’%’,’\’).encode().decode(‘unicode-esca原创 2021-01-05 18:02:19 · 195 阅读 · 0 评论 -
python pandas的read_html方法爬取网页表格
python pandasd的read_html方法爬取网页表格网页总的表格数据通常保存在table标签下,结构为:............ ... ............ ... ... ...原创 2019-05-24 10:11:11 · 8103 阅读 · 0 评论