爬虫
GGYY院长
这个作者很懒,什么都没留下…
展开
-
代码实例 | 使用python、xpath解析爬取html网页内容、img网页图片
#!/usr/bin/env python # coding: utf-8 import requests import random from lxml import etree import urllib.request def download_img(): """ # html页面保存为本地文件 # img图片保存为本地文件 """ url = ...原创 2020-03-25 10:35:09 · 778 阅读 · 0 评论 -
代码实例 | python爬虫获取数据乱码 [ÍøÕ¾½éÉÜ],动态js 查看隐藏url
解决思路: 对请求到的网页内容进行编码操作后再进行解码操作 url = 'http://baike.baidu.com/item/%E7%B3%96%E5%B0%BF%E7%97%85/100969' r = requests.get(url, headers=headers) r = r.text # print(r) # 对解析到的r内容r编码后再解码 r = r.encode('ISO-88...原创 2019-05-06 22:43:03 · 893 阅读 · 2 评论