爬虫
静待花开s0
If you find a path with no obstacles, it probably doesn't lead anywhere.
展开
-
python爬虫爬取豆瓣Top250的书籍信息,并保存到文件
python爬虫爬取豆瓣Top250的书籍信息,并保存到文件import requestsfrom bs4 import BeautifulSoupresp = requests.get('https://book.douban.com/top250?start=0')soup = BeautifulSoup(resp.text, 'lxml')# 发出请求获得HTML源码的函...原创 2019-04-06 20:50:07 · 1932 阅读 · 3 评论 -
python爬虫之——爬取煎蛋网图片
事先声明:本人之前并没有听说过什么煎蛋网,代码学习来自其他网站,仅供学习使用。import requestsimport osimport timefrom bs4 import BeautifulSoup# 发出请求获得HTML源码def get_html(url): # 指定一个浏览器头 headers = { 'User-Agent': '...转载 2019-04-06 23:33:22 · 1590 阅读 · 3 评论 -
UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 29531: illegal multibyte s
爬虫路上踩的第一个坑:UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 29531: illegal multibyte sequence就这么几行代码,为了获取baidu主页的网页源代码,一直报错,如标题,在网上查了许多,最终解决了import urllib.requestimp...原创 2019-03-28 21:28:22 · 4179 阅读 · 0 评论