爬虫
文章平均质量分 81
✨Ringo
这个作者很懒,什么都没留下…
展开
-
爬虫学习W07-W12
re库原创 2021-05-15 21:59:31 · 69 阅读 · 0 评论 -
网络爬虫学习记录【WS04-WS06】
安装Beautiful Soup库 pip install beautifulsoup4 使用 from bs4 import BeautifulSoup soup = BeautifulSoup('<p>data</p>','html.parser') bs4库将任何html输入都变成utf-8编码 解析器 标签树下行遍历 上行遍历 如果要遍历所有先辈节点,包括soup本身,要注意区别判断 for parent in soup.a.parents: if parent原创 2021-04-19 15:55:15 · 180 阅读 · 0 评论 -
网络爬虫学习记录【WS01-03】
安装requests库 pip install requests 测试 import requests r = requests.get("http://baidu.com") print(r.status_code) r.text Requests库的7个主要方法 爬取网页的通用代码框架 import requests def getHTMLText(url): try: r = requests.get(url,timeout=30) r,raise_for_s.原创 2021-04-16 02:07:19 · 220 阅读 · 1 评论