爬虫
文章平均质量分 81
✨Ringo
这个作者很懒,什么都没留下…
展开
-
爬虫学习W07-W12
re库原创 2021-05-15 21:59:31 · 54 阅读 · 0 评论 -
网络爬虫学习记录【WS04-WS06】
安装Beautiful Soup库pip install beautifulsoup4使用from bs4 import BeautifulSoupsoup = BeautifulSoup('<p>data</p>','html.parser')bs4库将任何html输入都变成utf-8编码解析器标签树下行遍历上行遍历如果要遍历所有先辈节点,包括soup本身,要注意区别判断for parent in soup.a.parents: if parent原创 2021-04-19 15:55:15 · 166 阅读 · 0 评论 -
网络爬虫学习记录【WS01-03】
安装requests库pip install requests测试import requestsr = requests.get("http://baidu.com")print(r.status_code)r.textRequests库的7个主要方法爬取网页的通用代码框架import requestsdef getHTMLText(url): try: r = requests.get(url,timeout=30) r,raise_for_s.原创 2021-04-16 02:07:19 · 164 阅读 · 1 评论