![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
beautifulsoup库的常用
小弧y
11
展开
-
python-通过特定的文本 爬取网页链接(标签)
from bs4 imp #html文本 html_text="" soup=BeautifulSoup(html_text,'html.parser') a=soup.select('a') for i in a: if i.string=="关键词": findb_ur=i['href'] #输出通过搜索a标签中的字符串获得网页链接 # print(f...原创 2019-07-04 16:42:12 · 5367 阅读 · 0 评论 -
beautifulsoup 错误 that document to Beautiful Soup decoded_markup的解决方法
发生错误的代码: import requests from bs4 import BeautifulSoup url="https://www.baidu.com/" def gethtmltext(url): try: r=requests.get(url) if r.status_code==200: r.encoding=r...原创 2019-08-28 16:15:41 · 1032 阅读 · 0 评论