beautifulsoap爬虫

最新推荐文章于 2021-12-26 17:40:34 发布

weixin_30538029

最新推荐文章于 2021-12-26 17:40:34 发布

阅读量111

点赞数

文章标签： python 爬虫

原文链接：http://www.cnblogs.com/j-c-y/p/11454855.html

版权

从html文件读

from bs4 import BeautifulSoup
html_doc="文件地址"
html_file=open(html_doc,"r")
html_handle=html_file.read()
soup=BeautifulSoup(html_handle,'html.parser') #选择解析方法
print(soup)

从网页读

from bs4 import BeautifulSoup
import requests
url="http://www.cnblogs.com/j-c-y/p/11129345.html"
page=requests.get(url).text
soup=BeautifulSoup(page,'html.parser') #选择解析方法
print(soup)

转载于:https://www.cnblogs.com/j-c-y/p/11454855.html