python 爬虫（1）

最新推荐文章于 2024-04-01 13:30:49 发布

orchidzouqr

最新推荐文章于 2024-04-01 13:30:49 发布

阅读量377

点赞数

分类专栏： python爬虫

本文链接：https://blog.csdn.net/orchidzouqr/article/details/52577650

版权

python爬虫专栏收录该内容

1 篇文章 0 订阅

订阅专栏

基础的爬行语句包括获取网页的html和解析，获取网页html内容主要用到urllib2库里的urlopen函数，返回值是个file-like object,记该对象为response，采用response.read()即可获得网页的html内容。然后利用BeautifulSoup函数解析网页即可。如下例：

import urllib2
from bs4 import BeautifulSoup
url="https://www.baidu.com/"
response=urllib2.urlopen(url)
html=response.read()
bs0=BeautifulSoup(html)
print(bs0.script)     #打印<script>标签及其包含的内容

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

orchidzouqr

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 爬虫（1）

基础的爬行语句包括获取网页的html和解析，获取网页html内容主要用到urllib2库里的urlopen函数，返回值是个file-like object,记该对象为response，采用response.read()即可获得网页的html内容。然后利用BeautifulSoup函数解析网页即可。如下例：import urllib2from bs4 import BeautifulSou
复制链接

扫一扫