python3简单爬虫，访问百度

最新推荐文章于 2024-08-16 19:52:36 发布

white_poland

最新推荐文章于 2024-08-16 19:52:36 发布

阅读量2.1k

点赞数 1

分类专栏： IT技术文章标签： python3 爬虫 urllib2 cookielib

本文链接：https://blog.csdn.net/weixin_40169642/article/details/82420876

版权

本文记录了作者在完成Python基础学习后，通过编写简单爬虫访问百度并获取页面源码的实践过程。示例代码展示了三种方法，以获取网页内容的长度作为输出结果。

摘要由CSDN通过智能技术生成

前几天把python基础看完，自己动手做了个小练习，写下这篇博客留作纪念。以下代码简单写了三种方式去访问百度界面并且拿到页面的数据（源码），由于页面数据太多，所以只打出了页面的长度。

# python3中用urllib.request表示python2中的urllib2
import urllib.request as urllib2
# python3中用http.cookiejar表示python2中的cookielib
import http.cookiejar as cookielib

print ("第一种方式")
# 需要访问的url
url="https://www.baidu.com"
response=urllib2.urlopen(url)
# 返回一个数值结果，200表示正常
print (response.getcode())
# print(response.read().decode('