Python3 urllib抓取指定URL的内容

最新推荐文章于 2019-04-16 12:33:00 发布

wangkjs

最新推荐文章于 2019-04-16 12:33:00 发布

阅读量615

点赞数

分类专栏： Python-模块

Python-模块专栏收录该内容

9 篇文章 0 订阅

订阅专栏

Python爬虫主要使用的是urllib模块，Python2.x版本是urllib2，很多博客里面的示例都是使用urllib2的，因为我使用的是Python3.3.2，所以在文档里面没有urllib2这个模块，import的时候会报错，找不到该模块，应该是已经将他们整合在一起了。

下面是一个简单的代码示例：

[python]view plaincopy 
   
 #encoding:UTF-8  
 import urllib.request  
 def getdata():  
     url="http://www.baidu.com"  
     data=urllib.request.urlopen(url).read()  
     print(data)  
   
 getdata()  

结果：

中文转码，修改一下代码：

[python]view plaincopy 
   
 #encoding:UTF-8  
 import urllib.request  
 def getdata():  
     url="http://www.baidu.com"  
     data=urllib.request.urlopen(url).read()  
     z_data=data.decode('UTF-8')  
     print(z_data)  
   
 getdata()  

结果如下：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

wangkjs

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python3 urllib抓取指定URL的内容

Python爬虫主要使用的是urllib模块，Python2.x版本是urllib2，很多博客里面的示例都是使用urllib2的，因为我使用的是Python3.3.2，所以在文档里面没有urllib2这个模块，import的时候会报错，找不到该模块，应该是已经将他们整合在一起了。下面是一个简单的代码示例：[python] view plaincopy
复制链接

扫一扫