菜鸟成长记-----用python写一个简单的小爬虫

最新推荐文章于 2021-04-03 00:08:03 发布

这个笨小孩

最新推荐文章于 2021-04-03 00:08:03 发布

阅读量487

点赞数

本文链接：https://blog.csdn.net/zh1023135024/article/details/72730122

版权

小白突发奇想想来搞一搞之前的课设，于是下了个python编辑器Pycharm写个爬虫耍一耍，这里权且记下来供后人（也就是小白自己拉）参考。

Pthon3中urllib2等几个库被整合了一下，所以在调用urlopen函数的时候就不能在通过urllib库调用了，需要引入urllib.request库让后通过这个库进行调用，之后通过这个库调用这个函数就行了，就像这样

page = urllib.request.urlopen(url)

这样我们就创建了一个远程类文件对象page，通过调用read函数可以读取到网页内的源码，对于这些源码可以把他们写在txt文件中，输入文件参数的时候稍微注意一下路径中“\”和“/”，方式设置为“wb+”表示用二进制打开输入，这样一个简答的小爬虫就做好了，了了数行代码如下：

import urllib.request

url = "http://www.view.sdu.edu.cn/"

page = urllib.request.urlopen(url)
html = page.read()


file = open("搜索引擎\\test.txt","wb+")
file.write(html)

这个笨小孩

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
菜鸟成长记-----用python写一个简单的小爬虫

小白突发奇想想来搞一搞之前的课设，于是下了个python编辑器Pycharm写个爬虫耍一耍，这里权且记下来供后人（也就是小白自己拉）参考。 Pthon3中urllib2等几个库被整合了一下，所以在调用urlopen函数的时候就不能在通过urllib库调用了，需要引入urllib.request库让后通过这个库进行调用，之后通过这个库调用这个函数就行了，就像这样
复制链接

扫一扫