爬虫(1)

项目要求

自学爬虫

很迷

哈哈哈哈,但还是要学,毕竟是计算机专业的。

我负责的部分项目的利用爬虫再优酷网上下载视频,但是我现在毫无头绪,也不知如何下手。没有学过python,所以就边学习爬虫,边学习python。爬虫的结构和大致实现方式虽然已经了然于胸,但是具体怎么用代码去实现我还是无法下手。

下面的代码是我看了多篇csdn文章和爬虫实战书籍所总结出来的。

作用是爬取网页源码。

import urllib.request
resp=urllib.request.urlopen(“http://www.youku.com”)
s=resp.read()
ss=s.decode()
print(ss)
 

爬取的部分结果:


阅读更多
文章标签: 爬虫
个人分类: 简介
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

关闭
关闭
关闭