python编的糗百小爬虫

最新推荐文章于 2024-07-12 16:42:46 发布

maxiee

最新推荐文章于 2024-07-12 16:42:46 发布

阅读量1.1k

点赞数

分类专栏： python 文章标签： Python 爬虫正则

本文链接：https://blog.csdn.net/maxiee/article/details/9894659

版权

python 专栏收录该内容

2 篇文章 1 订阅

订阅专栏

主要是学习一下正则，实现了最基本的功能，抓取热门的第一页，在此基础上还可以再发挥发挥。

import urllib.request
import re

data = urllib.request.urlopen('http://www.qiushibaike.com/hot/page/1').read()
prog = re.compile('<div class="content" title="(.*?)">(.*?)</div>',re.S)
prog2 = re.compile('<div.*?class="content".*?title="(.*?)">\\n(.*?)</div',re.S)
result = re.findall(prog2,data.decode('utf-8'))
for v in result:  
    print (v[0],v[1])

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

maxiee

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
python编的糗百小爬虫

主要是学习一下正则，实现了最基本的功能，抓取热门的第一页，在此基础上还可以再发挥发挥。import urllib.requestimport redata = urllib.request.urlopen('http://www.qiushibaike.com/hot/page/1').read()prog = re.compile('(.*?)',re.S)prog2
复制链接

扫一扫