python3 爬虫 HTML 指定内容

最新推荐文章于 2022-07-31 07:20:36 发布

九州征途

最新推荐文章于 2022-07-31 07:20:36 发布

阅读量413

点赞数

本文链接：https://blog.csdn.net/cszskkk1/article/details/72770783

版权

写了个简单爬虫工具！！

python 爬 HTML 指定内容注意 python 3的平台下使用

# -*- coding: utf-8-*-
import urllib.request
import re
num = 1
while num<1915:
 num += 1
 url= "http://www.ynshangji.com/shen-huangye/"
 url= url + str(num)
 data = urllib.request.urlopen(url).read()#
 data = data.decode('gbk')
 allfinds2 = re.findall(r'<a href="/......./" target="_blank">(.+?)</a>',data,re.S)
 i = 1
 print (num)
 while i<21:
     print(allfinds2[i].strip())
     i += 2
     pass

运行python test.py

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

九州征途

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python3 爬虫 HTML 指定内容

写了个简单爬虫工具！！ python 爬 HTML 指定内容注意 python 3的平台下使用 # -*- coding: utf-8-*-import urllib.requestimport renum = 1while num<1915: num += 1 url= "http://www.ynshangji.com/shen-huangye/
复制链接

扫一扫