对股票网站信息爬虫

最新推荐文章于 2024-06-11 21:05:50 发布

AK47会走火

最新推荐文章于 2024-06-11 21:05:50 发布

阅读量1.6k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42558459/article/details/80833914

版权

本文档介绍了使用Python进行股票信息爬取的实验，目标是获取http://quote.stockstar.com/stock/ranklist_a_3_1_1.html网站的数据。实验涉及到的关键技术包括Python的re模块正则表达式和urllib.request模块。通过re模块的编译和findall方法解析网页内容，urllib.request模块的urlopen和Request类用于打开和处理URL。实验旨在让读者熟悉爬虫技术和正则表达式在数据抓取中的应用。

摘要由CSDN通过智能技术生成

实验目的

初步熟悉并掌握爬虫技术

实验内容

对网站http://quote.stockstar.com/stock/ranklist_a_3_1_1.html的股票信息进行爬取，并保存到文档中

实验分析

python中的正则表达式（re模块）

一、简介

正则表达式本身是一种小型的、高度专业化的编程语言，而在python中，通过内嵌集成re模块，程序媛们可以直接调用来实现正则匹配。正则表达式模式被编译成一系列的字节码，然后由用C编写的匹配引擎执行。

二、正则表达式中常用的字符含义

1、compile()

编译正则表达式模式，返回一个对象的模式。（可以把那些常用的正则表达式编译成正则表达式对象，这样可以提高一点效率。）

格式：

re.compile(pattern,flags=0)

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
对股票网站信息爬虫

实验目的初步熟悉并掌握爬虫技术实验内容对网站http://quote.stockstar.com/stock/ranklist_a_3_1_1.html的股票信息进行爬取，并保存到文档中实验分析流程图 python中的正则表达式（re模块）一、简介正则表达式本身是一种小型的、高度专业化的编程语言，而在python中，通过内嵌集成re模块，程序媛们可以直接调用来实现正则匹配。正...
复制链接

扫一扫

AK47会走火 CSDN认证博客专家 CSDN认证企业博客

码龄6年

2: 原创

209万+: 周排名

191万+: 总排名

4825: 访问

: 等级

71: 积分

2: 粉丝

1: 获赞

3: 评论

6: 收藏

私信

关注

热门文章

最新评论

对选股宝实时信息进行爬虫
python渣渣: 你这叫实时爬虫?
对选股宝实时信息进行爬虫
AK47会走火回复 chuong: 我感觉我的资历和能力还不够，但谢谢你的鼓励，希望以后有机会认识贵公司
对选股宝实时信息进行爬虫
chuong: 这位同学，欢迎到我司实习

最新文章

对选股宝实时信息进行爬虫

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。