matlab抓取网页信息,如何利用Matlab抓取网页数据

最新推荐文章于 2024-05-13 08:38:41 发布

涂诗语

最新推荐文章于 2024-05-13 08:38:41 发布

阅读量1.3k

点赞数

文章标签： matlab抓取网页信息

如何利用Matlab抓取网页数据

2019-01-01

%朋友需要做金融方面的分析，要求从网站上下载大量的数据，一个一个复制粘贴太费事。我写了一个简单的网络爬虫，主要用到正则表达式，可以自动下载网页源文件里面的数据。

clc;

clear;

warning off;

for year =2010:2011 %年份

for season =1:4 %季度

fprintf("%d年%d季度的数据...", year, season)

[sourcefile, status] =urlread(sprintf("http://vip.stock.finance.sina.com.cn/corp/go.php/vMS_MarketHistory/stockid/000001/type/S.phtml?year=%d&season=%d",year));

if ~status

error("读取出错！\n")

end

expr1 ="\s+(\d\d\d\d-\d\d-\d\d)\s*"; %获取日期("s"空格字符间的日期数据)

[datefile, date_tokens]= regexp(sourcefile, expr1, "match","tokens"); %返回正则表达式的两个关键字"match"和 "tokens"

date = cell(size(date_tokens));

for idx = 1:length(date_tokens)

date{idx} =date_tokens{idx}{1}; %length(date_tokens)行 1列

end

expr2 = "(\d*\.?\d*)

";%从源文件中获取目标数据

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
matlab抓取网页信息,如何利用Matlab抓取网页数据

如何利用Matlab抓取网页数据2019-01-01%朋友需要做金融方面的分析，要求从网站上下载大量的数据，一个一个复制粘贴太费事。我写了一个简单的网络爬虫，主要用到正则表达式，可以自动下载网页源文件里面的数据。clc;clear;warning off;for year =2010:2011%年份for season =1:4%季度fprintf("%d年%d季度的数据......
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。