Matlab 爬虫 Web Scraping with Matlab 02--爬取酷狗TOP500的数据

一、利用的函数

主要利用matlab中的webread 和regexp两个函数

二、爬虫思路

获取源码发现,歌手和歌曲都存在这个标签里

所以使用regexp正则匹配就好了

三、实现

clc;close all;clear all

top = cell(501,2);%
k=1;
top{1,1}='名次';
top{1,2}='歌手-歌名';

for i=1:23
    url = strcat('http://www.kugou.com/yy/rank/home/',num2str(i),'-8888.html?from=rank');
    webdate = webread(url);
    tpn = 'li class=" " title=(.*?)data-index';
    [sdate,~,~] = regexp(webdate,tpn,'tokens');
    sn = length(sdate);
    for j=1:sn

        top{k+1,1}=strcat('第',num2str(k),'名');
        top(k+1,2)=sdate{j};
        k=k+1;
    end
end

  实现的结果

转载于:https://www.cnblogs.com/mathpro/p/9051962.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值