js脚本爬取网页数据案例解析

注:所有网页数据都是以dom为节点存储的数据,只要获得该节点的dom中包含的内容即可。
该网页为例
我要爬取该网页的所有嘉宾的信息,我应该先获取每个嘉宾的dom值,取出里面的数据即可。
直接在浏览器控制台运行该脚本即可

var temp = document.getElementsByTagName("td");
for(var i = 0; i <= 104; i++){
    console.log(i);
    var res = "";
    var src = temp[i].childNodes[1].src;
    var en_name = temp[i].childNodes[3].childNodes[0].data;
    var ch_name = temp[i].childNodes[3].childNodes[2]==undefined?"无中文名": temp[i].childNodes[3].childNodes[2].data;
    var title =  temp[i].childNodes[5].childNodes[0].childNodes[0].data;
    var company = temp[i].childNodes[5].childNodes[2].data;
    res = src + "  " + en_name + "  " + ch_name+ "  " + title+ "  " + company;
    console.log(res); 
}
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值