快速获取网页的部分元素(不用selenium,用js)

背景

网页是表格结构,现在需要快速从网页上获取一些元素的内容。但是对方系统不提供接口,只能手工爬(读书人的事情,拿来整理整理用用)。

最开始的时候考虑使用selenium,后来发现我本地代码太老了,运行不起来。需要更新一下jar包等各种环境。同时页面上还有登录校验,写起来太麻烦了。

又因为最近在写服务端程序,调试前端页面比较多,所以突发奇想,在页面控制台里输入js获取元素。

偷完数据很爽,记录一下

页面结构

表格结构,table>tbody>tr>td>a
需要从中取得 id, 主题,作者3个字段
这里写图片描述

结果

$(".hascontextmenu").each(
    function(){
        var t1=$(this).find(".subject>a").attr("href");
        var t2=$(this).find(".subject>a").text();
        var t3=$(this).find(".author>a").text();
        console.log(t1 +"," +t2 + "," +t3);
    }
)

从控制台中拷出来就能用了

这里写图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值