用正则表达式以及用Jsoup框架来解析网站

1.首先得写一个爬网站的方法
在这里插入图片描述
然后在查看输出的源代码,用正则表达式中的断言来截取如下
因为我这里要截取古城动态所以直接用前断言加开头的代码
在这里插入图片描述
在这里插入图片描述
后断言也同理
然后你想获得具体内容就在创一个方法通过前面获得的动态区的源代码接着重复上一步即可

然后用Jsopu怎么来解析呢,这个就更简单更方便了
首先需下载jsoup的jar文件,导入到你的编程工具里面去。
然后直接调用里面的connect()方法当然也需要先导包返回一个Document类型的
然后通过HTML里面的css的选择器直接解析,
在css选择器加上你要解析内容的标签class属性,返回一个Elementsl类型
然后增强型for循环输出一下就OK了,对了你也可以调用方法像我这里就text()方法就是获取文本
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值