使用jsoup爬虫遇到的问题 Unhandled content type. Must be text/*, application/xml

本文介绍了解决org.jsoup.UnsupportedMimeTypeException异常的方法,当遇到不可处理的MIME类型如application/json时,通过添加.ignoreContentType(true)来忽略内容类型检查,确保网页内容正确解析。
摘要由CSDN通过智能技术生成

org.jsoup.UnsupportedMimeTypeException: Unhandled content type. Must be text/*, application/xml, or application/xhtml+xml. Mimetype=application/json;charset=UTF-8
 

是因为没有加上ignoreContentType(true),完整的写法是,

Connection.Response document = Jsoup.connect(url).timeout(4000).userAgent("Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.15").ignoreContentType(true).execute();

 

欢迎关注我的微信公众号,更多内容将在微信公众号中发布:

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值