解决Jsoup解析html页面空格(&nbsp)解析为乱码(问号)

解决方法:

.text()之后转换一下,即将&nbsp替换为普通的空格.replace(Jsoup.parse(" ").text(), " "); 

要使用jsoup抓取并输出"1994 / 美国 / 犯罪 剧情"这样的信息,首先需要对HTML页面进行解析。以下是详细步骤: 1. **添加jsoup依赖**:确保你的Java项目中已经添加了jsoup库的依赖。如果使用Maven,可以在pom.xml文件中加入jsoup的相关依赖项。 2. **加载HTML文档**:使用Jsoup的`connect`方法加载目标URL的HTML文档,或者使用`parse`方法从HTML字符串中解析文档。 3. **解析DOM元素**:根据HTML的结构,使用Jsoup提供的DOM遍历方法或CSS选择器来查找包含"1994 / 美国 / 犯罪 剧情"信息的特定元素。 4. **提取文本信息**:一旦定位到包含这些信息的元素,可以使用`text()`方法或者`ownText()`方法提取元素的文本内容。 5. **输出结果**:将提取到的信息按照需要的格式输出。 以下是一个简化的示例代码,演示如何使用Jsoup抓取页面中的特定信息: ```java import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; public class JsoupExample { public static void main(String[] args) { try { // 连接到网页并获取文档对象 Document doc = Jsoup.connect("http://example.com").get(); // 根据HTML结构选择元素,这里假设信息在一个class为"info"的div内 Element infoDiv = doc.select(".info").first(); // 提取并打印文本信息 String infoText = infoDiv.ownText(); System.out.println(infoText); } catch (Exception e) { e.printStackTrace(); } } } ``` 请注意,上述代码仅为示例,你需要根据实际的HTML页面结构和元素来调整选择器。同时,异常处理也应根据具体情况进行完善。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值