java 访问百度_使用Java调用百度搜索

最新推荐文章于 2021-03-05 00:58:14 发布

weixin_39827315

最新推荐文章于 2021-03-05 00:58:14 发布

阅读量1.4k

点赞数 1

文章标签： java 访问百度

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39827315/article/details/114076706

版权

本文介绍如何利用Java的JSoup库调用百度搜索API，详细讲解了搜索结果的获取方法，包括处理百度百科和百度知道的特殊情况。通过示例代码展示了如何解析搜索结果，提取网页标题、URL和摘要。

摘要由CSDN通过智能技术生成

如何利用Java来调用百度搜索，更多细节请到github上查看search

自己没搜索引擎，又想要大规模的数据源，怎么办？可以对百度搜索善加利用，以小搏大，站在巨人的肩膀上。有很多的应用场景可以很巧妙地借助百度搜索来实现，比如网站的新闻采集，比如技术、品牌的新闻跟踪，比如知识库的收集，比如人机问答系统等，我之前做的一个准确率达百分之九十几的人机问答系统的数据源，其中一部分就是充分利用了百度搜索。我们可以很容易地扩展到其他的搜索引擎，使用JSoup+CSSPath技术，轻松获取页面的自定义的内容。

package org.apdplat.search;

import java.io.IOException;

import java.util.ArrayList;

import java.util.List;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

import org.jsoup.Jsoup;

import org.jsoup.nodes.Document;

import org.jsoup.nodes.Element;

import org.slf4j.Logger;

import org.slf4j.LoggerFactory;

public class JSoupBaiduSearcher extends AbstractBaiduSearcher{

private static final Logger LOG = LoggerFactory.getLogger(JSoupBaiduSearcher.class);

@Override

public SearchResult search(String keyword) {

return search(keyword, 1);

}

@Override

public SearchResult search(String keyword, int page) {

int pageSize = 10;

//百度搜索结果每页大小为10，pn参数代表的不是页数，而是返回结果的开始数

//如获取第一页则pn=0，第二页则pn=10，第三页则pn=20，以此类推，抽象出模式：(page-1)*pageSize

S

最低0.47元/天解锁文章

weixin_39827315

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。