Java爬虫小项目
第一步:下载jsoup,下载网址为http://jsoup.org/
第二步:用idea建立项目,在项目设置(Ctrl+Shift+Alt+S)里边引入jar模块
第三步:写代码实现爬虫(例如英文单词翻译)
1、先在百度搜索任意一个单词的意思,将翻译的网址复制,在idea中写代码实现单词的翻译
public class user {
public static void main(String[] args) throws IOException {
String w = "book";
String u ="https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=public&rsv_pq=ef91da0900418678&rsv_t=535aSrPLzM2fBNk%2B0kb4KYQ5R0gj31i%2BbxfsRsmFc0isFOoi6RsqU2f3WxI&rqlang=cn&rsv_enter=1&rsv_dl=tb&rsv_sug3=9&rsv_sug1=7&rsv_sug7=101&rsv_sug2=0&inputT=3863&rsv_sug4=8979";
Document doc = Jsoup.connect(u).get();
Elements es = doc.select("span[class=op_dict_text2]");
es.forEach(e->System.out.println(e.html()));
2、这个爬虫代码的运行结果为
3、如果想要实现任意单词的查找,代码如下
4、运行结果为