Java爬虫：通过有道翻译获取单词和词组意思

最新推荐文章于 2023-07-17 15:22:24 发布

mumoing

最新推荐文章于 2023-07-17 15:22:24 发布

阅读量1.4k

点赞数 1

文章标签： Java 爬虫单词翻译 Httpclient jsoup

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mumoing/article/details/80466849

版权

注意：这个不是调用有道翻译的api而是使用爬虫进行信息爬取的。

经测试有道对于手机网页版的单词的查询并没有设置时间间隔的反爬虫机制（so 速度还是很快的）；

使用HttpClient-4.5.5进行请求，使用jsoup-1.11.2进行解析。

下面附上调用函数：

public static String getTranslate(String word)throws Exception
{
	word=word.replaceAll(" ", "+");
	String url="http://m.youdao.com/dict?le=eng&q="+word;
	CloseableHttpClient client=HttpClients.createDefault(); //创建一个可关闭的客户端
	HttpGet hp=new HttpGet(url);//创建post方法
	//设置头信息
	hp.setHeader("Accept", "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8");
	hp.setHeader("Accept-Encoding", "gzip, deflate");
	hp.setHeader("Accept-Language","zh-cn");
	hp.setHeader("Connection","keep-alive");
	hp.setHeader("Cookie","___rl__test__cookies=1526297207528; JSESSIONID=abc8T9npcpuvChUlnzEnw; _yd_newbanner_day=14; OUTFOX_SEARCH_USER_ID_NCOO=1006420317.710858; OUTFOX_SEARCH_USER_ID=1297994902@220.180.56.52");
	hp.setHeader("Host","m.youdao.com");
	hp.setHeader("Referer","http://m.youdao.com");
	hp.setHeader("Upgrade-Insecure-Requests","1");
	hp.setHeader("User-Agent","Mozilla/5.0 (iPhone; CPU iPhone OS 11_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/11.0 Mobile/15E148 Safari/604.1");
	CloseableHttpResponse response=client.execute(hp);
	HttpEntity entity = response.getEntity();
	String web= EntityUtils.toString(entity,"UTF-8");
	//System.out.println(web);
	int i=web.indexOf("该词条暂未被收录");
	if(i==-1)
	{
	Document doc=Jsoup.parse(web,"utf-8");
	Elements con=doc.getElementsByTag("ul");
	
		
		return con.get(2).text();
	}else{
		return "该词条暂未被收录";
		
	}
}

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

mumoing CSDN认证博客专家 CSDN认证企业博客

码龄9年

22: 原创

19万+: 周排名

5万+: 总排名

4万+: 访问

: 等级

516: 积分

60: 粉丝

79: 获赞

6: 评论

109: 收藏

私信

关注

分类专栏

python 1篇
服务器 2篇
Java日常 3篇
JS 1篇
ios App 1篇
杂记 3篇

最新评论

威联通无损迁移系统盘(raid1降级独立硬盘)
血色噬魂: 按作者的步骤，成功扩容系统盘，这是我所有看过的相关教程里，最方便快捷的更换方案，感谢作者！
威联通无损迁移系统盘(raid1降级独立硬盘)
陈家声: 昨天找了威联通售后，通过远程通过ssh帮我搞定了固态扩容的问题，主要是lvs中的容量没起来
威联通无损迁移系统盘(raid1降级独立硬盘)
陈家声: 1.我系统盘原来是1T“西数固态”，本次更换为2T“致态固态”；前面步骤都执行成功了，系统也可以正常运行，唯独“致态固态”的容量不正常（我已通过SSH执行教程中第8步的扩容命令） 2.问题点描述： (1)在“存储与快照总管”>“磁盘/VJBOD”中显示“致态固态”是2T的 (2)在“存储与快照总管”>“存储/快照”中，“致态固态”显示容量是1T（PS：我用的是“单一静态卷”），选择“致态固态”点击“管理”，新窗口页面显示容量仍为1T，但是页面中显示raid组的容量是2T的；页面中“操作”>“调整卷大小”弹出窗口也没有合适的选项 (3)我尝试过关机、更换盘位、重新开机，但是问题依旧请问大神该如何处理？谢谢指导
威联通无损迁移系统盘(raid1降级独立硬盘)
mumoing: 关机之后，卸掉硬盘，物理互换。
威联通无损迁移系统盘(raid1降级独立硬盘)
陈家声: 请问大神，第五步“将两个固态互换位置”，这个是在上电情况下操作吗？还是需要关机之后互换？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。