Quora cqa问题抓取

本文介绍如何利用Quora的搜索功能抓取社区问答。通过关键词匹配找到相似问题,获取高排名问题的URL,然后抓取相关问题页面的答案。
摘要由CSDN通过智能技术生成


quora是一个比较知名的社区问答网站,对于目前比较流行的cqa问题,通过quora提供的搜索工具来找到相似的问题进而抽取答案。

事实上,quora的搜索大致是根据关键词匹配的。


String s=HttpRequest.sendGet("https://www.quora.com/search","q=Have%20you%20ever%20done%20the%20NoFap%20Challenge?");
Document doc = Jsoup.parse(s);
List<String> answer_url = new ArrayList<String>();
Elements ctag = doc.select("div.pagedlist_item");
System.out.println(s);
for(Element question : ctag){
	Element href = question.select("a.question_link").first();
	if(href != null){
		System.out.println("www.quora.com" + href.attr("href"));
		answer_url.add("https://www.quora.com" + href.attr("href"));
	}
}
for(String url : answer_url){
	//url = "http://www.quora.com/What-is-the-craziest-thing-you-have-ever-said-or-done-at-an-interview-and-still-got-the-job";
	String pag
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值