记:第一次入门爬虫(java)

需求: 给定号码,获取其在百度网站中的号码标识,并输出到指定文件中。

需要使用的jar包:jsoup.jar

部分源码:

public String crawler(String str) {//str为txt文件中号码信息
	try {
		String url = "https://www.baidu.com/s?wd=" + URLEncoder.encode(str, "gb2312") + "&rn=100";	
		Document doc = Jsoup.connect(url).timeout(5000).get();
		String result = doc.select("div[class=c-border op_fraudphone_container]")
				.select("div[class=op_fraudphone_word]").select("strong").text();
	    if(result.isEmpty()){	
			System.out.println(str +"\t"+"null");	
			exportFile(str +"\t"+"null");
			return null;	
		}else{
			System.out.println(str +"\t"+result);
			exportFile(str +"\t"+result);
			return result;
		}
	} catch (Exception e) {
		System.out.println("连接网站超时");
		return  null;
	}
}

//写文件

public void exportFile(String str) {
	File ob = new File(c:\\result.txt);
	try {
		FileWriter out = new FileWriter(ob, true);
		out.write(str + "\n");
		out.flush();
		out.close();
	} catch (IOException e) {
		System.out.println(“写入文件出错”);
	}
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

xhaoDream

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值