- 博客(4)
- 资源 (4)
- 收藏
- 关注
原创 Java网络爬虫--使用Jsoup的select语法进行元素查找
使用Jsoup进行元素的查找有两种方法。有使用DOM方法来遍历一个文档,也有使用选择器语法来查找元素,而后者类似于CSS或jQuery的语法来查找和操作元素。对于这两个方法到底使用哪个感觉好上手我觉得因人而异,在我尝试了两种方法之后我还是选择select,所以我就只总结select的语法使用了,对于DOM方法感兴趣的,可以看一下这一篇博客:【使用JSOUP实现网络爬虫】使用DOM方法来遍历一个文档...
2018-12-27 11:07:16 689
转载 httpclient抓取https网页数据
近日接到一个任务,需要采集某个https网站的部分内容,用到了httpclient(4.5.X),它是Apache Jakarta Common下的子项目,用来提供高效的、最新的、功能丰富的支持HTTP协议的客户端编程工具包,并且它支持HTTP协议最新的版本和建议。先看一下httpclient的简单使用。封装一个httpclient查询方法:public String getHtml(Str...
2018-12-24 16:32:17 677 2
原创 java抓取网页内容
/* * 爬取网页信息 */ private static String pickData(String url) { CloseableHttpClient httpclient = HttpClients.createDefault(); try { HttpGet httpget = new HttpGet(...
2018-12-24 11:36:45 457
转载 Excel中Vlookup函数的简单用法
简述:Vloookup 用于两个excel之间进行内容匹配=if(C2=B2,"相同","不同")=MID(A2,FIND("#",A2)+1,99)的意思就是从A2单元格#字符后面的一个字符起,取长度为99的字符串。其中的99是一个比较大的数字,能涵盖#后字符的最大长度即可lwftb(b3,6)代表的意思就是将b3单元格内的字符串取前6位(right(b2,4))代表将b2单元格...
2018-12-14 14:55:06 3362
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人