![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
java
笑笑布丁
个人博客:https://madpudding.github.io/
展开
-
Java 8的菱形继承冲突解决之道
Java 8的菱形继承冲突解决之道。原创 2023-10-23 18:08:22 · 166 阅读 · 0 评论 -
java正则表达式匹配所有相匹配的内容
java使用正则表达式匹配所有内容原创 2018-07-08 10:25:54 · 2389 阅读 · 2 评论 -
Java使用Selenium+ChromeDriver 爬取中国知网
Java使用Selenium 爬取中国知网所需Jar包中国知网的网页结构,我就不在这里赘述了,自己去看,这里我操作的是爬取博硕论文,只抓取前十页当Selenium无法调取ChromeDriver时可参考以下建议:1.chromedriver是否与当前Chrome版本兼容 2.chromedriver是否放置在Chrome安装目录下 3.chromedriver是否配置环...原创 2018-07-05 12:53:14 · 7905 阅读 · 2 评论 -
HttpUnit爬取中国知网特定大学网页
继昨天使用Selenium+ChromeDriver爬取中国知网页面后,今天又想到了一些别的方法,就是HtmlUnit,作为一名萌新程序员,多写写总是好的,操蛋的是,还没想出好的爬取方法。奉上jar包 <!-- https://mvnrepository.com/artifact/net.sourceforge.htmlunit/htmlunit -->...原创 2018-07-06 19:50:08 · 781 阅读 · 0 评论 -
Java 知网博硕论文信息爬虫
知网博硕论文信息爬虫声明 代码首先声明这段代码,是我刚毕业进公司写的,整个爬虫系统我还没写完,就被调去学python支援公司的某个项目去了,所以代码距离我写文章时候,其实已经过去了大半年有余了,代码后面因为项目的终止,再也没更新过,其中需要说明的是Tools类不能使用,因为这是以前公司大佬写的底层解析HTML的类,建议你使用Jsoup或者正则表达式去解析HTML文本。这只是个爬取信息的爬虫,...原创 2019-03-20 15:18:51 · 1763 阅读 · 0 评论