![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Java爬虫
zhouzhou_98
所谓的焦虑就是书读的太少,而想的又太多
展开
-
java爬虫第一步(htmlunit)
首先初步认识htmlunit htmlunit 是一款开源的java 页面分析工具,读取页面后,可以有效的使用htmlunit分析页面上的内容。项目可以模拟浏览器运行,被誉为java浏览器的开源实现。是一个没有界面的浏览器,运行速度迅速。是junit的扩展之一 采用的是Rhinojs引擎。模拟js运行 常规意义上,该项目可以用来进行页面的测试工作,实现网页自动化测试,(包括JS)...原创 2019-04-16 21:31:46 · 627 阅读 · 0 评论 -
爬虫小练习
爬虫:url+regex+stream 准备工作: (1)创建spider线程、MySQL数据库 (2)创建表; create table pages(id int primary key auto_increment,url varchar(1024),loc varchar(200),keywords varchar(200)) 项目总体组...原创 2019-05-28 13:10:18 · 206 阅读 · 0 评论