![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
JAVA应用篇
浮沉_Man
终有一天,我们都会成为自己想要的样子
展开
-
简单的JAVA爬虫
楼主只是个大三狗,去年在技术部工作的时候,师兄要求我写一个抓取教务部信息的小Demo,举一反三,写了三个关于JAVA爬虫的代码。 首先做好准备工作: 了解正则表达式中基本的Select的用法: 此处引用楼主查到的资料 http://www.tuicool.com/articles/ZnyMvu第一个爬虫:无验证码的简单爬虫 楼主是中南财经政法大学的,就拿本校教务处作为例子,我们的目的是获取原创 2016-09-09 12:53:37 · 699 阅读 · 4 评论 -
用于登陆后的信息收集爬虫
有时候我们需要的用户信息是要通过用户登录后得到,这些信息其实也可以通过爬虫获得。 本Demo中用到的2个外部库 org.jsoup,jxl(用于写EXCEL), 同样以中南财经政法大学教务处学生个人信息系统为例: 网址:http://202.114.224.81:7777/zhxt_bks/zhxt_bks.html 接下来就是查看网页源码,即找到传递账号密码的目的地址 http://原创 2016-09-09 18:56:39 · 504 阅读 · 0 评论 -
基于验证码模拟登录的爬虫
上一篇博客我们讲到没有验证码的登陆跳转和信息抓取,对于部分有验证码登陆跳转我们又该怎么做到模拟登陆呢。 首先,还是先说下我们的外部库 我们这次模拟登陆的是拉手网。 http://www.lashou.com/account/login/ 然后我们查看服务器验证码的网址: 当然这样查看得到的是相对地址,我们肯定要得到绝对地址才能获取到验证码的图片,下面的代码会给出如何直接获取绝对地址原创 2016-09-13 17:52:15 · 620 阅读 · 0 评论 -
JAVA写入XML文件
首先我们需要DOM4j 百度下载就有0.0 如何配置jar包 就小提一下吧 项目名->bulid path->configure Bulid path 然后把你的jar包加进来接下来我们先介绍一下XML必须注意的东西XML文档必须有一个顶层元素,其他元素必须嵌入在顶层元素中每个元素必须同时拥有起始和介绍标记在一个元素节点中,属性名不能重复 好 ,我们看一个例子 其中CDATA段原创 2016-10-25 15:17:50 · 740 阅读 · 0 评论 -
JAVA读取XML
接上一篇,这一期我们只写一个主函数 public static void main(String[] args) { // 解析books.xml文件 // 创建SAXReader的对象reader SAXReader reader = new SAXReader(); try { // 通过reader对原创 2016-10-25 15:48:20 · 326 阅读 · 0 评论