爬虫
文章平均质量分 66
皮蛋小粥
信阳师范学院计算机学院学生
展开
-
如何抓取一个页面的数据--第一次尝试这方面的的知识
想尝试去写一个程序来实现登录后可以直接查询到我在学校的成绩,但是没做过这方面的东西,而且计算机网络这门课学一年多了,实在记得东西不多,当锻炼了吧。我想我一步知道应该抓取一个页面的数据,然后再通过fiddler抓包,来获取一些需要发送的东西,这里我尝试第一步:如何抓取一个页面的数据。原创 2017-05-12 12:31:58 · 670 阅读 · 0 评论 -
数据抓包(网络爬虫)-正方教务管理系统登录
通过这篇文章,我实现自己的模拟登陆,并且成功的抓取到成功的页面。想想还是转载这位仁兄的,自己害差的远,Java爬虫第一次接触转载 2017-05-16 17:42:45 · 1661 阅读 · 0 评论 -
jsoup读取CSDN的文章目录
将自己CSDN的文章读取出来,放到自己的jsp页面中:jsoup参考手册目录源码:根据class=article_title:循环将自己页面的目录和路径取出来:原创 2017-06-06 11:08:46 · 363 阅读 · 1 评论 -
jsoup加载CSDN分页后文章目录
当文章目录被分页显示时,此时我们我们需要所有的CSDN文章目录时候:可以分页之后我们需要访问pageNow后才能加载文件目录。同时我们需要爬取我们CSDN的文章目录的页数,可以从源码看出来我们需要通过这个div的ID来获取第一个span标签的内容,然后使用正则表达式来过滤出来我们需要的页数。String totalPageStr = body.getElementB原创 2017-06-06 16:49:54 · 843 阅读 · 0 评论 -
发布的主页排版由于浏览器的兼容模式和极速模式出现问题
上午将自己的个人主页发布到外网上面,但是使用360浏览器打开页面布局出现问题,一直不知道怎么改。下午试了很多次都不知道如何,但是当我想审查元素的时候,发现没有这一栏,上搜索发现是由于兼容模式打开的网换成极速模式即可正常排版。但是如何解决这个问题啊。。。。。。。对于前端了解的太少了原创 2017-06-07 16:17:45 · 691 阅读 · 1 评论 -
jsoup总结
本文摘抄其他博客或者技术论坛,自己搜集整理如下:Jsoup学习总结摘要Jsoup是一款比较好的Java版HTML解析器。可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。jSOUP主要功能从一个URL,文件或字符串中解析HTML;使用DOM或CSS选择器来查找、取出数据;可操作HTML元素、属性、文本;环境转载 2017-06-08 22:59:23 · 474 阅读 · 2 评论