- 博客(21)
- 资源 (7)
- 问答 (1)
- 收藏
- 关注
原创 庆余年“真的”被大家喜欢吗?Java爬虫分析告诉你结果
文章目录导语首先,打开豆瓣,查看豆瓣评论入口根据抓包分析结果,写Java爬虫代码【庆余年】豆瓣评论分析1. 【庆余年】电视剧爱奇艺热度排行榜2. 【庆余年】豆瓣短评评论分布3. 【庆余年】豆瓣各种评论数排行分布4. 【庆余年】豆瓣各类评论投票数总和分布5. 【庆余年】豆瓣最热投票评论前20条6. 【庆余年】电视热播度随日期变化情况7. 【庆余年】关键词词云总结写在最后导语【庆余年】这部电视,...
2019-12-25 23:29:02 989 5
原创 Java爬虫到底有罪吗?
前言最近看到了好几条关于Java爬虫作者和公司被抓的新闻,作为一个资深的Java爬虫开发者,突然觉得,法律怎么离自己这么近!其实,从一个开发者的角度来看,网络上的资源都是平等共享的,只要对方敢公布出来,我都可以轻而易举的拿到它,对于拿到的信息,到底有没有触犯法律,的确从未有过这方面的考虑, 所以,突如其来的这些新闻,的确令我大吃一惊。其实,爬虫技术只是几行简单的Java代码,技术无罪,这...
2019-10-27 11:13:06 968
原创 Java 爬虫基础及提高
随着大数据时代的到来,网络数据已经开始泛滥了,如何才能从大量的数据中得到自己数据呢?爬虫,已经是一个必不可少的工具。说到爬虫,很多人第一会想到 Python,但是我要告诉你们的是,Java爬虫并不比 Python 爬虫效率差,并且 Java 有自己得天独厚的资源和使用人群,能够可以很轻松的入门,简单的使用图表,图云等系统工具直观的分析和展示统计数据的结果,可以这样说,学习 Python 做爬虫...
2019-10-27 11:00:17 550
原创 (HttpClient技术)Httpclient如何设置代理IP和端口(Port)
前言 Httpclient 3.X和Httpclient 4.X如何设置代理呢?现在的网络比较成熟,各种大型网站为了防止别人恶意攻击自己的网站,都会对访问者的IP进行限制,所以为了能够多次访问一个网站,Httpclient在使用过程就会遇到设置代理的问题,那么如何来给Httpclient设置代理IP呢? Httpclient 3.X和Httpclient 4.X的版本差距比较大...
2019-09-19 22:44:52 5166
原创 (SEO优化)现身说法告诉你百度关键词长尾词排名到底跟什么有关系 SEO优化(三)
不懂得实践的学生,就是纸上谈兵。 做网站已经有2个多月了,上次分享过SEO的初步优化方法后,也没有再给大家分享更多的实例,今天就跟大家分享一下,百度关键词长尾词排名到底跟什么有关系?其实跟网站的访问量有很大的关系。首先明确,这里说的关键词,是包括我们经常说的长尾词的,长尾词的挖掘方法,我在自己的个人网站上,已经分享过一篇文章了,有空大家可以去看看,文章标题:...
2019-09-01 15:29:44 700
原创 (SEO优化)现身说法教你如何优化百度的收录,权重,关键词排名 SEO优化(一)
俗话说,"不懂得实践的学生,就是纸上谈兵"。 前序 所以作为做Java Web开发的高手,我也不想做一个只会纸上谈兵的赵括。于是乎开始动手,使用比较开放的框架Spring MVC, Spring Shiro + Maven + Myibatis自己开发了一个网站,本以为做完一个网站,买一个服务器域名,上线后,就可以万事大吉了,网站就可以被别人看到,我就能想做自己想做的事...
2019-08-03 18:13:31 3379 1
原创 (HttpClient技术)(HttpClient入门)HttpClient使用详细介绍
1 前言 网络自动化操作,已经是网络发展中的一个重要趋势,很多复杂繁琐的操作,手动完成,得花费大量的时间,所以,网络自动化操作,就变得越来越普遍,越来越重要。很多应用,都可以使用网络自动化工具去完成,比如批量登陆签到,批量刷票,批量注册邮箱,批量查询用户余额等,那么网络自动化,在java中,应该用什么工具去开发呢,那么首先想到的应该就是HttpClient了,它是网络自动化操作方面,使
2015-05-14 10:45:24 9228 1
原创 (HttpClient技术)(58同城系列)58同城发帖
58同城的登陆和加密,都已经被我破解了,那其实目的就一目了然了,是的,目的就是58同城的模拟发帖。 为了写这个发帖机,我是煞费苦心,百度和谷歌,到处搜索资料,结果,一无所获,是的,真的是一无所获,基本上,所有的搜索,都找不到相关资料,我无语了,这是咋回事呢,难道58同城做了封杀,把所有的资料,都封杀了,为此,我忐忑不安,写文章之前,我还在想,我写了这个文章,是不是也会立刻被封杀呢。。。
2015-05-12 14:45:53 2898 17
原创 (HttpClient技术)(58同城系列)58同城登录
已经有很长时间,想开发一个58同城的系列软件了,对于HttpClient技术的钻研和进步,我觉得,我觉得自己还是有能力胜任的,终于有一个契机(至于什么原因呢,暂且保密,说出来,太俗了),这一星期来,抓了不少包,终于搞定了58同城,从登陆到发帖的代码,那么下面,我分享一个58同城的登录代码。(文章里面,用到了这么多的58同城的关键字),会不会被封杀呢,暂且不议,下面开始进入正题: 技术:H
2015-05-04 17:02:00 5456 10
原创 eclipse安装教程Win10,Win10系统安装eclipse及配置教程
eclipse安装教程Win10,Win10系统安装eclipse及配置教程1、打开https://www.eclipse.org/downloads/ 下载eclipse2、3.下载Java EE选择与准备时看到的位数相同的版本3、点击download黄色按钮开始下载4、下载之后找到之前下载的eclipse解压 找到这个启动程序5、启动页面,这里是询问你创建的项目要存在哪里...
2020-02-15 16:46:48 13444 5
原创 IntelliJ IDEA安装图文教程
IntelliJ IDEA 是 java语言开发的集成环境,在业界被公认为最好的 java开发工具之一,尤其在智能代码助手、代码自动提示、重构、J2EE支持、各类版本工具(git、svn等)、JUnit、CVS整合、代码分析、 创新的 GUI设计等方面的功能可以说是超常的。下面就以 ideaIU-2018.3.3 版64 位的 IntelliJ IDEA Ultimate Windows版本做详细...
2020-02-15 16:34:19 45789 1
原创 Java爬虫登录cnblogs(博客园)网站源码下载
简介: 博客园网站(https://www.cnblogs.com/)登录,添加评论代码,使用HttpClient+Selenium技术实现。代码介绍:项目编码:GBK开发工具:MyeclipseJDK: 1.7/1.8爬虫技术:HttpClient + Selenium提示:必须安装Chrome浏览器,如果无法使用,请联系作者下载地址...
2019-12-05 22:05:14 263 5
原创 Java爬虫模拟新浪微博登录、发布过程源码
简介: 新浪微博模拟登陆,发布微博代码,使用HttpClient实现,完全破解新浪微博JS加密算法。代码项目:项目编码:GBK开发工具:MyeclipseJDK: 1.7/1.8爬虫技术:HttpClient下载地址:链接:http://www.tech58.net/blog/articles/142.htmlGitChat地址:htt...
2019-12-05 22:03:35 512 1
原创 (HttpClient技术)(Hotmail和outlook系列)Hotmail和outlook的邮箱注册破解
作为HttpClient的爱好者,就是没事了,做点破解,搞点破坏,最近又闲不住了,那么就趁机会,来破坏一下Hotmail和outlook吧 注册地址: https://signup.live.com/signup.aspx,这个地址,还挺有趣的,用不同的浏览器版本打开的,显示的内容千差万别,我使用饿了,ie8来做测试,这个正好可以抓包,从开始到,注册,这个里面的参数乱七八糟的,有Key,
2015-05-12 15:13:23 6570 9
(HttpClient技术)(Hotmail和outlook系列)Hotmail和outlook的邮箱注册破解
作为HttpClient的爱好者,就是没事了,做点破解,搞点破坏,最近又闲不住了,那么就趁机会,来破坏一下Hotmail和outlook吧 注册地址: https://signup.live.com/signup.aspx,这个地址,还挺有趣的,用不同的浏览器版本打开的,显示的内容千差万别,我使用饿了,ie8来做测试,这个正好可以抓包,从开始到,注册,这个里面的参数乱七八糟的,有Key,ra...
2015-05-12 15:13:00 4003
(HttpClient技术)(58同城系列)58同城发帖
58同城的登陆和加密,都已经被我破解了,那其实目的就一目了然了,是的,目的就是58同城的模拟发帖。 为了写这个发帖机,我是煞费苦心,百度和谷歌,到处搜索资料,结果,一无所获,是的,真的是一无所获,基本上,所有的搜索,都找不到相关资料,我无语了,这是咋回事呢,难道58同城做了封杀,把所有的资料,都封杀了,为此,我忐忑不安,写文章之前,我还在想,我写了这个文章,是不是也会立刻被封杀呢。。。 ...
2015-05-12 14:45:00 326 3
原创 (HttpClient技术)(58同城系列)58同城登录加密的js
关于登录部分的代码太长了,所以决定 把js部分分离开来,本来想把加密的js,上传到下载的,不过想想,这样太坑爹了了,本来就一个简单的js,还去片积分,太不像话了,下面就具体来讲讲58同城登录部分的加密和相关加密的技术: 58同城的登录,一共采用了2中加密方式,第一种加密方式,是58同城自己的,另外一种加密技术,叫做rsa加密: 下面先把第一部分的加密的js,贴出来:(加密的方法,
2015-05-04 17:32:52 3138 5
(HttpClient技术)(58同城系列)58同城登录加密的js
关于登录部分的代码太长了,所以决定 把js部分分离开来,本来想把加密的js,上传到下载的,不过想想,这样太坑爹了了,本来就一个简单的js,还去片积分,太不像话了,下面就具体来讲讲58同城登录部分的加密和相关加密的技术: 58同城的登录,一共采用了2中加密方式,第一种加密方式,是58同城自己的,另外一种加密技术,叫做rsa加密: 下面先把第一部分的加密的js,贴出来:(加密的方法,在我...
2015-05-04 17:32:00 323 1
(HttpClient技术)(58同城系列)58同城登录
已经有很长时间,想开发一个58同城的系列软件了,对于HttpClient技术的钻研和进步,我觉得,我觉得自己还是有能力胜任的,终于有一个契机(至于什么原因呢,暂且保密,说出来,太俗了),这一星期来,抓了不少包,终于搞定了58同城,从登陆到发帖的代码,那么下面,我分享一个58同城的登录代码。(文章里面,用到了这么多的58同城的关键字),会不会被封杀呢,暂且不议,下面开始进入正题: 技术:H...
2015-05-04 17:02:00 448
(HttpClient技术)(58同城系列)58同城登录
已经有很长时间,想开发一个58同城的系列软件了,对于HttpClient技术的钻研和进步,我觉得,我觉得自己还是有能力胜任的,终于有一个契机(至于什么原因呢,暂且保密,说出来,太俗了),这一星期来,抓了不少包,终于搞定了58同城,从登陆到发帖的代码,那么下面,我分享一个58同城的登录代码。(文章里面,用到了这么多的58同城的关键字),会不会被封杀呢,暂且不议,下面开始进入正题: 技术:H...
2015-05-04 17:02:00 442 1
java可以做验证码识别字库吗?
2015-05-15
TA创建的收藏夹 TA关注的收藏夹
TA关注的人