- 博客(9)
- 资源 (17)
- 问答 (15)
- 收藏
- 关注
转载 爬虫 解决网页ip限制的问题的八种方法
方法1.之前由于公司项目需要,采集过google地图数据,还有一些大型网站数据。 经验如下:1.IP必须需要,像@alswl 说的非常正确,ADSL。如果有条件,其实可以跟机房多申请外网IP。2.在有外网IP的机器上,部署代理服务器。3.你的程序,使用轮训替换代理服务器来访问想要采集的网站。好处: - 1.程序逻辑变化小,只需要代理功能。 - 2.根据对方网站屏蔽规则不同,你只需要添
2017-03-27 15:06:24 13300 1
原创 Python学习之多进程并发爬虫
以前做过Python的爬虫,不过那只爬取贴吧内容,比较简单,只是用来刚开始练练手的。这段时间又重新看Python,看到了正则表达式,于是想对爬虫再深入的了解下,主要是对爬虫的线程以及进程学习。 爬虫是io密集型,所以使用多线程会提高效率,但是懂点Python的人都知道,gil的存在导致Python的多线程有点坑,这里简单的介绍下gil。 Gil 是全局解释器锁,为了数据的安全。而在Pytho
2017-03-25 19:04:13 10587
原创 Struts2 文件的上传与下载
最近学习到了Struts2中的文件的上传与下载,因为会经常使用,所以记录下来,加深理解。文件的上传:在Struts中默认使用的是common-fileupload的文件上传框架,所在使用文件的上传功能之前要先在web项目中导入commons-io-2.2.jar 和 commons-fileupload-1.3.1.jar,这两个文件可以从Struts2的lib文件复制到web项目的web-inf
2017-03-23 10:41:13 1543
原创 在linux上安装配置tomcat(Ubuntu)
最近因为要在linux上做一些javaweb上的练习,所以需要安装基本的tomcat,使用环境是Ubuntu14.3的图形化界面安装的,因为使用文字界面直接在linux上进行编写有些麻烦,以后再去接触。一、安装配置jdk1、首先是要去安装和配置jdk,所以先登录官网下载jdk 网址为:http://www.oracle.com/technetwork/java/javase/downlo
2017-03-18 15:45:06 1763
原创 在一个jsp页面使用include动态包含servlet
今天在使用jsp页面包含一个servlet出现了错误,因为以前都是包含的另一个jsp页面,所以一直以为是servlet中的错误,瞎忙乎了半天,所以不能小看了书上的细节部分。 解决办法:1、假设你的servlet的url路径为 /ActionServlet2、则在jsp页面中的包含语句应该为:'>3、还要修改ActionServlet中的get 或者 是 post
2017-03-18 10:16:37 4854 2
原创 Call to master/*:9000 failed on connection exception: java.net.ConnectException: Conne 错误解决
在用eclipse hadoop 出现这个错误 一般都是由于网络连接问题一般造成错误的原因可能为:1、hadoop未全部启动,hadoop正常启动包括以下几个服务,如果服务没有全部启动。可以通过jps 查看日志。根据日志来启动为启动的服务2、伪分布式模式安装时,在配置文件是使用了localhost 或者是127.0.0.1 此时应该改为真实的ID 其中需要修改的文件包括了 co
2017-03-17 20:08:57 7107
原创 EL表达式不起作用的解决方法
JSP页面上的EL表达式无效,在解析时都被当作了普通字符串处理。经过排查发现,原来在Servlet2.4之前的版本,默认EL表达式是被忽略的。如果是别的版本下,将用到EL 表达式的 JSP页面的开头添加如下一句代码即可。 EL才有效。但是自2.4版本以后,EL就被设置为默认有效了,因此页面上也不需要再单独标示。首先确定用的Servlet / JSP的版本。查看web.xml的开头部分,如
2017-03-14 13:47:36 3720 1
原创 关于腾讯云服务器 外网不能访问的问题
买腾讯云的服务器已经又快一年了,以前总是把自己做的javaweb项目放上去访问 做自己的博客 但是在年初的时候重装了一次服务器上的系统 ,之后通过外网就访问不进去,自己在网上各种的配置tomcat 和系统文件 开放了服务器的80防火墙 但是最终还是没有任何的屌用 搁置了一段时间 直到今天又想了起来 去到腾讯云 的论坛逛了一圈 发现了一篇文章点开一看
2017-03-10 21:32:19 25106 1
原创 关于Struts2使用Action的动态方法调用
今天在使用Action的动态方法调用的时候出现了问题在定义完表单的action属性后 login!regist但是并没有发生跳转而是出现了通过调试发现是没有跳转到action中最后在网上找到了错误的原因 这句话,貌似在struts2.3版本还是什么版本以后 动态方法调用的话 默认设成FALSE 了 ,必须手动设置成TRUE才有效,可以试一下。也就是这句
2017-03-02 09:49:38 1019
搜狗五百万用户搜索日志记录
2018-05-22
hbase-0.96.0.tar.gz
2018-03-17
hadoop-2.2.0.tar.gz + zookeeper3.4.5
2018-03-17
jdk-7u67-linux-x64.tar.gz
2018-03-17
openstack多节点搭建
2017-11-24
openstack 搭建官方文档
2017-11-17
springmvc-注册页面发送手机验证码
2017-07-11
基于hadoop的web云盘系统
2017-04-07
c语言贪吃蛇
2016-12-15
java 远程连接spark 出现错误
2017-12-07
centos yum install 错误
2017-09-29
hadoop Master节点namenode进程没有启动
2017-09-07
使用springboot连接mongodb,提示连接错误
2017-08-06
在jsp中关于${}输出为普通的字符串
2017-03-13
Struts2中的标签问题 提示找不到 uri="/struts-tags"%
2017-02-26
关于MySQL中触发器的语法错误
2016-12-07
关于数据库触发器的创建出错问题谢谢
2016-12-07
关于servlet中出现404错误
2016-11-14
关于继承时成员数据产生的歧义
2016-05-05
win10java环境变量设置完后,但是eclipse打不开
2016-05-04
关于c++将文件内容读取到链表中
2016-04-18
c++读取文件中的链表存取问题
2016-04-13
为什么if里的条件成立但是if不执行
2016-03-29
TA创建的收藏夹 TA关注的收藏夹
TA关注的人