- 博客(45)
- 资源 (34)
- 收藏
- 关注
转载 网站如何防盗链的8种方法
如果你是网站的开发者或维护者,就不得不重视盗链的问题了。如果你刚刚开发完一个没有防盗链的带有文件下载功能的网站,挂上internet,然后上传几个时下非常热门的软件或电影并在网站内公布下载地址,让MSN上的所有好友都来体验一下你的杰作。不用多久就会发现网速出奇地变慢,甚至服务器托管中心的服务员会热情地打电话告诉你的网站流量很大,估计是网站受欢迎起来了,问你是不是该考虑加钱租用带宽更宽但价格更贵的网
2014-11-12 11:26:32 3331
转载 深入分析 Java 中的中文编码问题
几种常见的编码格式为什么要编码不知道大家有没有想过一个问题,那就是为什么要编码?我们能不能不编码?要回答这个问题必须要回到计算机是如何表示我们人类能够理解的符号的,这些符号也就是我们人类使用的语言。由于人类的语言有太多,因而表示这些语言的符号太多,无法用计算机中一个基本的存储单元—— byte 来表示,因而必须要经过拆分或一些翻译工作,才能让计算机能理解。我们可以把计算机能够理解的
2014-11-12 11:25:37 452
转载 nginx 日志内容
指定日志的格式。日志格式允许包含普通变量和只在日志写入时存在的变量:$body_bytes_sent发送给客户端的字节数,不包括响应头的大小; 该变量与Apache模块mod_log_config里的“%B”参数兼容。$bytes_sent发送给客户端的总字节数。$connection连接的序列号。$connection_requests当前通过一个连接
2014-11-12 11:24:53 691
转载 web开发中存在的安全问题及防范
由 周杨添加,由 周杨最后更新于十月 21, 2013转至元数据起始防范跨站伪造请求(Cross-site request forgery,简称 CSRF 或 XSRF)。CSRF 的意思简单来说就是,攻击者伪造真实用户来发送请求。举例来说,假设某个银行网站有这样的 URL:http://bank.example.com/withdraw?amoun
2014-11-12 11:23:21 478
转载 Web应用的缓存设计模式
## ORM缓存引言从10年前的2003年开始,在Web应用领域,ORM(对象-关系映射)框架就开始逐渐普及,并且流行开来,其中最广为人知的就是Java的开源ORM框架Hibernate,后来Hibernate也成为了EJB3的实现框架;2005年以后,ORM开始普及到其他编程语言领域,其中最有名气的是Ruby on rails框架的ORM - ActiveRecord。如今各种开源框架的OR
2014-11-12 11:22:41 774
转载 Yahoo WEB前端优化34条原则
Yahoo给出的包括Yslow规则(22条)的34条详细说明 ,通过这此规则对自己页面进行一次全面的分析优化,可以提高你网站的加载速度。1.Minimize HTTP Requests 减少HTTP请求图片、CSS、script、flash等等这些都会增加http请求数,减少这些元素的数量就能减少响应时间。把多个JS、CSS在可能的情况下写进一个文件,页面里直接写入图片也是不好的做
2014-11-12 11:21:39 591
转载 To Hadoop or Not to Hadoop?
Hadoop is often positioned as the one framework your business needs to solve nearly all your problems. Mention “Big Data” or “Analytics” and pat comes the reply: Hadoop! Hadoop, however, was purpose-b
2014-11-12 11:20:53 554
转载 编译安装LNMP(Redhat5.4+nginx+mysql+php-5.3.6)
Nginx ("engine x") 是一个高性能的 HTTP 和 反向代理 服务器,也是一个 IMAP/POP3/SMTP 代理服务器,因它的稳定性、丰富的功能集、示例配置文件和低系统资源的消耗而闻名 Nginx不支持对外部程序的直接调用或者解析,所有的外部程序(包括PHP)必须通过FastCG
2014-11-12 11:19:51 647
转载 让开发自动化: 用 Eclipse 插件提高代码质量
开发软件时,我的主要目标之一是:要么防止将缺陷引入代码库,要么限制缺陷的生存期;换言之,要尽早找到缺陷。很显然,越是了解如何编写更好的代码以及如何有效测试软件,就越能及早地捕捉到缺陷。我也很想要一张能发现潜在缺陷的安全之网。在本系列 八月份 的那期文章中,我得出了这样的结论:将检验工具集成到构建过程(例如,使用 Ant 或 Maven)中,能够建立起一种寻找潜在缺陷的方法。尽管这种方法使一
2014-11-12 11:18:59 448
转载 10个Java编码中微妙的最佳实践
这是10个最佳实践的列表,比你平时在Josh Bloch的《effective java》中看到的规则更加精妙。和Josh Bloch列出的非常容易学习的、和日常情况息息相关的实践相比,这个列表中提到了一些关于设计API/SPI的实践,虽然不常见,但是存在很大的效率问题。我在编写和维护jOOQ(一种内部DSL,在java中将SQL模块化)时,碰到了这些问题。作为内部DSL,jOOQ最大
2014-11-12 11:17:38 412
转载 QT在windows上发布
笔者安装的是QT SDK。(发行版本这是前提,很重要,不是源码编译版本) QT不像JAVA那样编译出来就马上可以run everywhere了,运行时还得有必要的运行库支持。接下来就是准备工作: 首先,你得有个编译出来可以运行的程序(嗯,这里代码是什么任君选择,本文篇幅有限就不多说了。) 第二,用release的方式构建工程,而不是debug(相信很多情况下默认
2014-11-12 11:05:50 606
转载 搜索引擎网页去重算法分析
相关统计数据表明:互联网上近似重复的网页的数量占网页总数量的比例高达29%,完全相同的网页大约占网页总数量的22%.研究表明,在一个大型的信息采集系统中,30%的网页是和另外70%的网页完全重复或近似重复的。即:互联网的网页中相当高的比例的网页内容是近似相同或完全相同的!搜索爬虫抓取会产生网页重复的类型:1.多个URL地址指向同一网页以及镜像站点如:www.sina
2014-11-12 11:05:08 614
转载 Python写爬虫抓站的一些技巧
1.最基本的抓站import urllib2content = urllib2.urlopen('http://XXXX').read()-2.使用代理服务器这在某些情况下比较有用,比如IP被封了,或者比如IP访问的次数受到限制等等。import urllib2proxy_support = urllib2.ProxyHandler({'http':'htt
2014-11-12 11:04:14 374
转载 javascript:window.close()在chrome,Firefox下失效问题解决方法
window.close(),一看就知道是用来关闭浏览器窗口的方法。W3CSchool对该方法的解释如下:方法 close() 将关闭有 window 指定的顶层浏览器窗口。某个窗口可以通过调用 self.close() 或只调用 close() 来关闭其自身。只有通过 JavaScript 代码打开的窗口才能够由 JavaScript 代码关闭。这阻止了恶意的脚本终止用户的浏览器。
2014-11-12 11:03:33 803
转载 Spring MVC静态文件处理
如何你的DispatcherServlet拦截"*.do"这样的有后缀的URL,就不存在访问不到静态资源的问题。如果你的DispatcherServlet拦截"/",为了实现REST风格,拦截了所有的请求,那么同时对*.js,*.jpg等静态文件的访问也就被拦截了。我们要解决这个问题。 目的:可以正常访问静态文件,不可以找不到静态文件报404。 方案一:
2014-11-12 11:02:48 405
转载 理解RESTful架构
越来越多的人开始意识到,网站即软件,而且是一种新型的软件。这种"互联网软件"采用客户端/服务器模式,建立在分布式体系上,通过互联网通信,具有高延时(high latency)、高并发等特点。网站开发,完全可以采用软件开发的模式。但是传统上,软件和网络是两个不同的领域,很少有交集;软件开发主要针对单机环境,网络则主要研究系统之间的通信。互联网的兴起,使得这两个领域开始融合,现在我们必
2014-11-12 11:01:55 402
转载 js扩展方法
js没有delete方法,但是js有截取和拼接的方法,我们可以通过已有的方法实现js的删除方法Array.prototype.del = function(n) { if (n return this; }else{ return this.slice(0, n).concat(this.slice(n
2014-11-12 10:53:48 494
转载 分布式搜索elasticsearch java API 使用More like this实现
基于内容的推荐通常是给定一篇文档信息,然后给用户推荐与该文档相识的文档。Lucene的api中有实现查询文章相似度的接口,叫MoreLikeThis。Elasticsearch封装了该接口,通过Elasticsearch的More like this查询接口,我们可以非常方便的实现基于内容的推荐。先看一个查询请求的json例子:{ "more_like_this" :
2014-11-12 10:53:03 816
转载 分布式搜索elasticsearch java API
Mapping,就是对索引库中索引的字段名及其数据类型进行定义,类似于关系数据库中表建立时要定义字段名及其数据类型那样,不过es的mapping比数据库灵活很多,它可以动态添加字段。一般不需要要指定mapping都可以,因为es会自动根据数据格式定义它的类型,如果你需要对某些字段添加特殊属性(如:定义使用其它分词器、是否分词、是否存储等),就必须手动添加mapping。有两种添加mapping的方
2014-11-12 10:46:08 551
转载 oracle中Where子句的条件顺序对性能的影响
经常有人问到oracle中的Where子句的条件书写顺序是否对SQL性能有影响,我的直觉是没有影响,因为如果这个顺序有影响,Oracle应该早就能够做到自动优化,但一直没有关于这方面的确凿证据。在网上查到的文章,一般认为在RBO优化器模式下无影响(10G开始,缺省为RBO优化器模式),而在CBO优化器模式下有影响,主要有两种观点: a.能使结果最少的条件放在最右边,SQL执行是按从右到左
2014-11-12 10:43:46 415
转载 ElasticSearch 在string类型的字段上做排序出错的解决方案
问题有个简单的需求:列出图书信息,并按照图书标题的字典顺序排列。原来认为会很简单: Java代码 builder.addSort(SortBuilders.fieldSort("title").order(SortOrder.ASC)); 没想到确报这样的异常: Java代码 Can’t sort
2014-11-12 10:42:45 4177
转载 elasticsearch index 的 type 解释
Index names are different indices. Types are just syntactic sugar to add separation between types of documents. If you know Lucene, type is just a field on a doc.Let me explain a bit how typ
2014-11-12 10:40:20 1573
转载 elasticsearch配置文件详解
elasticsearch的config文件夹里面有两个配置文件:elasticsearch.yml和logging.yml,第一个是es的基本配置文件,第二个是日志配置文件,es也是使用log4j来记录日志的,所以logging.yml里的设置按普通log4j配置文件来设置就行了。下面主要讲解下elasticsearch.yml这个文件中可配置的东西。cluster.name: elas
2014-11-12 10:39:27 368
转载 Lucene表达式
Lucene提供了丰富的API来组合定制你所需要的查询器,同时也可以利用Query Parser提供的强大的查询语法解析来构造你想要的查询器。本文章详细的介绍了Lucene的查询语法。通过Java语法分析器把一个查询字符串解析成 Lucene的查询器。在你选择使用Query Parser前,请考虑以下事项:如果你打算在程序中拼接查询语法串然后再利用Query Parser转换,那么强烈建议
2014-11-12 10:38:11 1109
转载 教你如何迅速秒杀掉:99%的海量数据处理面试题
前言 一般而言,标题含有“秒杀”,“99%”,“史上最全/最强”等词汇的往往都脱不了哗众取宠之嫌,但进一步来讲,如果读者读罢此文,却无任何收获,那么,我也甘愿背负这样的罪名,:-),同时,此文可以看做是对这篇文章:十道海量数据处理面试题与十个方法大总结的一般抽象性总结。 毕竟受文章和理论之限,本文将摒弃绝大部分的细节,只谈方法/模式论,且注重用最通俗最直白的语言阐述相关问
2014-11-12 10:37:24 403
转载 海量数据处理:十道面试题与十个海量数据处理方法总结
第一部分、十道海量数据处理面试题1、海量日志数据,提取出某日访问百度次数最多的那个IP。 首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率
2014-11-12 10:36:15 301
转载 超过 130 个你需要了解的 vim 命令
从 1970 年开始,vi 和 vim 就成为了程序员最喜爱的文本编辑器之一。5年前,我写了一个问自己名为 “每个程序员都应该知道的 100 个 vim 命令” 这次算是之前那篇文章的改进版,希望你会喜欢。基础:e filenameOpen filename for edition:wSave file:qEx
2014-11-12 10:35:11 318
转载 布隆过滤器 (Bloom Filter) 详解
布隆过滤器 (Bloom Filter)是由Burton Howard Bloom于1970年提出,它是一种space efficient的概率型数据结构,用于判断一个元素是否在集合中。在垃圾邮件过滤的黑白名单方法、爬虫(Crawler)的网址判重模块中等等经常被 用到。哈希表也能用于判断元素是否在集合中,但是布隆过滤器只需要哈希表的1/8或1/4的空间复杂度就能完成同样的问题。布隆过滤器可以插入
2014-11-12 10:33:25 451
转载 Oracle中如何插入特殊字符: & 和 ' (多种解决方案)
Oracle中如何插入特殊字符:& 和 ' (多种解决方案)今天在导入一批数据到Oracle时,碰到了一个问题:Toad提示要给一个自定义变量AMP赋值,一开始我很纳闷,数据是一系列的Insert语句,怎么会有自定义变量呢?后来搜索了一下关键字AMP发现,原来是因为在插入数据中有一个字段的内容如下:http://mobile.three.com.hk/3DX?uid=0676&am
2014-11-12 10:30:43 434
转载 解决JS跨域跳转页面问题解决方案
开发过程中有时会遇到脚本转到其他网站的需求,首先的思路都会想到window.open方法,但却忽略了浏览器阻止的问题。下面是针对3种场景的解决方案1.使用window.open 首先要搞清楚浏览器阻拦的前提是什么?只有跨域时浏览器才会阻拦,也就是说在A.com域下弹出B.com域下的页面,浏览器就会阻拦。这时我们可以在A.com域下创建一个页面href.jsp,
2014-11-12 10:29:06 12515
转载 了解CMS(Concurrent Mark-Sweep)垃圾回收器
感谢原作者,版权为原作者所有!原文地址:http://www.iteye.com/topic/1119491
2014-10-31 15:25:02 379
原创 Java开平方根代码——牛顿迭代法
package project.test;import java.math.*;public class SqrtTest {private static final String num = "10";private static final int accuracy = 5;private static double accuracyDouble = 0.1
2014-10-29 15:21:51 3868
转载 Jvm gc collectors
Our CollectorsBy jonthecollector on Feb 01, 2008I drew this diagram on a white board for some customers recently. They seemed to like it (or were just being very polite) so I thought I redraw
2014-10-26 17:57:13 481
转载 基于角色的访问控制权限设计
RBAC(Role-Based Access Control,基于角色的访问控制),就是用户通过角色与权限进行关联。简单地说,一个用户拥有若干角色,每一个角色拥有若干权限。这样,就构造成“用户-角色-权限”的授权模型。在这种模型中,用户与角色之间,角色与权限之间,一般者是多对多的关系。(如下图)角色是什么?可以理解为一定数量的权限的集合,权限的载体。例如:一个论坛系统,“超级管理员
2014-10-21 15:46:21 518
原创 JVM的简单划分和说明
JVM由Heap和Non-heap构成。 Heap由Young Generation和Tenured Generation(Old Generation)构成;其中Young Generation又由Eden Space和Survivor Space组成;Survivor 0 Space和Survivor 1 Space组成了Survivor Space。 Non-heap由P
2014-10-21 13:55:49 331
转载 Tomcat开启gzip方法
port="80" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" compression="on" compressionMinSize="2048" noCompressionUserAgents="gozilla,traviata" compressableMimeTyp
2014-10-20 10:53:07 353
原创 使用Maven插件一条命令项目即可部署
注:以下步骤均是在Tomcat 7.0下实现!Tomcat 6步骤略有不同,请自行查找。1、在项目下pom.xml文件中的plugins>标签内加入: org.apache.tomcat.maven tomcat7-maven-plugin 2.3-SNAPSHOT http://local
2014-10-20 10:51:30 394
转载 Ubuntu下配置sendmail
确保防火墙放过25端口sudo ufw allow smtp,设置成功后重启sendmail服务。 1. 必需安装的包: sudo apt-get install sendmail sudo apt-get install sendmail-cf sudo apt-get install mailutils 2. 配置sendmail:
2014-10-20 10:49:31 872
云信通_4.3.370
2013-04-14
jboss-5.1.0.GA.part1.rar
2013-03-20
jboss-5.1.0.GA-jdk6.part1.rar
2013-03-20
jboss-5.1.0.GA-jdk6.part2.rar
2013-03-20
jboss-5.1.0.GA.part2.rar
2013-03-20
chectl-linux-x64.tar.gz
2019-10-09
Oracle instantclient-basic-windows.x64-11.2.0.4.0
2014-05-14
blitz4j.jar文件
2013-06-27
spring-framework-3.2.3.RELEASE-dist.zip
2013-06-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人