Web技术
文章平均质量分 88
会飞牛牛
这个作者很懒,什么都没留下…
展开
-
FileItemFactory类
将请求消息实体中的每一个项目封装成单独的DiskFileItem (FileItem接口的实现) 对象的任务由 org.apache.commons.fileupload.FileItemFactory 接口的默认实现 org.apache.commons.fileupload.disk.DiskFileItemFactory 来完成。当上传的文件项目比较小时,直接保存在内存中(速度比较快转载 2012-08-28 10:12:17 · 3694 阅读 · 0 评论 -
一致性哈希算法以及其PHP实现
在做服务器负载均衡时候可供选择的负载均衡的算法有很多,包括: 轮循算法(Round Robin)、哈希算法(HASH)、最少连接算法(Least Connection)、响应速度算法(Response Time)、加权法(Weighted )等。其中哈希算法是最为常用的算法. 典型的应用场景是: 有N台服务器提供缓存服务,需要对服务器进行负载均衡,将请求平均分发到每台服务器上,每转载 2012-09-11 18:27:40 · 380 阅读 · 0 评论 -
大、小端模式的测试
大端模式:是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中小端模式:是指数据的低位保存在内存的低地址中,而数据的高位保存在内存的高地址中。采用大端方式进行数据存放符合人类的正常思维,而采用小端方式进行数据存放利于计算机处理。到目前为止,采用大端或者小端进行数据存放,其孰优孰劣也没有定论。嵌入式系统开发者应该对Little-endian和Big-endian模式转载 2012-09-11 10:44:23 · 657 阅读 · 0 评论 -
树形结构设计
树形结构的数据库表Schema设计 程序设计过程中,我们常常用树形结构来表征某些数据的关联关系,如企业上下级部门、栏目结构、商品分类等等,通常而言,这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库,都是以二维表的形式记录存储数据信息,因此是不能直接将Tree存入DBMS,设计合适的Schema及其对应的CRUD算法是实现关系型数据库中存储树形结构的关转载 2012-09-13 21:17:00 · 887 阅读 · 0 评论 -
bloom filter
一、什么是 Bloom filter Bloom filter 是由 Howard Bloom 在 1970 年提出的二进制向量数据结构,它具有很好的空间和时间效率,被用来检测一个元素是不是集合中的一个成员,这种检测只会对在集合内的数据错判,而不会对不是集合内的数据进行错判,这样每个检测请求返回有“在集合内(可能错误)”和“不在集合内(绝对不在集合内)”两种情况,可见 Bloom filter转载 2012-09-17 14:16:07 · 394 阅读 · 0 评论 -
JNDI
JNDI(Java Naming and Directory Interface,Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来,使得我们可以用名称访问对象。目录服务是一种命名服务,在这种服务里,对象不但有名称,还有属性。 英文全称是:Java Naming and Directory InterfaceS 术语解释:一组帮助转载 2012-09-17 10:53:52 · 619 阅读 · 0 评论 -
一个简单的EJB例子!!
EJB入门例子文件创建日期:2006-10-13 14:48作者:ALin声明:这个Converter的例子应该是J2EE 1.4 Tutorial上面的。不过那上面都是用NetBeans开发的。让人知其然,不知所以然。同时本文参考了网上的一些资料。算不上原创,只能说是把别人的东西拿来总结了一下。 1、 开发环境:Windows XP SP2,WTP1.02,JBoss4.0转载 2012-09-17 10:46:31 · 469 阅读 · 0 评论 -
架构腐化之谜
前言新技术层出不穷。过去十年时间里,我们经历了许多激动人心的新技术,包括那些新的框架、语言、平台、编程模型等等。这些新技术极大地改善了开发人员的工作环境,缩短了产品和项目的面世时间。然而作为在软件行业第一线工作多年的从业者,我们却不得不面对一个现实,那就是当初采用新技术的乐趣随着项目周期的增长而迅速减少。无论当初的选择多么光鲜,半年、一年之后,只要这个项目依然活跃,业务在扩张——越来越多的功能转载 2012-09-25 11:09:56 · 1542 阅读 · 0 评论 -
iBatis 到 MyBatis区别
简介: 本文主要讲述了 iBatis 2.x 和 MyBatis 3.0.x 的区别,以及从 iBatis 向 MyBatis 移植时需要注意的地方。通过对本文的学习,读者基本能够了解 MyBatis 有哪些方面的改进,并能够顺利使用 MyBatis 进行开发。本文更适合有 iBatis 基础的开发人员阅读。 从 iBatis 到 MyBatis,你准备好了吗?对于从事 Java EE转载 2012-10-20 19:54:42 · 537 阅读 · 0 评论 -
Hadoop中的集群配置和使用技巧
── 分布式计算开源框架Hadoop入门实践(二) 其实参看Hadoop官方文档已经能够很容易配置分布式框架运行环境了,不过这里既然写了就再多写一点,同时有一些细节需要注意的也说明一下,其实也就是这些细节会让人摸索半天。Hadoop可以单机跑,也可以配置集群跑,单机跑就不需要多说了,只需要按照Demo的运行说明直接执行命令即可。这里主要重点说一下集群配置运行的过程。环境7台普通转载 2012-09-07 10:04:25 · 415 阅读 · 0 评论 -
基于消息的分布式架构
美国计算机科学家,LaTex的作者Leslie Lamport说:“分布式系统就是这样一个系统,系统中一个你甚至都不知道的计算机出了故障,却可能导致你自己的计算机不可用。”一语道破了开发分布式系统的玄机,那就是它的复杂与不可控。所以Martin Fowler强调:分布式调用的第一原则就是不要分布式。这句话看似颇具哲理,然而就企业应用系统而言,只要整个系统在不停地演化,并有多个子系统共同存在时,这条转载 2012-09-07 10:32:19 · 1142 阅读 · 0 评论 -
Hadoop基本流程与应用开发
── 分布式计算开源框架Hadoop入门实践(三) Hadoop基本流程一个图片太大了,只好分割成为两部分。根据流程图来说一下具体一个任务执行的情况。在分布式环境中客户端创建任务并提交。InputFormat做Map前的预处理,主要负责以下工作:验证输入的格式是否符合JobConfig的输入定义,这个在实现Map和构建Conf的时候就会知道,不定义可以是Wr转载 2012-09-07 10:08:31 · 430 阅读 · 0 评论 -
Java Process类的浅学习
今天用了下java.lang.Process类,只是初步的学习,并没有深入实践,因为感觉它的用途并不是很大,偶尔才可能用上,如果要经常使用它的人可以自行参考JDk文档。 对Process类的简要说明: Process类是一个抽象类,方法都是抽象的,它封装了一个进程,也就是一个可执行的程序 该类提供进程的输入、执行输出到进程、等待进程的完成和检查进程的退出状态及转载 2012-08-28 10:38:48 · 3243 阅读 · 0 评论 -
解缩文件 zipFile支持中文
使用Java自带的类 java.util.zip进行文件/目录的压缩的话,有一点不足,不支持中文的名件/目录命名,如果有中文名,那么打包就会失败。本人经过一段时间的摸索和实践,发现在一般的Ant.jar类库中也有zip类,import org.apache.tools.zip.*,能够解决不支持中文文件目录的问题,同时,Ant的获得途径也比较多,一般的应用服务器中有这个包,实在不行去下载个tomc转载 2012-08-28 10:57:19 · 832 阅读 · 0 评论 -
Java中的注解以及应用 @Deprecated @SupressWarning @Override
Annotation注解在Java中有着很广泛的,他是做为一种标识 为javac所识别,。每一个注解 都对应这一个Java类 在java.lang包中 有三个注解 分别是Deprecated SuppressWarning Override 在使用 注解前必须要在 注解类前面加上@ 每增加一个注解 就意味着产生了一个注解对象 。注解就是一个标识,编译器 通过标识来转载 2012-08-28 11:14:02 · 531 阅读 · 0 评论 -
java.security.MessageDigest类
Java 加密技术:消息摘要。一个消息摘要就是一个数据块的数字指纹。即对一个任意长度的一个数据块进行计算,产生一个唯一指印(对于SHA1是产生一个20字节的二进制数组)。消息摘要有两个基本属性: 两个不同的报文难以生成相同的摘要 难以对指定的摘要生成一个报文,而由该报文反推算出该指定的摘要(就是通常所说的加密后的密文是单向不可逆的)代表:美国国家标准技术研究所的SHA1和麻省理转载 2012-08-27 18:10:19 · 626 阅读 · 0 评论 -
Apache Commons工具集简介
common-lang (2.1)ArrayUtils常量中包含了基本类型(及其相对应类)的空数组。提供向数组增加元素(包括增加单个元素或是整个数组),删除元素,翻转元素排列次序克隆数组(基本类型)查找数组中的元素(是否包含,返回索引)获得数组长度(null安全,返回为0)数组是否为空,数组是否相等,长度是否相等,元素类型是否相同,基本类型对转载 2012-08-28 13:55:50 · 1053 阅读 · 0 评论 -
Apache commons (Java常用工具包)简介
BeanUtilsCommons-BeanUtils 提供对 Java 反射和自省API的包装 BetwixtBetwixt提供将 JavaBean 映射至 XML 文档,以及相反映射的服务. ChainChain 提供实现组织复杂的处理流程的“责任链模式”. CLICLI 提供针对命令行参数,选项,选项组,强制选项等的简单API. CodecCodec 包含一转载 2012-08-28 14:42:09 · 1818 阅读 · 0 评论 -
Apache Commons IO工具包
Java的文件操作太基础,缺乏很多实用工具,比如对目录的操作,支持就非常的差了。如果你经常用Java操作文件或文件夹,你会觉得反复编写这些代码是令人沮丧的问题,而且要大量用到递归。 下面是的一个解决方案,借助Apache Commons IO工具包(commons-io-1.1.jar)来简单实现文件(夹)的复制、移动、删除、获取大小等操作。import org.apache.com转载 2012-08-28 14:59:22 · 619 阅读 · 0 评论 -
HttpServletResponse对象
1.HttpServletResponse对象(1).Web服务器收到一个http请求,会针对每个请求创建一个HttpServletRequest和HttpServletResponse对象,向客户端发送数据找HttpServletResponse,从客户端取数据找HttpServletRequest;(2).HttpServletResponse对象可以向客户端发送三种类型的数据:a.响转载 2012-08-28 15:41:45 · 1352 阅读 · 1 评论 -
分布式计算开源框架Hadoop介绍
── 分布式计算开源框架Hadoop入门实践(一)在SIP项目设计的过程中,对于它庞大的日志在开始时就考虑使用任务分解的多线程处理模式来分析统计,在我从前写的文章《Tiger Concurrent Practice --日志分析并行分解设计与实现》中有所提到。但是由于统计的内容暂时还是十分简单,所以就采用Memcache作为计数器,结合MySQL就完成了访问控制以及统计的工作。然而未来,对于海转载 2012-09-07 09:53:45 · 730 阅读 · 0 评论 -
背包问题应用
1. 背包问题介绍背包问题不单单是一个简单的算法问题,它本质上代表了一大类问题,这类问题实际上是01线性规划问题,其约束条件和目标函数如下:自从dd_engi在2007年推出《背包问题九讲》之后,背包问题的主要精髓基本已道尽。本文没有尝试对背包问题的本质进行扩展或深入挖掘,而只是从有限的理解(这里指对《背包问题九讲》的理解)出发,帮助读者更快地学习《背包问题九讲》中的提到的各种背包问题的主转载 2012-10-21 22:11:52 · 568 阅读 · 0 评论 -
详解动态规划算法
能用动态规划解决的问题,肯定能用搜索解决。但是搜素时间复杂度太高了,怎么优化呢?你想到了记忆化搜索,就是搜完某个解之后把它保存起来,下一次搜到这个地方的时候,调用上一次的搜索出来的结果。这样就解决了处理重复状态的问题。动态规划之所以速度快是因为解决了重复处理某个状态的问题。记忆化搜索是动态规划的一种实现方法。搜索到i状态,首先确定要解决i首先要解决什么状态。那么那些状态必然可以转移给i状态。于是你转载 2012-10-21 21:01:59 · 732 阅读 · 0 评论 -
CMWAP 和 CMNET
CMWAP是手机上网使用的接入点的名称。通过CMWAP只能访问WAP网站。CMWAP使用HTTP代理协议和WAP网关协议可以访问到Internet。含义 1、移动用户访问WAP内容的接入点,又名中国移动梦网; 2、用于访问wap网站和接收彩信、下载百宝箱应用,只能访问WAP网络内容; 3、全球通、动感地带、神州行等支持GPRS的卡都支持; 4、百宝箱应用转载 2012-10-21 20:42:18 · 555 阅读 · 0 评论 -
基于语义和规则的Web网页细粒度信息抽取方法
基于语义和规则的Web网页细粒度信息抽取方法王晓飞11(北京邮电大学模式识别实验室)摘要:本文在利用语义和规则的基础上,提出了一个Web网页信息细粒度抽取的方法。方法首先,利用Web网页的结构和HTML标签信息进行网页的粗粒度信息抽取;其次,结合网页标签、结构和文本语义将粗粒度信息进行文本标识和分割,形成语义上紧密相关的标识文本;然后,根据语义解释器,依次识别出文本中的属性项;最后利用原创 2013-03-30 12:20:06 · 3137 阅读 · 0 评论 -
总结和展望
第1章 总结和展望1.1. 总结随着Web网络的逐渐成熟,移动带宽的提高、云计算和物理网应用的丰富,越来越多的智能终端设备被接入到网络中,Web数据已经成为一个蕴含巨大价值的信息仓库。如何利用Web信息挖掘技术从"大数据"的Web中高效、智能的获取信息,成为人们越来越关心的问题。本文研究了Web信息挖掘的相关方法,形成了完善的主题的描述特征、网页特征和链接特原创 2013-03-30 12:22:35 · 671 阅读 · 0 评论 -
基于标题和正文依存树的中文网页正文抽取方法
基于标题和正文依存树的中文网页正文抽取方法 王晓飞1 (1. 北京邮电大学 信息与通信工程模式识别实验室,北京 100876) 摘 要: 正文抽取是许多数据挖掘技术的基础,其目的是为了从数据密集充满噪声的Web页面中,抽取最有价值的核心信息。传统基于统计的正文抽取方法无法解决正文简短、正文评价较长和正文为表格的网页。针对这些问题,本文通过对网页标题和网页正文位原创 2013-03-25 21:25:39 · 2534 阅读 · 0 评论 -
基于URL特征的网站结构信息挖掘
基于URL特征的网站结构信息挖掘王晓飞11(北京邮电大学模式识别实验室)摘要:本章首先深入的研究了网站的结构和URL的特征,然后制定了三元组节点的URL层次树的构建规则,利用建立的URL层次树描述网站的层次结构,最后设计了根据URL层次树对URL进行网页分类方法。构建URL层次树,首先要根据网站的首页建立URL层次树的根节点,然后利用网络爬虫,将URL层次树添加枝叶,最后对形成的URL原创 2013-03-25 21:27:15 · 5359 阅读 · 3 评论 -
cygwin
cygwin使用心得 1.在cygwin里访问Windows盘 cd /cygdrive/c cd c: 2.整合cygwin命令到Windows中 假设cygwin安装在d:/develop/cygwin,则将d:/develop/cygwin/bin添加到系统变量PATH中(最好加在windows前面,这样的话,有些相同的命令的话,是先执行cygwin的命令,而不是wind转载 2013-04-18 16:22:36 · 592 阅读 · 0 评论 -
Python安装、配置图文详解
Python安装、配置图文详解 目录: 一. Python简介 二. 安装python 1. 在windows下安装 2. 在Linux下安装 三. 在windows下配置python集成开发环境(IDE) 1. 在Eclipse中安装PyDev插件转载 2013-04-19 10:19:35 · 1165 阅读 · 1 评论 -
17个新手常见Python运行时错误
当初学 Python 时,想要弄懂 Python 的错误信息的含义可能有点复杂。这里列出了常见的的一些让你程序 crash 的运行时错误。1)忘记在 if , elif , else, for , while , class ,def 声明末尾添加 :(导致 “SyntaxError :invalid syntax”)该错误将发生在类似如下代码中:view source转载 2013-10-28 17:16:00 · 624 阅读 · 0 评论 -
Python socket编程
一个简单的python socket编程一、套接字套接字是为特定网络协议(例如TCP/IP,ICMP/IP,UDP/IP等)套件对上的网络应用程序提供者提供当前可移植标准的对象。它们允许程序接受并进行连接,如发送和接受数据。为了建立通信通道,网络通信的每个端点拥有一个套接字对象极为重要。套接字为BSD UNIX系统核心的一部分,而且他们也被许多其他类似UNIX的操作系统包括转载 2013-10-28 17:04:12 · 559 阅读 · 0 评论 -
python 常用模块介绍
1.os模块os模块包装了不同操作系统的通用接口,使用户在不同操作系统下,可以使用相同的函数接口,返回相同结构的结果。os.name:返回当前操作系统名称('posix', 'nt', 'os2', 'mac', 'ce' or 'riscos')os中定义了一组文件、路径在不同操作系统中的表现形式参数,如os.sep(文件夹分隔符,windows中是 \ )os.extsep转载 2013-10-23 17:13:08 · 521 阅读 · 0 评论 -
站点垂直挖掘模型的研究和实现
第6章 站点垂直挖掘模型的研究和实现王晓飞11(北京邮电大学模式识别实验室)0 引言在通过对结构挖掘和内容挖掘的理论研究和方法改进基础上,本章从实际应用的角度出发,分析具体的实际应用需求,设计和实现了基于结构挖掘和内容挖掘的站点垂直挖掘模型。站点垂直挖掘模型由一系列科学严谨的信息挖掘理论和方法构成,通过结构挖掘和内容挖掘,逐步将拥挤、充满噪声的无结构化站点信息转换简洁、扼要的结原创 2013-03-30 12:21:40 · 735 阅读 · 0 评论 -
基于URL特征的网站结构信息挖掘
基于URL特征的网站结构信息挖掘王晓飞11(北京邮电大学模式识别实验室)摘要:本章首先深入的研究了网站的结构和URL的特征,然后制定了三元组节点的URL层次树的构建规则,利用建立的URL层次树描述网站的层次结构,最后设计了根据URL层次树对URL进行网页分类方法。构建URL层次树,首先要根据网站的首页建立URL层次树的根节点,然后利用网络爬虫,将URL层次树添加枝叶,最后对形成的URL原创 2013-03-30 12:19:22 · 1638 阅读 · 0 评论 -
Web信息挖掘和主题特征研究
3.1 引言由于信息的爆炸增长,主题搜索引擎在特定的搜索领域,例如机票搜索、旅游搜索、生活搜索、小说搜索,有着更好的用户体验。主题搜索引擎作为未来搜索引擎主要发展趋势,在网络信息智能处理上还存在着仅能处理一种类型网页、提取的信息细化程度低、准确率与效率矛盾、人工干预较多、不支持增量信息处理等不足。基于主题特征的Web信息挖掘方法可以对特定领域的数据进行精确的抽取、高效的过滤,发原创 2013-03-30 12:18:25 · 1262 阅读 · 0 评论 -
IPv4与IPv6的区别是什么
目前的全球因特网所采用的协议族是TCP/IP协议族。IP是TCP/IP协议族中网络层的协议,是TCP/IP协议族的核心协议。目前IP协议的版本号是4(简称为IPv4),发展至今已经使用了30多年。 IPv4的地址位数为32位,也就是最多有2的32次方的电脑可以联到Internet上。 近十年来由于互联网的蓬勃发展,IP位址的需求量愈来愈大,使得IP位址的发放愈趋严格,各项资料显示全球IPv4位址可转载 2012-10-21 21:23:32 · 579 阅读 · 0 评论 -
spring有三种启动方式
spring有三种启动方式,使用ContextLoaderServlet,ContextLoaderListener和ContextLoaderPlugIn.spring有三种启动方式,使用ContextLoaderServlet,ContextLoaderListener和ContextLoaderPlugIn.看一下ContextLoaderListener的源码,这是一个Serv转载 2012-11-20 17:48:21 · 394 阅读 · 0 评论 -
神经网络
思维学普遍认为,人类大脑的思维分为抽象(逻辑)思维、形象(直观)思维和灵感(顿悟)思维三种基本方式。逻辑性的思维是指根据逻辑规则进行推理的过程;它先将信息化成概念,并用符号表示,然后,根据符号运算按串行模式进行逻辑推理;这一过程可以写成串行的指令,让计算机执行。然而,直观性的思维是将分布式存储的信息综合起来,结果是忽然间产生想法或解决问题的办法。这种思维方式的根本之点在于以下两点:1.信息是通转载 2013-01-23 20:52:00 · 1364 阅读 · 0 评论 -
BP算法
BP算法 误差反向传播(Error Back Propagation, BP)算法1、BP算法的基本思想是,学习过程由信号的正向传播与误差的反向传播两个过程组成。1)正向传播:输入样本->输入层->各隐层(处理)->输出层注1:若输出层实际输出与期望输出(教师信号)不符,则转入2)(误差反向传播过程)2)误差反向传播:输出误差(某种形式)->隐层(逐层)->输入层转载 2013-01-23 21:34:56 · 1242 阅读 · 0 评论