- 博客(35)
- 收藏
- 关注
原创 Eclipse+Maven构建Web项目
环境准备:JDK: 1.6Eclipse: Indigo 3.7.2 - http://www.eclipse.org/downloads/packages/release/indigo/sr2Maven: apache-maven-3.1.0 - http://maven.apache.org/download.cgi1. Maven1.1 M
2013-06-20 11:02:21 1112
原创 修改python默认的字符编码为utf-8
建立sitecustomize.pyimport syssys.setdefaultencoding('utf-8')将这个文件放到python的site-package包下
2013-06-18 17:13:14 1130
原创 Web.xml详解
1. Web.xml 网站名称 网站描述 路径/small.gif 路径/large.jpg contextConfigLocation
2013-06-14 13:53:06 502
原创 Python正则表达式
1.数量词的贪婪模式与非贪婪模式正则表达式通常用于在文本中查找匹配的字符串。Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字符;非贪婪的则相反,总是尝试匹配尽可能少的字符。例如:正则表达式"ab*"如果用于查找"abbbc",将找到"abbb"。而如果使用非贪婪的数量词"ab*?",将找到"a"。2.反斜杠的困扰与大多数编程语言相同,
2013-06-13 17:38:15 504
原创 mysql常用命令总结
1、启停mysql系统默认mysql启停:[root@localhost ~]# /etc/init.d/mysqld start[root@localhost ~]# /etc/init.d/mysqld stop编译安装mysql启停:[root@localhost ~]# /usr/local/mysql/bin/mysqld_safe --user=mysql
2013-06-13 15:15:10 577
原创 Python修改Excel文件
Python Excel:http://www.python-excel.org/xlrd:Download | Documentationxlwt: Download | Documentation | Examplesxlutils: Download | Documentationpython-excel:http://www.simplistix.co.uk/pre
2013-06-13 15:15:02 2444 1
原创 转:Eclipse SVN插件
本文目的让未使用过版本控制器软件或者未使用过subversion软件的人员尽快上手。subversion的使用技巧很多,这里只总结了最小使用集,即主要的基本功能,能够用来应付日常工作。因此不涉及subversion服务器端的搭建和配置。为什么要使用版本控制当多人共同开发同一个软件时,会涉及源代码的共享以及带来的相关问题,比如追究某个代码是由谁在什么时间修改的
2013-06-13 15:14:57 575
原创 Django基础+优化
https://docs.djangoproject.com/en/1.4/Django系统搭建一. 建立一个pydjango的项目 初始的项目包括根目录的manage.py,以及一个以project name命名的文件夹(包含settings.py, urls.py,和一个wsgi.py) 如果project包含多个app,那么应该建立多个包,然后在每个包创建自己的url
2013-06-13 15:14:54 2983
转载 Hadoop:The Definitive Guid 总结 Chapter 5 MapReduce应用开发
用MapReduce来编写程序,有几个主要的特定流程,首先写map函数和reduce函数,最好使用单元测试来确保函数的运行符合预期,然后,写一个驱动程序来运行作业,要看这个驱动程序是否可以运行,之后利用本地IDE调试,修改程序实际上权威指南的一些配置已经过时 所以这里很多地方不做介绍 1.配置APIHadoop拥有很多xml配置文件,格式遵从一般xml的要求 见实例Ex
2013-06-13 15:14:48 716
转载 Hadoop:The Definitive Guid 总结 Chapter 4 Hadoop I/O
Hadoop:The Definitive Guid 总结 Chapter 4 Hadoop I/O1.数据的完整性1).HDFS的数据完整性HDFS以透明方式校验所有写入它的数据,并在默认设置下,会在读取数据时验证校验和。针对数据的每个io.bytes.per.checksum字节都会创建一个单独的校验和。默认值为512字节;DataNode负责在存储数据(包括数据的校验
2013-06-13 15:14:46 623
转载 Hadoop:The Definitive Guid 总结 Chapter 3 Hadoop分布式文件系统
1.HDFS的设计HDFS设计的适合对象:超大文件(TB级别的文件)、流式数据访问(一次写入,多次读取)、商用硬件(廉价硬件)HDFS设计不适合的对象:低时间延迟的数据访问、大量的小文件、多用户写入,任意修改文件 2.HDFS的概念1).数据块(Block)HDFS中Block的大小默认是64M,小于块大小的的文件并不占据整个块的全部空间(而是将文件大小作为块的
2013-06-13 15:14:43 630
转载 Log4J的配置文件详解[转]
Log4J的配置文件(Configuration File)就是用来设置记录器的级别、存放器和布局的,它可接key=value格式的设置或xml格式的设置信息。通过配置,可以创建出Log4J的运行环境。#log4j文件必须放在src下。编译后和class包的顶层目录平级1. 配置文件Log4J配置文件的基本格式如下:#配置根Logger
2013-06-13 15:14:41 547
转载 hadoop hdfs java api 文件操作类
package test.hadoop.util;import java.util.Iterator;import java.util.Map.Entry;import org.apache.commons.lang.exception.ExceptionUtils;import org.apache.hadoop.conf.Configuration;import org.apach
2013-06-13 15:14:36 621
转载 Hadoop:The Definitive Guid 总结 Chapter 1~2 初识Hadoop、MapReduce
1.数据存储与分析问题:当磁盘的存储量随着时间的推移越来越大的时候,对磁盘上的数据的读取速度却没有多大的增长从多个磁盘上进行并行读写操作是可行的,但是存在以下几个方面的问题:1).第一个问题是硬件错误。硬件越多出错的几率就越大。一种常用的解决方式是数据冗余,保留多分拷贝,即使一份数据处理出错,还有另外的数据。HDFS使用的也是类似的方式,但稍有不同。2).第二个问题是数据处理的相关
2013-06-13 15:14:34 582
转载 天气预报的WSDL文件生成 客户端
已有天气wsdl文件:http://www.webxml.com.cn/WebServices/WeatherWebService.asmx?wsdl 天气预报方法说明: http://www.webxml.com.cn/WebServices/WeatherWebService.asmx 根据天气预报的WSDL文件生成 客户端第一步:下载eclip
2013-06-13 15:14:30 1923
转载 项目中集成 axis2 发布webservice
在网上找了很多例子,发觉很多都是脱离项目,单独使用axis2包发布webservice接口 实际开发中,一般都是跟随项目启动之后,自动发布接口 接下来简单讲解一下 在项目中集成发布axis2 webservice接口 1.打开axis2.war包,将conf,lib,modules三个文件夹复制到项目的WEB-INF文件夹下 2.新建一个services文件夹,然后在serv
2013-06-13 15:14:26 545
原创 RMI远程调用
Java RMI 指的是远程方法调用 (Remote Method Invocation)。它是一种机制,能够让在某个 Java 虚拟机上的对象调用另一个 Java 虚拟机中的对象上的方法。可以用此方法调用的任何对象必须实现该远程接口。Java RMI不是什么新技术(在Java1.1的时代都有了),但却是是非常重要的底层技术。大名鼎鼎的EJB都是建立在rmi基础之上的,现在还有一些开源的远程调用组
2013-06-13 15:14:23 575
转载 Java 线程池学习
Java 线程池学习Reference: 《创建Java线程池》[1],《Java线程:新特征-线程池》[2], 《Java线程池学习》[3],《线程池ThreadPoolExecutor使用简介》[4],《Java5中的线程池实例讲解》[5],《ThreadPoolExecutor使用和思考》[6][1]中博主自己通过ThreadGroup实现一个线程池(挺方便理解的),使用的是
2013-06-13 15:14:16 742
原创 java.io中serializable讲解
1、序列化是干什么的?简单说就是为了保存在内存中的各种对象的状态(也就是实例变量,不是方法),并且可以把保存的对象状态再读出来。虽然你可以用你自己的各种各样的方法来保存object states,但是Java给你提供一种应该比你自己好的保存对象状态的机制,那就是序列化。2、什么情况下需要序列化a)当你想把的内存中的对象状态保存到一个文件中或者数据库中时候;
2013-06-13 15:14:05 541
转载 《Hadoop实战》的笔记-2、Hadoop输入与输出
这一问题本书只在第三章简单说了一下读写HDFS,虽然能说明问题,但是本着第一遍读书应该把书读厚的原则,我觉得很有必要自行展开一番。再说凡是万变不离其宗嘛,任何程序都是从“输入-->计算-->输出”。先说输入,Hadoop的默认的输入方式是将输入的每一行视为一条记录,该行文件偏移量为key,内容为value。这样当然不一定能满足所有的业务需要。因此,一方面Hadoop也提供了很多其他的输入格式,另一
2013-06-13 15:14:03 587
转载 利用Ant构建Hadoop高效开发环境
最近Hadoop的研究中,都是利用Mockito来模拟数据进行,下一个阶段需要在Hadoop服务器上做大量的运行进行验证,同时也要为正式使用做准备。 今天考虑使用Ant来搭建一个Hadoop的开发和调试环境,不使用hadoop自带的插件。思路如下:1、 利用Ant在开发机器上将代码编译、打包,最终得到可执行的jar包。2、 利用Ant的SSH属性,将ja
2013-06-13 15:14:01 476
转载 SQL索引优化
微软的SQL SERVER提供了两种索引:聚集索引(clustered index,也称聚类索引、簇集索引)和非聚集索引(nonclustered index,也称非聚类索引、非簇集索引)…… (一)深入浅出理解索引结构 实际上,您可以把索引理解为一种特殊的目录。微软的SQL SERVER提供了两种索引:聚集索引(clustered index,也称聚类索引、簇集索引)和非聚集
2013-06-13 15:13:48 420
转载 Sql 内外全连接的理解[实例]
SQL 连接 JOIN 例解。(左连接,右连接,全连接,内连接,交叉连接,自连接)假设有如下表:一个为投票主表,一个为投票者信息表~记录投票人IP及对应投票类型,左右连接实际说是我们联合查询的结果以哪个表为准~1:如右接连 right join 或 right outer join:我们以右边voter表为准,则左表(voteMaster)中的记录只有当其ID在右边
2013-06-13 15:13:43 550
转载 Java 操作文件大全
一.获得控制台用户输入的信息 Java代码 /** *//**获得控制台用户输入的信息 * @return * @throws IOException */ public String getInputMessage() throws IOException...{ System.ou
2013-06-13 15:13:23 405
原创 hbase基本概念和hbase shell常用命令用法
HBase是Google Bigtable的开源实现,它利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为协同服务。1. HBase的表结构HBase以表的形式存储数据。表有行和列组成。列划分为若干个列族/列簇(column family)。 Row Key
2013-06-13 15:13:18 428
转载 Hbase Java 实例
发现一HBase实例文章:http://archive.cnblogs.com/a/2178069/HBase提供了java api来对HBase进行一系列的管理涉及到对表的管理、数据的操作等。常用的API操作有:1. 对表的创建、删除、显示以及修改等,可以用HBaseAdmin,一旦创建了表,那么可以通过HTable的实例来访问表,每次可以往表里增加数据。2. 插入数据创建一个P
2013-06-13 15:13:16 579
原创 Hadoop+HBase 安装配置
hadoop版本:hadoop-0.20.2http://apache.etoak.com//hadoop/common/hadoop-0.20.2/安装配置Hadoop请参考:http://booby325.iteye.com/admin/blogs/1309940HBase版本:Hbase-0.90.3http://apache.etoak.com//hbase/hba
2013-06-13 15:13:14 438
原创 Hadoop + eclipse + linux 单机运行 WordCount
Eclipse版本3.5, Hadoop版本hadoop-0.20.2 1. 安装Hadoop 下载hadoop-0.20.2, http://www.apache.org/dyn/closer.cgi/hadoop/core/ 解压Hadoop并配置Hadoop home 环境变量$ gzip -d hadoop-0.20.2.tar.gz.切换到Hadoop
2013-06-13 15:13:12 860
原创 [多线程] java并发编程-Executor框架
Executor框架是指java 5中引入的一系列并发库中与executor相关的一些功能类,其中包括线程池,Executor,Executors,ExecutorService,CompletionService,Future,Callable等。他们的关系为: 并发编程的一种编程方式是把任务拆分为一些列的小任务,即Runnable,然后在提交给一个Executor执
2013-06-13 15:13:10 588 1
原创 IBatis 入门教程
第一步:创建POJO类Java代码 package com.ibatis; import java.io.Serializable; public class Ibatis implements Serializable{ private static final long serialVersionUID = 4
2013-06-13 15:12:58 446
转载 Quartz基础
Quartz是一个完全由java编写的开源作业调度框架。适用于周期性Work需要1. 启动QuartzSchedulerFactory schedFact = new org.quartz.impl.StdSchedulerFactory();Scheduler sched = schedFact.getScheduler();sched.start();JobDetail job
2013-06-13 15:12:56 500
原创 java操作数字证书
1.用keytool将.keystore中的证书写入文件中,然后从该文件中读取证书信息CertificateFactory cf=CertificateFactory.getInstance("X.509");FileInputStream in=new FileInputStream("out.csr");Certificate c=cf.generateCertificate(in
2013-06-13 15:12:25 644
原创 liunx下memcached安装
memcached安装 1. 下载, memcached需要先安装libevent memcached的下载地址:http://danga.com/memcached/download.bml libevent的下载地址 :http://www.monkey.org/~provos/libevent/ 2. 安装libevent # tar xzvf libeve
2013-06-13 15:12:15 465
原创 curl试用
Curl是一个很强大的http命令行工具,其功能十分强大。1) 二话不说,先从这里开始吧!$ curl http://www.yahoo.com回车之后,www.yahoo.com 的html就稀里哗啦地显示在屏幕上了 ~2) 嗯,要想把读过来页面存下来,是不是要这样呢?$ curl http://www.yahoo.com > page.html当然可以,但不用这么
2013-06-13 15:12:04 372
原创 生成Jar包以及指定初始类入口
jar:JavaTM Archive (JAR) file,java存档文件我们的输入(要压缩的东西)主要是class文件,还有辅助的资源(这其中可能有图片,jsp文件,html文件等等)。用法:jar {ctxu}[vfm0Mi] [jar-文件] [manifest-文件] [-C 目录] 文件名 ... 选项: -c 创建新的存档
2013-06-13 15:11:53 3914
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人