杂文
fish_cool
擅长java并发设计与开发(包括多核开发)、java性能调优、java分布式架构与设计、工作流引擎算法、python;对erlang、ada、搜索引擎有浓厚的兴趣,曾从事过数据分析与挖掘(SAS)和hadoop平台相关(hive、sqoop、R、zookeeper、mahout、Hbase等)方面的研究与开发,现阶段负责公司的整个大数据平台的搭建(包括海量实时OLAP查询、离线计算平台、实时计算平台),并朝着各平台封装成产品的方向前进
展开
-
SQL server 2005还原错误
SQL server 2005还原错误原创 2010-10-20 13:39:00 · 1863 阅读 · 0 评论 -
关于jxl写入特殊字符问题
关于jxl写入特殊字符问题原创 2011-02-12 13:47:00 · 1679 阅读 · 0 评论 -
关于java无法加载到rt.jar文件
关于java无法加载到rt.jar文件原创 2011-03-10 15:29:00 · 6151 阅读 · 0 评论 -
面向程序员的数据库访问性能优化法则
面向程序员的数据库访问性能优化法则转载 2011-03-21 13:54:00 · 920 阅读 · 0 评论 -
Mybatis中PaginationQueryList无法进行排序问题
Mybatis中PaginationQueryList无法进行排序问题原创 2011-05-27 09:53:00 · 2605 阅读 · 3 评论 -
关于oracle优化实战
关于oracle优化实战原创 2011-04-13 17:51:00 · 746 阅读 · 1 评论 -
关于Tomcat6在部署war包后无法更新
最近在进行产品的部署过程(使用apache-tomcat-6.0.30版本)当中,出现了几次更新war包后,访问页面还是之前老的页面问题,经过几次检查操作如下:第一:删除webapps目录下,相关的应用项目第二:server.xml里的配置如下: unpackWARs="true" autoDeploy="true" xmlVa原创 2011-06-30 15:08:00 · 6233 阅读 · 0 评论 -
将tomcat注册为服务linux
1.在/etc/rc.d/init.d中建tomcat脚本.2.chkconfig --add tomcat就可以用service tomcat start/stop/rstart了附:脚本(我也是抄的,呵呵)#!/bin/sh## Startup scrip转载 2011-07-06 13:55:11 · 2017 阅读 · 0 评论 -
Linux下cronolog安装配置
Linux下cronolog安装配置Linux下运行的Web服务器Apache,默认日志文件是不分割的,一个整文件既不易于管理,也不易于分析统计。安装cronolog后,可以将日志文件按时间分割,易于管理和分析。cronolog安装配置非常简单,下载后只需要输原创 2011-07-06 13:30:38 · 18898 阅读 · 0 评论 -
JXL复制源码
import java.io.File;import java.io.IOException;import jxl.BooleanCell;import jxl.Cell;import jxl.CellType;import原创 2011-07-13 23:20:56 · 1908 阅读 · 0 评论 -
java -version时出现could not open D:/java/jre1.6.0_22/lib/i386/jvm.cfg
java -version时出现问题原创 2011-02-09 16:31:00 · 3320 阅读 · 0 评论 -
JSP中的编码设置
JSP中的编码设置转载 2011-01-18 22:48:00 · 3567 阅读 · 0 评论 -
项目升级有感
项目升级有感原创 2010-12-21 14:51:00 · 858 阅读 · 0 评论 -
Resin的classpath设置有感
Resin的classpath设置有感原创 2011-01-14 10:45:00 · 3023 阅读 · 0 评论 -
Resin配置SSL说明
Resin配置SSL说明转载 2011-01-14 22:33:00 · 2528 阅读 · 0 评论 -
在Resin下使用jxl问题
在Resin下使用jxl问题原创 2011-01-14 23:08:00 · 2241 阅读 · 2 评论 -
Resin初始化配置文件
Resin初始化配置文件失败原创 2011-01-14 17:57:00 · 1441 阅读 · 2 评论 -
Resin4.0相关破解方式
Resin4.0相关破解方式原创 2011-01-14 23:44:00 · 6931 阅读 · 0 评论 -
关于resin和jboss的比较
关于resin和jboss的比较原创 2011-01-19 10:21:00 · 2570 阅读 · 4 评论 -
resin 配置与使用
resin 配置与使用转载 2011-01-17 20:55:00 · 2057 阅读 · 0 评论 -
spring schema扩展结构
spring schema扩展结构原创 2011-01-18 15:54:00 · 935 阅读 · 0 评论 -
ECSHOP本机快速部署安装教程
最近在给公司弄一个网上商城,找到一个php做的开源项目,将搭建的过程转发下(我按照此过程,搭建成功) 1.XAMPP 是一个易于安装且包含 MySQL、PHP 和 Perl 的 Apache 发行版。XAMPP 的确非常容易安装和使用:只需下载,解压缩,启动即可。下载XA转载 2011-09-01 10:57:20 · 4515 阅读 · 0 评论 -
java基本类型的对象类型在集合的判断
今天在修改程序的时候,发现一个小细节的问题,对此进行了总结下:一个简单的例子如下:ArrayList list=new ArrayList();Long id=10006L;list.add(10006);System.out.println(list.con原创 2011-10-09 15:23:03 · 2668 阅读 · 0 评论 -
jBPM4.4 eclipse插件安装
一、工具下载 jBPM 图形化流程设计器采用eclipse做为平台,我们可以先到jBPM官方网站下jBPM4.4,地址:http://sourceforge.net/projects/jbpm/files/,下载后的文件为jbpm-4.4.zip,目录结构如下: [attach]271[/attach][attach]271[/attach] 这里面包含有jbpm-gdp-si转载 2013-05-21 16:25:32 · 10268 阅读 · 2 评论 -
关于时间格式化后出现的问题
最近有个同事问我一个问题,关于时间格式化的。代码如下:public static void main(String[] args) throws ParseException { SimpleDateFormat fors = new SimpleDateFormat("yyyy-MM-dd hh:mm:ss"); String dates = "198原创 2013-05-21 18:43:04 · 870 阅读 · 0 评论 -
Unsupported major.minor version 51.0
设置:window-> Preferences->java->Compiler里设置成对应的java版本即可。转载 2013-05-26 09:41:47 · 1771 阅读 · 0 评论 -
ant学习教程连接
http://i-proving.com/2005/10/31/Ant-Tutorial/原创 2013-08-23 14:11:47 · 2437 阅读 · 0 评论 -
随记
最近很久没写博客了,主要是在更加深入的掌握hadoop的核心,目前在整理相关的资料,后续会发一系列的文章。原创 2013-10-31 10:35:59 · 1023 阅读 · 0 评论 -
发现一个淘宝API中的BUG
最近发现一个淘宝分销API中的一个bug,主要问题是返回xml格式时,获取商品名称错误;返回是json格式时,获取商品名称正常。目前采用xml格式获取返回值,主要是因为某些店铺返回json格式时,一直报错,无法正常给用户提供产品相关信息,而采用xml的格式就正常了。测试的步骤如下:API接口: taobao.fenxiao.products.get系统参数:app_key原创 2013-11-25 15:28:26 · 2375 阅读 · 0 评论 -
鲜为人知的编程真相(转)
当程序员的经历让我知道了一些关于软件编程的事情。下面的这些事情可能会让朋友们对软件开发感到惊讶: 一个程序员用在写程序上的时间大概占他的工作时间的10-20%,大部分的程序员每天大约能写出10-12行的能进入最终的产品的代码 — —不管他的技术水平有多高。 好的程序员花去90%的时间在思考、研究和实验,来找出最优方案。差的程序员花去90%的时间在调试问题程序、盲目的修改程转载 2014-03-30 19:39:30 · 2847 阅读 · 0 评论 -
spark机器学习 源码解析及原理分析
最近我们组的尹同学将机器学习剖析完成,特分享给大家学习和参考。 https://github.com/endymecy/spark-ml-source-analysis原创 2016-04-28 11:07:45 · 3476 阅读 · 0 评论 -
note What Every Programmer Should Know About Memory
AbstractAs CPU cores become both faster and more numerous, the limiting factor for most programs is now, and will be for some time, memory acces.Hardware designers have come up with ever more soph翻译 2013-01-17 11:48:46 · 696 阅读 · 0 评论 -
Sum of absolute differences
Sum of absolute differences (SAD) is a widely used, extremely simple algorithm for measuring the similarity between image blocks. It works by taking the absolute differencebetween each pixel in th翻译 2012-12-22 21:44:51 · 1669 阅读 · 0 评论 -
Why We Chose Cpp Over Java
最近在网上看到一篇关于C与java的关键对比点,很有感触,全英文。This document is to clarify our position regarding C++ vs. Java for choice of implementation language.There are two fundamental reasons why C++ is superior to Java转载 2010-12-06 10:35:00 · 762 阅读 · 0 评论 -
Request请求转发和重定位的区别
request对象实现请求转发:请求转发指一个web资源收到客户端请求后,通知服务器去调用另外一个web资源进行处理。//request实现请求转发,请求转发应用场景:mvc设计模式//重点:在mvc设计模式下,servlet产生数据了之后,如何把数据交给jsp显示 String data = "aaaa"; request.setAttribute("data", dat原创 2011-11-08 14:19:38 · 20890 阅读 · 2 评论 -
一个关于远程调用方式的场景
前段时间,在给公司维护一个自动传输文件的脚本,出现无法从FTP服务器上获取文件,并且每次出现这种情况的时候,是一个文件都不能获取到(而不是在传输过程出现中断),因为整个服务器群都在一个局域网内,所以可以判断网络断网的情况是很小的几率的。关于这个传输的文件的脚本比较特殊,调用情况是这样,假设两台主机A、B。主机A发起连接到主机B上,然后发起远程调用命令而该命令脚本是在主机B上的,该脚原创 2011-11-09 14:44:59 · 1182 阅读 · 0 评论 -
关于URL访问问题
最近模拟一个简单的爬虫方式,在基于java URL类时,抓取获取结果页,其中遇到这样的错误:Server returned HTTP response code: 403 for URL:而可以使用浏览器正确访问 因为服务器的安全设置不接受Java程序作为客户端访问 解决方案:设置User Agent即在HttpURLConnection conn=(HttpURLCo原创 2011-12-07 10:17:50 · 1287 阅读 · 0 评论 -
服务与接口的区别
最近在复习网络相关知识时,看到服务与接口的概念。其中说到一点TCP模型的不足之处,就是TCP/IP模型里的其中一层是网络接口层,此接口层不同于正常意义的层,仅仅只是接口而已。以前看的时候,并没注意到这个差别,现在细想起来,所谓接口,其实简单的提供上层调用,然后下层去实现。而服务,看似跟接口差不多,也是提供相关接口供上层调用,但是服务会去自己实现相关的处理,而不是简单的调用方法的跳转,不原创 2012-02-27 18:28:02 · 12258 阅读 · 0 评论 -
Zookeeper分布式安装手册
一、安装准备1、下载zookeeper-3.3.1,地址:http://www.apache.org/dist/hadoop/zookeeper/zookeeper-3.3.1/2、JDK版本:jdk-6u20-linux-i586.bin3、操作系统:Linux s132 2.6.9-78.8AXS2smp #1 SMP Tue Dec 16 02:42:55 EST 2008 x8转载 2012-04-12 16:06:43 · 1518 阅读 · 0 评论 -
基于内存数据库的分布式数据库架构
【摘要】 本文提出了一种通过引入内存数据库层,建立两层多分区分布式数据库架构。此方案用于解决海量高并发系统的数据存储和访问问题,尤其适用于电子商务等数据模型复杂且业务复杂的互联网站。 这些年互联网站发展迅猛,为应对海量数据下的高并发访问,产生了各种分布式架构设计思想,例如Key-Value引擎,数据分区等。而对于电子商务类网站,海量数据问题还有一个重要特点,就是数据结构化及数据之间的关联,淘宝如此转载 2011-05-11 16:38:00 · 3665 阅读 · 0 评论