自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

转载 Scala编程入门一

Scala程序可以以解释器的方式进行执行,但是它实际上并不是一个解释器。实际发生的是,输入的内容被快速地编译成字节码,然后字节码交给Java虚拟机执行,所以你可以称它为REPL Windows上Scala的开发环境搭建如百度经验所示:http://jingyan.baid...

2014-11-04 13:11:00 122

转载 电商分词浅谈一

电商系统的分词,不同于百度这种通用搜索引擎,它有自己一套独立的词典和业务逻辑,它所处理的语料以及分词算法都是需要定制的。 首先,是语料来源的不同,我们以京东商城为例,商品详情页截图如下最主要是标红的主标题和副标题,作为分词的语料训练来源,以及下面的数据 类目数据 ...

2014-09-25 09:25:00 823

转载 mvn编译内存的修改

在构建大的项目时,需要大内存的支持,此时Maven可能会常常报内存溢出(OutOfMemory)的异常!解决的方法就是调整Java堆的大小,具体如下: 找到文件%M2_HOME%/bin/mvn.bat,这就是启动Maven的脚本文件,找到该文件中以下代码所在的行: @REM s...

2014-06-09 10:13:00 976

转载 Solr学习笔记-开始

转载于:https://my.oschina.net/patricklee/blog/210048

2014-03-20 16:10:00 116

转载 Solr源码剖析-1-Solr是什么?

转载于:https://my.oschina.net/patricklee/blog/209687

2014-03-19 16:08:00 71

转载 第三方支付公司面试指南

面试总结 有的部门侧重业务,有的部门侧重技术 如果有支付,金融银行等行业业务相关知识,可以结合技术聊一聊某一业务的大致实现。当然如果你对业务知识非常熟悉,可以对业务流程进行分析优化,也可以想象业务以后的变化,这样对编码实现有很大的好处。 如果没有支付,金融银行等行业业务相关...

2014-03-14 09:28:00 324

转载 如何debug solr源码

话不多说,按照步骤来,基于 solr 4.5 http://lucene.apache.org/solr/4_5_0/tutorial.html 下载,解压,启动, 启动时候加参数 java -jar -Dcom.sun.management.jmxremote.por...

2014-02-28 18:27:00 132

转载 Weka源码分析

转载于:https://my.oschina.net/patricklee/blog/185224

2013-12-17 13:42:00 93

转载 Weka API介绍

转载于:https://my.oschina.net/patricklee/blog/185223

2013-12-17 13:41:00 171

转载 Weka第一个编程例子

Weka可以作为一个包导入到eclipse工程中,具体看截图 示例代码如下: package com.mycompany.project;import java.io.File;import java.util.Rando...

2013-12-17 13:35:00 220

转载 Weka编程入门

转载于:https://my.oschina.net/patricklee/blog/185220

2013-12-17 13:35:00 166

转载 Weka软件介绍

从http://www.cs.waikato.ac.nz/ml/weka/downloading.html下载Weka最新的Weka, 以Windows为例,下载.exe 下载后默认安装,路径为C:\Program Files\Weka-3-6,下面有几个文件夹和文件 ...

2013-12-17 13:34:00 619

转载 Weka数据格式

想必大家都看了上节入门里面使用的文件,weather.nominal.arff,文件格式为.arff arff全称是Attribute-Relation File Format,翻译来应该是属性关联文件格式。 可以记住里面只有@代表元数据描述,用来描述关系...

2013-12-17 13:34:00 109

转载 Weka的前世今生

Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),为何叫怀卡托?因为是新西兰的怀卡托大学开发的。同时,Weka也是新西兰的一种鸟名(-_-;参见 hadoop ant)。 Weka自从推出来以后...

2013-12-17 13:30:00 121

转载 中文拼音分词

最近工作中经常遇到用户的查询是这种类型,handuyishe, chuntianxingganchangqun,leisisiwa, 实在找不到好的办法,也不想用拼音词典分词,所以看了网上一些资料,写了一个正则表达式, [^aoeiuv]?h?[iuv]?(ai|ei|ao|ou...

2013-11-26 17:08:00 387

转载 cygwin挺害人

最近在Windows上执行一个shell脚本,结果发现出现这么一个错误 ./find.sh: line 8: syntax error near unexpected token `$'\r'' 搞了半天也搞不明白,最后发现是Windows 与 Unix 的字符问题 ...

2012-07-10 09:46:00 71

转载 中国和美国 Database 牛校、牛人及相关会议评价 [转载]

其实,DB牛的也就那么二十来所学校。。。      USA: Wisconsin, Stanford, Berkeley, Cornell, UIUC, Washington, CMU, UCSD, UMich, UPenn, Maryland, Columbia, Purdue, Duke,...

2012-06-20 12:16:00 170

转载 HDFS随机写

很早的一篇博文 最近 由于 项目 中 遇到了TIFF(我们的TIFF文件 是 GeoTiff)批量处理的问题,并且由于HDFS读写 图像文件功能的缺失,所以我们就自定义了Hadoop 的 ImageInputFormat ImageRecordReader等 类, 将 文件的 名称封装在...

2012-03-22 16:01:00 422

转载 Linux命令行技巧

下面我将和大家分享一些学习Linux命令行的技巧,希望能对大家有所助益。如果在本文中遇到不太熟悉的命令,可以在终端中键入以下命令寻求帮助。 Man<command> Where there's a shell, th...

2012-03-22 15:52:00 86

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除