自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(48)
  • 资源 (2)
  • 收藏
  • 关注

原创 在Mac中安装jpype

在Mac中安装jpype, 默认使用python setup install不成功,有几个步骤:1. 安装XCode2. 安装XCode命令行工具,使系统能找到clang3. 更改setup.py使系统能够找到header文件,参考一下链接:http://stackoverflow.com/questions/8525193/how-to-install-jpy

2013-05-03 18:56:23 2014

原创 去除Pentaho biserver-ce-4.5.0版本OLAP报表下面的deprecatedWarning

最新的Pentaho版本界面比原来的漂亮,但是真正用起来有一点非常不爽,就是在每次展示OLAP灬灬时,报表最下方总是出现很显著的警告框:       JPivot has been replaced by Pentaho Analyzer. It is provided as a convenience but will no longer be enhanced or offically

2012-11-08 12:30:15 2528 4

原创 更改MySQL数据目录

创建/bi/mysql目录后,修改/etc/my.cnf datadir="/bi/mysql" 启动mysqld 发现发生以下错误提示:/etc/init.d/mysqld startInitializing MySQL database: WARNING: The host 'BGP-LF-DT0229' could not be looked up with resolvei

2012-11-02 09:31:38 1536 1

原创 fs.FSInputChecker: Found checksum error

在一个MapReduce任务中,发现以下错误:KejetLogETL ... t=(16:28:51)12/07/06 16:28:52 INFO fs.FSInputChecker: Found checksum error: b[0, 512]=30303030303030303030313009353335330a30303033374638464446444109333

2012-07-09 14:23:24 4819

转载 Hadoop权威指南数据集地址

http://www.blogjava.net/matuobasyouca/archive/2012/03/28/372877.htmlftp://ftp3.ncdc.noaa.gov/pub/data/noaa/

2012-05-12 16:16:38 2162

原创 Perl与Python处理文本数值的一个比较

最近有意地用Python写一些原来习惯于用Perl写的脚本。发现Perl还是有其自由之处,在处理数值与字符串时有很大的方便。我所要做的工作是简单根据广告类别对模拟实验结果进行平均。 这个任务用Perl编写需要36行代码写成,Python需要43行。即使两者都尽可能一个语句一行,仍然是Python需要的行数多(Perl包括其括号)。 Python的额外工作在于: 1)字典Key的初始化(Python

2011-12-12 14:42:21 3346

原创 MySQL 的自动补全功能

这几天才知道MySQL 命令(command)自动补齐功能 (用了好几年MySQL,现在才知道,真是惭愧呀)但是默认不是开启的。若要开启此功能,可以在Linux中vi /etc/my.cnf[mysql]#no-auto-rehashauto-rehash         #添加

2011-07-14 15:59:29 16035 1

原创 MySQL从数据库文件恢复数据的方法

执行步骤:1. 拷贝文件夹 : 将待恢复数据库文件夹(如 temp)拷贝到系统Mysql数据文件夹下(一般为/var/lib/mysql)2. 更改文件夹与表用户: 使用chown 与chgrp 命令更改文件夹与文件的属主 为 mysql  : chown mysql temp;

2011-07-12 11:34:27 1244

原创 从一个文件中随机抽取N行方法

从M行的文件随机抽取N行(可以假定M>=N),这是需要对数据进行抽样处理时很长常见的需求。 首先想到的方法是每读取一行,扔一个0到M-1的随机数,如果随机数小于N,则输出该行,否则不输出。Perl源代码如下: #!/usr/bin/perl# subset.pl # Usage: sub_set.pl file sample_num if (@ARGV != 2)

2011-06-14 18:15:00 8378

原创 Weka中使用libsvm

Weka中使用libsvm设置

2011-04-19 11:05:00 2338

原创 PPT分享:非参数统计方法简介

内部分享PPT:内容包括统计的稳健性 ;参数统计与非参数统计的比较;单总体位置参数的检验;分布的一致性检验: χ2检验;两总体的比较与检验;多总体的比较与检验 http://wenku.baidu.com/view/222a736eb84ae45c3b358c3a.html

2011-04-02 11:08:00 877

原创 中值问题O(N)算法C++源码

中值问题O(N)算法的C++实现

2011-01-27 10:32:00 1172

原创 中值问题O(N)算法研究

本文介绍两种比一般先排序再得到中值更快的求中值的算法。第一种是利用快速排序原理的准确的随机选择算法;第二种是一种近似算法,所获得的值虽然可能不是很精确,但一般会比第一种方法更快。

2011-01-27 10:21:00 7540 2

原创 文档分享:Fortran与C++的比较

Fortran与C++的比较http://wenku.baidu.com/view/a1daf3d333d4b14e85246856.html

2010-12-13 16:33:00 1611

原创 文档分享:Bash shell学习笔记 PDF版本

Bash shell学习笔记http://wenku.baidu.com/view/25e0c63b580216fc700afd66.html

2010-12-13 16:30:00 876

原创 文档分享:C++学习笔记 PDF版本

C++学习笔记 PDF版本http://wenku.baidu.com/view/ee817bf4f61fb7360b4c6542.html

2010-12-13 16:29:00 1315

原创 Awk学习笔记PDF版本

Awk学习笔记

2010-12-13 16:27:00 1823 2

原创 Weka访问MySql数据库

Weka默认配置访问MySql数据库错误解决

2010-12-06 18:22:00 2074 1

原创 Perl学习笔记PDF版本

我已经上传到百度文库中: Perl学习笔记PDF版本 看这个版本吧,CSDN的显示简直没法看 :-)

2010-11-16 11:58:00 1141

原创 Perl学习笔记

本文的PDF版本:http://wenku.baidu.com/view/bdbd8aeae009581b6bd9ebfe.html学习笔记简介Perl一般被认为是Practical Extraction andReport Language(实用获取与报表语言)的缩写,是由C以及sed、awk、Unix shell及其它语言演化而来的一种语言。它由语言学家Larry Wa

2010-08-18 16:32:00 16609

转载 Linux fc命令使用

fc命令与history结合会很有效,下面贴出其详细说明http://www.allwiki.com/wiki/Linux命令:Fc使用权限所有用户语法格式打开一个编辑器去修改或重新执行以前输入的命令fc [ -r ] [ -e Editor ] [ First [ Last ] ]生成一个以前输入的命令的列表fc -l [ -n ] [ -r ] [ Fi

2010-04-08 11:09:00 9525

原创 Perl Wide character in print问题解决

在使用Text::CSV模块解析CSV文件时遇到问题;在开始加入binmode STDOUT, :utf8;语句,症状消失,整个使用CSV的代码如下:#!/usr/bin/perl use strict;use Text::CSV; binmode STDOUT, :utf8;my @rows;my $csv = Text::CSV->new ( {

2010-04-06 16:23:00 5914

原创 Linux find exec的使用方法

目前至少可以知道find与exec的组合可以对某一类的文件进行某种操作,比如:find ./ -name "fs_online*.bz2" -exec bunzip {} /;当然,这么简单的操作可以直接用bunzip fs_online*.bz2完成,但是,find可以有复杂的选择条件,这时就不是有轻易的替换方式了。

2010-03-30 15:18:00 740

原创 Shell文件集体重命名的方法

Linux文件单个重命名一般用mv命令,集体重命名很多人自己写一个简单脚本,但是其实Linux的rename命令可以简单实现绝大多数的重命名任务。man rename结果如下:  NAME       rename - Rename files SYNOPSIS       rename from to file... DESCRIPTION      

2010-02-08 14:29:00 2473

原创 自然科学进展2009年第1期《个性化推荐系统的研究进展》一文的两个问题

 初读这篇文章,还感觉挺好的。国内的杂志能出这样的文章,实在是很难得了。但是后来发觉这篇文章好些地方与一篇英文文章《Toward the next generation of recommendation systems: A survey of the state-of-the-art and possible extensions》雷同。而且至少有以下两处值得商榷: 

2009-10-14 17:34:00 1315 1

转载 C++的split函数

C++ STL中没有类似Perl的split函数,必须自己写一个。下面是从网上(http://stackoverflow.com/questions/236129/c-how-to-split-a-string)转帖的代码及使用方法,还是挺管用的。另外,C的strtok()函数也可以实现类似功能。void Tokenize(const string& str,

2009-09-15 14:42:00 6784 1

原创 《时间管理--给系统管理员》读书笔记

    关于时间管理的书很多,然而这本书却很特别:它有一个副标题—给系统管理员。这本书是一位资深的系统管理员写的,最直接的读者对象也是系统管理员。初看起来这是一本技术书籍,只适合技术人员阅读,但其实却是一本很好的通用书籍,适合所有想改进时间管理技巧的人阅读。书中涉及到代码、脚本等非技术人员完全可以略去不看。作者对计算机系统有很深的了解,向计算机系统管理中学习了许多时间管理的原则与技巧。    

2009-08-04 14:45:00 1667

原创 《Hacking Vim》读书笔记:Vim中高级技巧

Normal 0 7.8 磅 0 2 false false false MicrosoftInternetExplorer4 <object class

2009-05-31 14:19:00 3688

原创 好与坏的页面展示(从推荐系统角度)

Normal 0 7.8 磅 0 2 false false false MicrosoftInternetExplorer4 <! /* Styl

2009-04-27 16:08:00 656

原创 2009年4月18日CSDN中国软件技术大会流水账评论

首先,我想说的是我不喜欢“英雄”大会这个名称,尽管大会去了很多牛人,但是我想大部分人还是像我这样的一般开发者,去的目的是为了开阔一些视野。我可不认为自己是什么英雄,而且我也认为真正的英雄是不认为自己是什么英雄的。早晨九点钟到过去,领了一个袋子。里面真正有价值的东西是一支打有CSDN标签的签字笔。进去找了个位子,位子好小地方好挤呀。不过过了一会儿心理就平衡了,因为再来的人只能在后面站着,而且到1

2009-04-20 10:20:00 655

原创 Shell中得到某一天前n天的日期的方法

如果有一个日期data_date(yyyy-mm-dd), 需要得到其n天前的日期,该如何实现呢?1.首先,将其转为yyyymmdd的格式:tempday=${data_date:0:4}-${data_date:4:2}-${data_date:6:2}2.然后用Loop循环来实现: for (( i=0; ido   (( tempday-- ))   temp

2009-04-15 10:24:00 5482

原创 grep/sed/awk与Perl比较的更新(2)

根据同事的建议,我更改了grep/sed/awk组合处理的程序,让程序一次将文件读入内存,然后用grep/sed/awk处理,结束后再读下一个文件。这样改进后,运行时间为29m7s,较Perl更快一点。 files=$(find /home/sqmdata/${data_date}/*)for f in $files; do   grep/sed/awk...done 

2009-03-24 09:28:00 992

原创 grep/sed/awk与Perl比较的更新(1)

根据同事的建议,我更改了Perl程序,主要是使用了推荐的split和读入文件方式while (),使用默认$_,@_变量,得到的Perl程序最新的运行时间为33m45s,所以结论应该为: Normal 0 7.8 磅 0 2 false false false

2009-03-20 10:22:00 1166

原创 Awk、Grep/Sed/Awk组合及Perl进行文本处理性能比较

Normal 0 7.8 磅 0 2 false false false MicrosoftInternetExplorer4 <object class

2009-03-19 16:09:00 5454

原创 mysql中不输出表头和结尾的方法

当想使用数据库中的某些数据,想将其导入到文件中。这时一般用如下命令:echo "select vername, funverid from funshion_version " |mysql labindw >funshion_version.txt但是这样做有一个问题,即输出为:vername funverid1.2.4.15Beta    11.2.4.10Beta    21.2

2009-02-17 15:11:00 17893 1

原创 关联分析是数据挖掘的本质

一般教科书上讲数据挖掘技术,主要讲关联规则、分类、聚类、异常检测。而关联规则的代表应用是购物篮分析。而事实上,关联分析的概念要远远广于一般教科书上所讲的关联规则挖掘。数据分析找出一个参量与另外参量的关联,很多时候是想进行因果关联分析,即通过数量关联、时序关联的分析进行原因关联分析,而购物篮分析应用只是关联分析的典型应用。

2009-02-10 16:07:00 1179

原创 MySQL被收购后被删除的关于其核心价值的部分

这才是MySQL的精华!!!由于某些原因被删除了,可惜呀!          MySQL AB is the company of the MySQL founders and main developers.MySQL AB was originally established in Sweden by David Axmark, AllanLarsson, and Michael “M

2009-01-13 17:17:00 974

原创 AWK学习笔记

  Normal 0 7.8 磅 0 2 false false false MicrosoftInternetExplorer4 <object cl

2008-12-25 09:13:00 5395

原创 GNU sort命令详解

Normal 0 7.8 磅 0 2 false false false MicrosoftInternetExplorer4 <!-- /* Font

2008-12-05 14:09:00 1329 1

原创 sed命令学习笔记

Normal 0 7.8 磅 0 2 false false false MicrosoftInternetExplorer4 <!-- /* Font

2008-11-29 18:50:00 1669

Integrating.and.Extending.BIRT (Second Edition)

Eclipse BIRT主站上推荐的两本权威书籍有两本:1.BIRT: A Field Guide to Reporting 2.Integrating and Extending BIRT 第一本是BIRT报表开发的基本介绍,第二本将如何集成与扩展BIRT应用。这是第二本书的2008第二版

2009-05-11

BIRT:A Field Guide to Report (Second Edition)

BIRT(Business Intelligence and Reporting Tools)是一个基于Eclipse的开源的报表工具。它的核心是由著名的报表供应商Actuate(安讯)公司贡献。 BIRT主要是用在基于Java与J2EE的Web应用程序上,同时可以与PHP很好地整合,是基于J2EE与LAMP开发框架下的报表工具的很好的选择。BIRT主要由两部分组成:一个是基于Eclipse的报表设计器和一个可以加到你应用服务器的运行时组件。BIRT同时也提供了一个强大图形报表制作引擎。 BIRT不仅是一个产品,也是一个基于Eclipse的报表框架,因此具有良好的可扩展性。它提供了三种API(Report Engine API, Design Engine API, Charting API)供用户使用。 这本书是Eclipse BIRT主站上推荐的两本权威书籍之一的2008年第二版。

2009-05-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除