Forsure
码龄16年
关注
提问 私信
  • 博客:95,660
    社区:179
    95,839
    总访问量
  • 14
    原创
  • 1,468,992
    排名
  • 11
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2008-11-11
博客简介:

北漂的蜗牛

博客描述:
互联网数据分析和数据挖掘
查看详细资料
个人成就
  • 获得4次点赞
  • 内容获得18次评论
  • 获得26次收藏
创作历程
  • 17篇
    2012年
  • 4篇
    2011年
  • 18篇
    2009年
TA的专栏
  • GIS开发
    2篇
  • Opencv学习
    4篇
  • VC++学习
    5篇
  • 我的私生活
    1篇
  • 计算机视觉
    5篇
  • 资源分享
    7篇
  • Linux系统学习
    3篇
  • 正则表达式
  • Python学习
    2篇
  • Java学习
  • HADOOP和HIVE
    11篇
  • 数据挖掘与推荐
    1篇
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

hbase伪分布式安装详解及错误分析

安装环境:centos6.0+jdk1.6.0_29+hadoop1.0.0+hbase0.90.4已经安装好centos6.0+jdk1.6.0_29+hadoop1.0.0环境1.到官方网站下载好hbase-0.90.4.tar.gz解压hbase安装包到一个可用目录(如:/opt)[html] view plaincopyprint?cd /opt
转载
发布博客 2012.05.16 ·
3451 阅读 ·
2 点赞 ·
0 评论 ·
4 收藏

Slope One个性化推荐算法核心思想

Slope One 推荐算法是 2005 年在香港的 WWW 会议上提出来的。可以Google检索会议论文集看原著,不过还是建议看原著之前,看完本文!Slope One是一个基于Item的个性化推荐算法,股票上有个说法是平均值可以掩盖一切异常波动,所以股票上的各个技术指标都是不同时间段的平均值的曲线图或者柱状图等。同样的,Slope one算法也认为:平均值也可以代替某两个未知个体之间的打分差
转载
发布博客 2012.05.15 ·
1325 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

HIVE中join、semi join、outer join举例详解

hive> select * from zz0; OK 111111 222222 888888 Time taken: 0.147 seconds hive> select * zz1; FAILED: Parse Error: line 0:-1 mismatched input '' expecting FROM in from clause hive
转载
发布博客 2012.05.14 ·
4849 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Python模块学习——re正则表达式模块

Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。Python 1.5之前版本则是通过 regex 模块提供 Emecs 风格的模式。Emacs 风格模式可读性稍差些,而且功能也不强,因此编写新代码时尽量不要再使用 regex 模块,当然偶尔你还是可能在老代码里发现其踪影。     就其本质而言,正则表达式(或 RE)是一种小型的、高度专业化的编程语言,
转载
发布博客 2012.05.08 ·
896 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Hive中实现自定义函数UDF详细过程

Hive的UDF,其实很类似Mysql之类的自定义函数不过它需要用java来编写,而不是用传统的SQL来完成实现一个UDF的步骤如下:实现一个Java Class,继承自UDF打成jar包,并加入到Hive的ClassPath中生成自定义函数,执行select删除刚才创建的临时函数下面这个UDF,是我给hive的array增加的一个函数用来判断array中是
转载
发布博客 2012.05.07 ·
1841 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

hadoop hive sql(HQL)语法解释

DDL Operations创建表hive> CREATE TABLE pokes (foo INT, bar STRING); 创建表并创建索引字段dshive> CREATE TABLE invites (foo INT, bar STRING) PARTITIONED BY (ds STRING); 显示所有表hive> SHOW TABLES;按正条件(正则表达
转载
发布博客 2012.05.07 ·
2394 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

举例详解Hive UDAF开发

Hive进行UDAF开发,相对要比UDF复杂一些,不过也不是很难。请看一个例子package org.hrj.hive.udf;import org.apache.hadoop.hive.ql.exec.UDAFEvaluator;import org.apache.hadoop.hive.serde2.io.DoubleWritable;publi
转载
发布博客 2012.05.07 ·
1334 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Hive UDF实现分析函数row_number

Oracle的分析函数row_number是十分有用的功能,但是將ETL迁移到Hive中发现没有的功能,我们实现了一个UDF实现了该函数,代码如下:JAVA代码:package org.nalang.hive.udf;import org.apache.hadoop.hive.ql.exec.UDF;public class RowNumber extends UDF {
转载
发布博客 2012.05.07 ·
2913 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

Hive UDF实现函数MD5

Hive提供了User Defined Functions的开发接口以给使用者扩展。上手比较简单,下面是开发使用一个MD5的例子。JAVA代码:package org.nalang.hive.udf;import java.io.UnsupportedEncodingException;import java.security.MessageDigest;import java
转载
发布博客 2012.05.07 ·
10685 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Hive中UDF和UDAF详细介绍和使用

一、UDF1、背景:Hive是基于Hadoop中的MapReduce,提供HQL查询的数据仓库。Hive是一个很开放的系统,很多内容都支持用户定制,包括:a)文件格式:Text File,Sequence Fileb)内存中的数据格式: Java Integer/String, Hadoop IntWritable/Textc)用户提供的 map/reduce 脚本:不管什么语
转载
发布博客 2012.05.07 ·
1539 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Hive 的扩展特性—自定义脚本、UDF和UDAF介绍

Hive 是一个很开放的系统,很多内容都支持用户定制,包括:文件格式:Text File,Sequence File内存中的数据格式: Java Integer/String, Hadoop IntWritable/Text用户提供的 map/reduce 脚本:不管什么语言,利用 stdin/stdout 传输数据用户自定义函数: Substr, Trim, 1 – 1
转载
发布博客 2012.05.07 ·
1183 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

如何使用Python为Hadoop编写一个简单的MapReduce程序

转载自:http://asfr.blogbus.com/logs/44208067.html          在这个实例中,我将会向大家介绍如何使用Python 为 Hadoop编写一个简单的MapReduce程序。尽管Hadoop 框架是使用Java编写的但是我们仍然需要使用像C++、Python等语言来实现Hadoop程序。尽管Hadoop官方网站给的示例程序是使用Jytho
转载
发布博客 2012.05.07 ·
2187 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

自动编译并运行mapreduce程序的脚本

为了方便大家编写mapreduce程序,我特地编写了一个脚本,可以直接通过他编译并运行mapreduce程序,用bash awk编写的。使用方法如下1.cd hadoop/  到hadoop的目录下2.如果是第一次使用脚本,需要新建playground目录,及子目录src。(详细步骤:mkdir playground/  mkdir  playground/src)3.然后将代
转载
发布博客 2012.05.07 ·
1206 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

快速了解的链接 shell sed awk

如果想快速简单的了解shell 编程,这里也给个简单的教程链接:http://www.ooblick.com/text/sh/  还有深入一点的cu shell版镇板之宝经典十三问http://bbs2.chinaunix.net/thread-218853-1-1.html如果想快速了解awk,而没有时间阅读那个长长的e文的manual,请看下文。如果想好好学习awk,这里还有本
转载
发布博客 2012.04.23 ·
865 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Crontab使用和Cronjob简介

以下为转贴 Cron 是UNIX, SOLARIS,LINUX下的一个十分有用的工具。通过Cron脚本能使计划任务定期地在系统后台自动运行。这种计划任务在UNIX, SOLARIS, LINUX下术语为cron jobs。 Crontab (CRON 表)则是用来记录在特定时间运行的CRON的一个脚本文件。Crontab归结为以下几点特性:1.      Crontab约束2.
转载
发布博客 2012.04.23 ·
3562 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Python完全新手教程【经典】

Lesson 1 准备好学习Python的环境下载的地址是:www.python.org为了大家的方便,我在校内作了copy:http://10.1.204.2/tool/compiler&IDE/Python-2.3.2-1.exelinux版本的我就不说了,因为如果你能够使用linux并安装好说明你可以一切自己搞定的。运行环境可以是linux或者是windows:
转载
发布博客 2012.04.23 ·
1138 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

为Ubuntu server配置ssh服务 方便远程登陆

Ubuntu系统必须开启ssh服务后,XP或者其他的主机才可以远程登陆到Ubuntu系统。1,安装软件包,执行sudo apt-get install openssh-serverUbuntu缺省安装了openssh-client,如果你的系统没有安装的话,再用apt-get install openssh-client安装上即可。2,然后确认sshserver是否启动,执
转载
发布博客 2012.04.23 ·
1240 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

教你用OpenCV将视频转存为图片序列

在做实验的时候我们经常得到的是监控视频,可是程序中要用到的是视频的图片序列或部分图片,这时就需要将用OpenCV将视频转存为图片序列。源代码如下,已经在VC++2008和OpenCV2.1下调试通过。// avi2img.cpp : 定义控制台应用程序的入口点。//#include "stdafx.h"using namespace std;int main(int argc, _TCHAR* argv[]){ char * filename = "D://video//1.avi";    int n =
原创
发布博客 2011.05.16 ·
1997 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

教你获取图片文件夹中所有图片的绝对路径列表

在做视频图像方向的时候,经常要连续读取图像序列,那么首先就要获得整个序列图像文件夹中所有的图像文件列表,列表中每一行就是一个图片的绝对路径,这样我们可以直接在程序中通过读取该列表每一行就可以得到序列图片了,那么怎么获取呢,其实很简单,利用系统自带的dos命令行。
原创
发布博客 2011.05.12 ·
3288 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

【图】dos命令之Dir中文详解及实例应用2


dos命令之Dir详解及实例应用(2)
例1、       如果想列出C盘根目录下的目录和文件列表,在命令行输入cd /回车输入dir如下图 



例2、    如果想显示该以C盘下的所有系统或隐藏的子目录及文件,在命令行中输入dir/a如下图


       看到区别了吗?在不使用参数A的情况下只显示了5个目录5个文件,在使用参数a却能显示出12个文件,及6个目录可见参数a的作用是显示具有特殊属性的文件。<b
转载
发布博客 2011.05.12 ·
2726 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏
加载更多