自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 收藏
  • 关注

转载 Linux操作系统下的多线程编程详细解析----条件变量

Linux操作系统下的多线程编程详细解析----条件变量 1.初始化条件变量pthread_cond_init#include int pthread_cond_init(pthread_cond_t *cv,const pthread_condattr_t *cattr);返回值:函数成功返回0;任何其他返回值都表示错误初始化一个条件变量。

2013-12-24 16:34:38 489

转载 Mongodb集群搭建的三种方式

http://blog.csdn.net/luonanqin/article/details/8497860Mongodb是时下流行的NoSql数据库,它的存储方式是文档式存储,并不是Key-Value形式。关于Mongodb的特点,这里就不多介绍了,大家可以去看看官方说明:http://docs.mongodb.org/manual/       今天主要来说说M

2013-12-02 19:57:09 590

转载 海量数据相似度计算之simhash和海明距离

转自:http://www.lanceyan.com/tech/arch/simhash_hamming_distance_similarity.html通过 采集系统 我们采集了大量文本数据,但是文本中有很多重复数据影响我们对于结果的分析。分析前我们需要对这些数据去除重复,如何选择和设计文本的去重算法?常见的有余弦夹角算法、欧式距离、Jaccard相似度、最长公共子串、编辑距离等。这些算

2013-10-23 19:31:54 966

转载 Ubuntu 12.04安装virtualbox失败解决

转自:http://blog.163.com/excellent_2008/blog/static/3076015620132294284308/Issue: Ubuntu 12.04安装Virtual box时error message包含:WARNING: The character device /dev/vboxdrv does not exist. Please i

2013-09-24 21:42:39 2015

原创 在Eclipse中导入hadoop

转自:http://blog.csdn.net/amaowolf/article/details/81268320. 准备(1)需要有gcc、autoconf、automake来编译安装google的protocol buffer(2)http://protobuf.googlecode.com/files/protobuf-2.4.1.tar.gz./configure

2013-06-08 14:05:46 533

转载 LIBSVM使用方法

原文来自:博客园(华夏35度)http://www.cnblogs.com/zhangchaoyang 作者:Orisun本文包含以下几个部分:支持向量机--SVM简介LibSVM的安装LibSVM的使用LibSVM参数调优Java版LibSVM库函数的调用SVM简介在进行下面的内容时我们认为你已经具备了数据挖掘的基础知识。SVM是新近出现的强大的数据挖掘工具,它在文本

2013-06-05 23:20:18 894

原创 c++ distance 给我挖了个坑

http://stackoverflow.com/questions/4217733/distance-calculation-error-in-cnamespace std中已经定义过distance函数,所以自己在定义的时候总是会出现异常。我的代码#include#includeusing namespace std;int main(){ int tmp=0; i

2013-04-13 16:17:33 1690

原创 MapReduce的调试方法

前几天写关于推荐的分布式实现,很难对MapReduce进行调试。最近查找了一些资料,有以下几种调试方法:1. 在eclipse中直接打log或者写System.out.print,然后在eclipse中运行,就能够看到控制台上有输出。2. 在eclipse中写好程序,打jar包,在hadoop上面运行,在mapred->local->userlogs->tasktracker中能够找到。

2013-04-04 21:53:56 572

转载 输入格式InputFormat

http://www.cnblogs.com/Dreama/articles/2195982.html

2013-03-23 10:30:45 767

原创 mahout Taste 代码分析, 可运行在hadoop上的分布式版本

1. 将itemid从long型装换成int型,然后找出最小的itemindex的值,具体可以看map和reduce的代码,这里不多写。下面是这个job的代码部分。前边的代码都是一些参数的配置,略过。/* * Job 1: itemid -> itemindex */ if (shouldRunNextPhase(parsedArgs, currentPhase

2013-03-20 20:55:46 977

转载 MapReduce:详解Shuffle过程

转自:http://langyu.iteye.com/blog/992916        Shuffle过程是MapReduce的核心,也被称为奇迹发生的地方。要想理解MapReduce, Shuffle是必须要了解的。我看过很多相关的资料,但每次看完都云里雾里的绕着,很难理清大致的逻辑,反而越搅越混。前段时间在做MapReduce job 性能调优的工作,需要深入代码研究MapRedu

2013-03-14 20:25:26 471

原创 log4j+slf4j log系统配置

开发一个系统,log日志系统应该是重要的一部分。今天学习了log4j+slf4j的log日志系统配置,集成在eclipse中。下面仔细讲解:1. 概念介绍:slf4j: SLF4J,即简单日志门面(Simple Logging Facade for Java),不是具体的日志解决方案,它只服务于各种各样的日志系统。按照官方的说法,SLF4J是一个用于日志系统的简单Facade,允许最终用户

2013-03-10 15:14:45 3259

原创 java IO

java IOjava IO 流封装InputStream, OutputStream, Reader, Writer是四个基类。前两个是字节流,以二进制方式读取。InputStreamReader, OutputStreamWriter能将字节流转化为字符流。http://www.importnew.com/1068.html

2013-03-07 19:37:34 484

转载 [转]MySQL 中文显示乱码

转载自:http://blog.csdn.net/acmain_chm/article/details/4174186最近关于中文显示乱码的贴子比较多,所以也做了个总结:可以参考一下杨涛涛版主的《各种乱码问题汇总》http://topic.csdn.net/u/20071124/08/3b7eae69-ed1d-4a77-8895-9930bf3601af.htmlMy

2013-03-07 16:04:08 470

原创 web.py 环境的配置以及一些basic knowledge

web.py是一个小巧灵活的基于python的web应用开发框架。相比于j2ee,效率要高很多,但是我这样的初学者来看,感觉功能上还是差前者很多。通过这篇博客简单介绍一下web.py, 并且以自己开发的一个例子的一部分作为实例来演示。一、web.py的安装web.py的安装方式也主要有两种,一种是源码安装,一种是采用easy_install的方式安装。我的系统是ubuntu12.04 64

2013-01-27 19:12:43 763

转载 python 数据库

参考web.py参考:http://bbs.blueidea.com/thread-2813296-1-1.html0.引入MySQLdb库import MySQLdb1.和数据库建立连接conn=MySQLdb.connect(host="localhost",user="root",passwd="sa",db="mytable")提供的connect方法用来和数据

2013-01-24 18:25:00 263

转载 程序员的练级之路

转自:http://coolshell.cn/articles/4990.html月光博客6月12日发表了《写给新手程序员的一封信》,翻译自《An open letter to those who want to start programming》,我的朋友(他在本站的id是Mailper)告诉我,他希望在酷壳上看到一篇更具操作性的文章。因为他也是喜欢编程和技术的家伙,于是,我让他把

2013-01-14 19:07:21 339

转载 Linux Shell programming

编程基础,转自http://wiki.ubuntu.org.cn/Shell%E7%BC%96%E7%A8%8B%E5%9F%BA%E7%A1%80$?可以判断当前语句是否执行成功。

2013-01-14 18:08:59 293

原创 Hadoop 简单集群搭建

搭建三个节点的Hadoop环境。理论上讲,Namenode 和JobTracker都是master节点,分布在不同的机器上。我们这里把两个java的进程放在同一台机器上。然后搭建两个slave机器,每个机器上都作为Datanode和TaskTracker.1. 准备:都需要安装Linux的发行版本,一台机器作为master节点,两外两个机器作为slave节点。修改3台机器的/etc

2012-12-27 14:04:00 476

原创 recommendation system overview

最近一周查找了一些推荐系统的资料,推荐系统已经是一个研究比较成熟,而且运用于商业中时间比较长的一个技术,但是在大数据时代,推荐技术变的更加重要。我只是把自己最近看到和学习到的一些知识放在这里,不一定正确,大家相互交流学习。1. overview & backgroundcontent-based filtering基于内容的推荐算法,不需要依据用户对对象的评价意见。对象使用通过特征提取

2012-12-18 20:34:45 1216 1

原创 KMP source code

先把代码记下来,以后有时间再把分析补上/* *String.h */class String{private: char * str; int size;public: String(char * str); int getsize(); char * getstr(); ~String(); void CptPfFunc(int * prefix); void

2012-12-15 22:28:37 319

原创 Career Cup: Map, 发帖水王

http://www.careercup.com/question?id=14099679Design an algorithm that, given a list of n elements in an array, finds all the elements that appear more than n/3 times in the list. The algorithm shoul

2012-12-11 23:23:29 316

原创 selection does not contain a main type

网上大多数地方给出了这样的答复:是因为.java文件不在项目的src路径内,也就是说源代码未被eclipse编译,字节码不存在无法运行了在项目名上右键 -> Builder Path -> Configure Build Path -> 选择Source面板 再点Add Folder, 把源代码所在的包路径的上层目录加进来,而且如果你是把两个类写在一个文件里的话,你在右键选择Run As

2012-12-08 21:24:18 520

原创 C++虚函数

1. 子类在构造时调用基类的构造函数#includeusing namespace std;class base{public: base() { cout<<"Base Constract"<<endl; } virtual void fun() { cout<<"Base call"<<endl; } virtual void anfun() { co

2012-12-04 13:11:28 182

原创 python 归档自己的桌面

import osimport timesource = r'C:\Users\zs\Desktop'target_dir = r'F:\backup'target = os.path.join(target_dir,time.strftime('%Y%m%d%H%M%S') + '.zip')zip_command = "zip -qrm %s %s" % (target, sour

2012-12-02 23:39:17 300

原创 MapReduce源码分析总结

转自:http://blog.csdn.net/heyutao007/article/details/5725379参考: 1 caibinbupt的源代码分析http://caibinbupt.javaeye.com2 coderplay的avaeye http://coderplay.javaeye.com/blog/295097http://coderplay.javae

2012-11-26 18:15:54 293

原创 python programming

1. client and serverserver:import socketHOST = ''PORT = 12235BUFSIZ = 1024ADDR = (HOST, PORT)tcpsersock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)tcpsersock.bind(ADDR)tcpsersock.

2012-11-21 17:23:38 334

原创 python 遍历文件

1. python遍历文件,使用os.walk()方法,这个方法能都遍历到所有文件。# traversal files and print the size of these files# how to use os.walk()import os,sysnum = 0targetdir = sys.argv[1]for root, dirs, files in os.walk(ta

2012-11-21 11:25:23 312

原创 python 读取文件

通过几个小例子学习了读取文件的相关内容1. 读取文件内容并统计该文本文件有多少行# read a filemyfile = file('1.txt', 'r')linenum = 0while True: line = myfile.readline() if len(line) == 0: break print line, l

2012-11-18 23:06:34 293

原创 first python program

import win32api,win32con,win32guiwin32api.MessageBox(0, 'You are my lover, please trust yourself, I will go with you~', "", win32con.MB_ICONINFORMATION)send to girlfriend. it is programmers' commu

2012-11-16 20:04:11 261

原创 python中的类数据成员和对象数据成员

相比于C++语言,每个类可以有类成员变量,也可以有对象的成员变量,类成员变量需要用static修饰;在python中,也有两种变量python中类成员变量是不用self修饰的,也就是说对象成员变量需要用self.来修饰,具体可以看代码。class person: population = 0 def __init__(self,name): self.

2012-11-14 18:02:02 4731

原创 basic knowledge in python (1)

1. 可以在while循环中使用一个else从句#!/usr/bin/python# Filename: while.pynumber = 23running = Truewhile running: guess = int(raw_input('Enter an integer : ')) if guess == number: print

2012-11-13 10:54:04 372

转载 Python基础

1.List和tuple的区别:    tuple只是大多数的list操作,如索引,切片和连结。关键的不同在于tuple在创建之后将不能修改内容,也不能添加新的元素。2.循环语句:1)for 循环    通过迭代一个序列,实现循环。和C语言中的for循环语法不同,但是也是给定了循环变量和循环的范围。这个氛围可能是给定的一个列表,字符串,元组,或者是一个range,xrange函数提

2012-11-05 14:51:34 233

原创 learn from Mobimsg

1. JTextArea的换行函数是setLineWrap(true),设置该函数即可实现换行的应用~2.http://www.isstudy.com/java/2005.html, 关于JComboBox的使用,详细的讲解了listener。对内容的管理可以用一个vector来进行管理,可以直接vector.add()函数就可以添加Item对选择内容的整理,可以用itemlisten

2012-10-24 16:27:08 244

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除