自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 C++ 多线程拷贝文件(demo)

多线程拷贝文件#include <stdio.h> #include <pthread.h> #include <dirent.h> #include <string.h> #include <stdlib.h>#include <...

2015-08-11 15:23:35

阅读数 1604

评论数 0

原创 C++沉思录 第八章 面向对象程序范例

c++沉思录第八章的示例程序很有意思。程序虽小,却很好地诠释了面向对象编程的思想。 正如书上说的仔细研究还是有所收获的。先上代码codeExpr_node.h#pragma once #include "Expr.h" #include<string>using ...

2015-08-05 16:51:03

阅读数 562

评论数 0

原创 机器学习-Kaggle竞赛-Titanic

1912.04.15 泰坦尼克号沉没,成为人类历史上重大海难事件之一。 …… 没有足够的救生船,以及部分船没有载满就离开了。导致了大量的游客遇难。 根据幸存者的信息,试图寻找哪些人更容易逃生~~信息解读train.csv test.csv 首先下载2个数据文件。 Passenge...

2015-07-18 11:55:30

阅读数 1168

评论数 0

原创 机器学习-Kaggle竞赛-Digit recognizer

第一次接触Kaggle比赛。从练习区开始~~~ 做了一个最简单的手写数字识别练习(Digit Recognizer)。 尝试了用KNN,bayes,Logistic Regression。 首页拿到练习数据,digit-recognizer-data 下载train.csv test....

2015-07-04 10:16:24

阅读数 2260

评论数 0

原创 Linux下安装scikit-learn numpy scipy

scikit-learnScikit-Learn是基于python的机器学习模块,其安装依赖numpy scipy等模块。 官方文档介绍有如下依赖: Scikit-learn requires: Python (>= 2.6 or >= 3.3), NumPy...

2015-05-30 16:24:06

阅读数 7517

评论数 0

原创 Go语言 安装、Notepad++配置Go 开发环境

安装Go以window7 环境为例: 下载go语言安装包https://golang.org/dl/ 选择go1.4.2.windows-386.msi 版本,直接点击安装。 配置环境变量: 将C:\Go\bin,加入path环境变量中(默认貌似有了,就不需要加了) 打开cmd,输入 go:显...

2015-04-21 19:19:01

阅读数 1443

评论数 0

原创 机器学习实战-PCA主成分分析、降维

降维技术很多时候,原始数据是多维度的,在计算的时候会带来很大的资源开销。而且数据本身有很多的冗余,我们可以去除一些不必要的特征,使得数据简化,降低算法的计算开销。因此需要利用降维技术来实现。PCA(Principal Component Analysis)主成分分析在PCA中,数据从原来的坐标系转...

2015-04-09 23:14:19

阅读数 2070

评论数 1

原创 机器学习实战-朴素贝叶斯算法

朴素贝叶斯概述朴素贝叶斯也是一个强大的分类算法。其基本原理:假设现在有1,2,3,3种类别,现有一个数据a,其属于这个3种类别的概率分别为p1(a),p2(a),p3(a)p_1(a),p_2(a),p_3(a)。如果这3个概率中p1(a)p_1(a)最大,那么就把数据a归为1类。 这道理好简单...

2015-04-03 13:01:00

阅读数 1318

评论数 0

原创 机器学习实战-决策树

决策树概述关于决策树的原理,网上有个有趣的比喻,这里直接搬过来吧。讲的是母亲给女儿介绍对象的对话。 女儿:多大岁数了? 母亲:26 女儿:帅么? 母亲:帅。 女儿:高么? 母亲:高。 女儿:有钱么? 母亲:有钱的。 女儿:好,那见个面吧。 这个对...

2015-04-02 16:20:24

阅读数 613

评论数 0

原创 机器学习实战-k近邻算法

1.k-近邻算法概念k-近邻算法主要原理:假设有一个样本集,并且知道数据的类别,对于一个新来的数据,通过计算新数据与已知样本集数据的距离,距离越近越相似。选出k个最相似的数据,在这k个数据中,出现最多的类别作为新数据的类别。2.code代码实现: 现有a,b类别的数据点 a1=(1...

2015-03-31 16:30:08

阅读数 497

评论数 0

原创 机器学习实战-Logistic回归

最近在看《机器学习实战》这本书。机器学习的算法总免不了一堆数学公式的推导,看起来还是比较晦涩难懂。看看网友的文章再自己翻翻高数的书本,尝试自己推导下,总算有点明白了,写下来再加深下理解。Logistic回归属于优化类的算法。Logistic回归的主要思想:根据现有的数据对分类边界线建立回归公式,达...

2015-03-28 11:22:38

阅读数 1331

评论数 2

原创 linux python 安装 nose lapack atlas numpy scipy

The first step of machine larning . 环境配置:

2014-10-26 15:55:32

阅读数 5050

评论数 0

原创 VS 2013 编译 自动更新文件版本号

编译自动生成文件版本号,bing

2014-10-11 13:58:26

阅读数 2551

评论数 0

原创 c++ 正则表达式

c++ 实现字符串正则表达式匹配的几个demo. 1.完全匹配

2014-10-11 13:47:05

阅读数 593

评论数 0

原创 temp_log

1、 vmware虚拟机的ubuntu系统下不重新分区而扩大磁盘容量

2014-08-17 12:46:47

阅读数 577

评论数 0

转载 程序员技术练级攻略

每次都去酷壳看这篇文章,这次干脆转载过来。。。

2014-06-13 13:50:00

阅读数 708

评论数 0

原创 Linux-多线程(Demo)

1、thread_create.c

2014-06-08 19:59:22

阅读数 597

评论数 0

原创 hadoop面试题

zu

2014-06-05 20:39:09

阅读数 773

评论数 0

转载 Hadoop MapReduce 性能调优:减小数据倾斜的性能损失

6.4.4 减小数据倾斜的性能损失 数据倾斜是数据中的常见情况。数据中不可避免地会出现离群值(outlier),并导致数据倾斜。这些离群值会显著地拖慢MapReduce的执行。常见的数据倾斜有以下几类: 数据频率倾斜——某一个区域的数据量要远远大于其他区域。数据大小倾斜——部分记录的大...

2014-06-05 20:08:57

阅读数 1425

评论数 0

原创 hadoop学习-海量日志分析(二) HBase

之前一篇文章介绍了使用MapReduce

2014-05-30 11:41:12

阅读数 1921

评论数 0

原创 hadoop学习-Mapper和Reducer的输出类型

Mapper过程:Mapper rEDUCE

2014-05-20 23:33:49

阅读数 2166

评论数 0

原创 hadoop学习-Netflix电影推荐系统

1、推荐系统概述

2014-05-20 22:39:07

阅读数 1531

评论数 0

原创 hadoop学习-海量日志分析(提取KPI指标)

1、Web日志分析 从Web日志中,我们可以获取网站各类页面的PV值(yem)

2014-05-15 00:11:54

阅读数 1560

评论数 0

原创 Unix-进程间通信

有名管道间通信 read进程代码:

2014-05-06 20:19:19

阅读数 532

评论数 0

原创 ubuntu编译安装vim7.4

安装vim的方法,有直接安装和shou'do

2014-04-29 00:42:29

阅读数 1866

评论数 1

原创 hadoop学习--K-Means算法实现

本例子介绍使用hadoop做聚类分析。

2014-04-26 14:46:44

阅读数 1117

评论数 0

转载 Github for Windows使用图文教程

Git已经变得非常流行,连Codeplex现在也已经主推Git。Github上更是充斥着各种高质量的开源项目,比如ruby on rails,cocos2d等等。 对于习惯Windows图形界面的程序员来讲,Github的使用是需要点时间和耐心的,然而最近Github发布了Github fo...

2014-04-22 15:27:56

阅读数 619

评论数 0

转载 Hadoop学习资料、博客及网站汇总

Hadoop官方的中文文档 http://hadoop.apache.org/common/docs/r0.18.2/cn/index.html   Hadoop学习资料 -- 这里面总结了很多的东西,值得一一细看 http://cloud21.javaeye.com/blog...

2014-04-18 12:26:20

阅读数 525

评论数 0

原创 hadoop学习--基于Hive的Hadoop日志分析

环境:

2014-04-18 00:15:43

阅读数 2905

评论数 1

原创 Hadoop启动失败

晚上重启下hadoop,突然不能用了。

2014-04-17 22:37:23

阅读数 851

评论数 0

原创 设计模式学习--工厂模式(C++)

工厂方法模式的意义是定义一个创建产品对象的工厂接口,将实际创建工作推迟到子类当中。核心工厂类不再负责产品的创建,这样核心类成为一个抽象工厂角色,仅负责具体工厂子类必须实现的接口,这样进一步抽象化的好处是使得工厂方法模式可以使系统在不修改具体工厂角色的情况下引进新的产品。 代码:

2014-04-15 16:00:46

阅读数 737

评论数 0

原创 Hadoop学习--HBase与MapReduce的使用

HBase以表的形式存储数据,每个表由行和列组成,每个列属于一个特定的列zu

2014-04-13 18:30:48

阅读数 1242

评论数 0

原创 hadoop学习-倒排索引

本例子来源于《hadoop-开启通向云计算的捷径》(liu)

2014-04-10 10:56:41

阅读数 1183

评论数 0

原创 hadoop学习-stream-Top K记录

这是《hadoop实战》(陆嘉恒)第4.1

2014-04-07 23:44:35

阅读数 1270

评论数 0

转载 Ubuntu安装Vmware Tools后hgfs无法看到共享文件的解决方法

1. 选择VMware Workstation程序菜单中Virtual Machine Settings-->Options-->shared folders,设置共享目录。   2. VM-->Install VMware Tools,准备安装工具包 3. 在Ubuntu的...

2014-04-06 11:20:47

阅读数 2508

评论数 0

转载 Hadoop 在关机重启后,namenode启动报错

Hadoop 在关机重启后,namenode启动报错: 2011-10-21 05:22:20,504 INFO org.apache.hadoop.hdfs.server.common.Storage: Storage directory /tmp/hadoop-fzuir/dfs/nam...

2014-04-06 09:53:07

阅读数 1298

评论数 1

原创 hadoop学习-mahout-Bayes分类算法示例程序

最近在看《hadoop实战》(陆嘉恒),

2014-04-05 13:22:54

阅读数 1567

评论数 0

原创 设计模式学习-Decorator装饰者模式

装饰模式,给一个对象额外添加新的功能。

2014-04-04 13:57:39

阅读数 526

评论数 0

原创 设计模式学习-Observer观察者模式

概念:定义对象间的一种一对多的依赖关系,当一个对象的状态发生改变时,所有依赖于它的对象都得到通知并被自动更新。 Observer       观察者接口;         Jack       观察者Jack         Lucy       观察者Lucy Observable  被观察者...

2014-04-03 16:10:52

阅读数 590

评论数 0

原创 设计模式学习-Strategy策略模式

纸上得来终觉浅,看一遍没啥感觉。重新用C++写一遍有一点点感觉。记下来慢慢看,希望有更多感觉。。。 1、类说明 Duck 鸭子接口; RedHeadDuck鸭子种类之一,继承于Duck RubberDuck鸭子种类之一,继承于Duck FlyBehavior 飞行行为类, FlyWithW...

2014-04-03 13:27:48

阅读数 546

评论数 0

提示
确定要删除当前文章?
取消 删除