自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(50)
  • 资源 (2)
  • 收藏
  • 关注

原创 C++ 多线程拷贝文件(demo)

多线程拷贝文件#include <stdio.h>#include <pthread.h>#include <dirent.h>#include <string.h>#include <stdlib.h>#include <iostream>#include <fstream>#include <iterator>#include <string>#include <vector>u

2015-08-11 15:23:35 2696

原创 C++沉思录 第八章 面向对象程序范例

c++沉思录第八章的示例程序很有意思。程序虽小,却很好地诠释了面向对象编程的思想。 正如书上说的仔细研究还是有所收获的。先上代码codeExpr_node.h#pragma once#include "Expr.h"#include<string>using namespace std;//Expr_node 基类class Expr_node { friend class Expr

2015-08-05 16:51:03 867

原创 机器学习-Kaggle竞赛-Titanic

1912.04.15 泰坦尼克号沉没,成为人类历史上重大海难事件之一。 …… 没有足够的救生船,以及部分船没有载满就离开了。导致了大量的游客遇难。 根据幸存者的信息,试图寻找哪些人更容易逃生~~信息解读train.csv test.csv 首先下载2个数据文件。 PassengerId//游客id Survived//1幸存 Pclass//1 2 3 表示社会地位

2015-07-18 11:55:30 1584

原创 机器学习-Kaggle竞赛-Digit recognizer

第一次接触Kaggle比赛。从练习区开始~~~ 做了一个最简单的手写数字识别练习(Digit Recognizer)。 尝试了用KNN,bayes,Logistic Regression。 首页拿到练习数据,digit-recognizer-data 下载train.csv test.csv文件 train.csv train.csv里面是42000*785的数据 每一行代表一个图

2015-07-04 10:16:24 2890

原创 Linux下安装scikit-learn numpy scipy

scikit-learnScikit-Learn是基于python的机器学习模块,其安装依赖numpy scipy等模块。 官方文档介绍有如下依赖: Scikit-learn requires: Python (>= 2.6 or >= 3.3), NumPy (>= 1.6.1), SciPy (>= 0.9). 之前写过一篇linux下安装 numpy sci

2015-05-30 16:24:06 8224

原创 Go语言 安装、Notepad++配置Go 开发环境

安装Go以window7 环境为例:下载go语言安装包https://golang.org/dl/ 选择go1.4.2.windows-386.msi 版本,直接点击安装。配置环境变量: 将C:\Go\bin,加入path环境变量中(默认貌似有了,就不需要加了)打开cmd,输入 go:显示如下就ok了。 配置Notepad++下Go开发环境为什么选择np++呢,是因为周围人反应go的IDE

2015-04-21 19:19:01 2065

原创 机器学习实战-PCA主成分分析、降维

降维技术很多时候,原始数据是多维度的,在计算的时候会带来很大的资源开销。而且数据本身有很多的冗余,我们可以去除一些不必要的特征,使得数据简化,降低算法的计算开销。因此需要利用降维技术来实现。PCA(Principal Component Analysis)主成分分析在PCA中,数据从原来的坐标系转化到新的坐标系中。当然这里新的坐标系也不是随便设定的,而是应该根据数据本身的特征来设计。通常第一个新坐标

2015-04-09 23:14:19 3268 1

原创 机器学习实战-朴素贝叶斯算法

朴素贝叶斯概述朴素贝叶斯也是一个强大的分类算法。其基本原理:假设现在有1,2,3,3种类别,现有一个数据a,其属于这个3种类别的概率分别为p1(a),p2(a),p3(a)p_1(a),p_2(a),p_3(a)。如果这3个概率中p1(a)p_1(a)最大,那么就把数据a归为1类。 这道理好简单啊,就算我们猜谜语也会猜一个可能性最大的嘛~~~ 果然很朴素啊,但是呢,这里还是有一个问题的,这里的3

2015-04-03 13:01:00 1568

原创 机器学习实战-决策树

决策树概述关于决策树的原理,网上有个有趣的比喻,这里直接搬过来吧。讲的是母亲给女儿介绍对象的对话。 女儿:多大岁数了? 母亲:26 女儿:帅么? 母亲:帅。 女儿:高么? 母亲:高。 女儿:有钱么? 母亲:有钱的。 女儿:好,那见个面吧。这个对话是yy的~~哈哈:D,这个对话的过程就像是一个决策树的过程,每一个问题就像是一个决策的节点。女儿根据这

2015-04-02 16:20:24 768

原创 机器学习实战-k近邻算法

1.k-近邻算法概念k-近邻算法主要原理:假设有一个样本集,并且知道数据的类别,对于一个新来的数据,通过计算新数据与已知样本集数据的距离,距离越近越相似。选出k个最相似的数据,在这k个数据中,出现最多的类别作为新数据的类别。2.code代码实现: 现有a,b类别的数据点 a1=(1,1),a2=(1,1.2),b1=(3,3),b2=(3,3.1)a_1=(1,1),a_2=(1,1

2015-03-31 16:30:08 599

原创 机器学习实战-Logistic回归

最近在看《机器学习实战》这本书。机器学习的算法总免不了一堆数学公式的推导,看起来还是比较晦涩难懂。看看网友的文章再自己翻翻高数的书本,尝试自己推导下,总算有点明白了,写下来再加深下理解。Logistic回归属于优化类的算法。Logistic回归的主要思想:根据现有的数据对分类边界线建立回归公式,达到分类的目的。假设我们有一堆数据,需要划一条线(最佳直线)对其分类,这就是Logistic回归的目的了。

2015-03-28 11:22:38 1516 2

原创 linux python 安装 nose lapack atlas numpy scipy

The first step of machine larning .环境配置:

2014-10-26 15:55:32 5580

原创 VS 2013 编译 自动更新文件版本号

编译自动生成文件版本号,bing

2014-10-11 13:58:26 3569

原创 c++ 正则表达式

c++ 实现字符串正则表达式匹配的几个demo.1.完全匹配

2014-10-11 13:47:05 726

原创 temp_log

1、vmware虚拟机的ubuntu系统下不重新分区而扩大磁盘容量

2014-08-17 12:46:47 987

转载 程序员技术练级攻略

每次都去酷壳看这篇文章,这次干脆转载过来。。。

2014-06-13 13:50:00 832

原创 Linux-多线程(Demo)

1、thread_create.c

2014-06-08 19:59:22 838

原创 hadoop面试题

zu

2014-06-05 20:39:09 886

转载 Hadoop MapReduce 性能调优:减小数据倾斜的性能损失

6.4.4 减小数据倾斜的性能损失数据倾斜是数据中的常见情况。数据中不可避免地会出现离群值(outlier),并导致数据倾斜。这些离群值会显著地拖慢MapReduce的执行。常见的数据倾斜有以下几类:数据频率倾斜——某一个区域的数据量要远远大于其他区域。数据大小倾斜——部分记录的大小远远大于平均值。在map端和reduce端都有可能发生数据倾斜。在map端的数据倾斜会让多样

2014-06-05 20:08:57 1569

原创 hadoop学习-海量日志分析(二) HBase

之前一篇文章介绍了使用MapReduce

2014-05-30 11:41:12 2423

原创 hadoop学习-Mapper和Reducer的输出类型

Mapper过程:MapperrEDUCE

2014-05-20 23:33:49 2803

原创 hadoop学习-Netflix电影推荐系统

1、推荐系统概述

2014-05-20 22:39:07 3167

原创 hadoop学习-海量日志分析(提取KPI指标)

1、Web日志分析从Web日志中,我们可以获取网站各类页面的PV值(yem)

2014-05-15 00:11:54 2112

原创 Unix-进程间通信

有名管道间通信read进程代码:

2014-05-06 20:19:19 634

原创 ubuntu编译安装vim7.4

安装vim的方法,有直接安装和shou'do

2014-04-29 00:42:29 2072 1

原创 hadoop学习--K-Means算法实现

本例子介绍使用hadoop做聚类分析。

2014-04-26 14:46:44 1888

转载 Github for Windows使用图文教程

Git已经变得非常流行,连Codeplex现在也已经主推Git。Github上更是充斥着各种高质量的开源项目,比如ruby on rails,cocos2d等等。对于习惯Windows图形界面的程序员来讲,Github的使用是需要点时间和耐心的,然而最近Github发布了Github for Windows 则大大降低了学习成本和使用难度,他甚至比SVN都简单,好吧,你不信,我们来一步一步

2014-04-22 15:27:56 726

转载 Hadoop学习资料、博客及网站汇总

Hadoop官方的中文文档http://hadoop.apache.org/common/docs/r0.18.2/cn/index.html Hadoop学习资料 -- 这里面总结了很多的东西,值得一一细看http://cloud21.javaeye.com/blog/607175 关于Hadoop的两本书 -- 有电子书下载http://caibinbu

2014-04-18 12:26:20 600

原创 hadoop学习--基于Hive的Hadoop日志分析

环境:

2014-04-18 00:15:43 3555 1

原创 Hadoop启动失败

晚上重启下hadoop,突然不能用了。

2014-04-17 22:37:23 1287

原创 设计模式学习--工厂模式(C++)

工厂方法模式的意义是定义一个创建产品对象的工厂接口,将实际创建工作推迟到子类当中。核心工厂类不再负责产品的创建,这样核心类成为一个抽象工厂角色,仅负责具体工厂子类必须实现的接口,这样进一步抽象化的好处是使得工厂方法模式可以使系统在不修改具体工厂角色的情况下引进新的产品。代码:

2014-04-15 16:00:46 849

原创 Hadoop学习--HBase与MapReduce的使用

HBase以表的形式存储数据,每个表由行和列组成,每个列属于一个特定的列zu

2014-04-13 18:30:48 1614

原创 hadoop学习-倒排索引

本例子来源于《hadoop-开启通向云计算的捷径》(liu)

2014-04-10 10:56:41 1437

原创 hadoop学习-stream-Top K记录

这是《hadoop实战》(陆嘉恒)第4.1

2014-04-07 23:44:35 1741

转载 Ubuntu安装Vmware Tools后hgfs无法看到共享文件的解决方法

1. 选择VMware Workstation程序菜单中Virtual Machine Settings-->Options-->shared folders,设置共享目录。  2. VM-->Install VMware Tools,准备安装工具包3. 在Ubuntu的桌面上会出现挂载的光盘,打开光盘,拷贝tar的包到/tmp目录下,解压缩,运行./Vmware-install.pl 

2014-04-06 11:20:47 2812

转载 Hadoop 在关机重启后,namenode启动报错

Hadoop 在关机重启后,namenode启动报错:2011-10-21 05:22:20,504 INFO org.apache.hadoop.hdfs.server.common.Storage: Storage directory /tmp/hadoop-fzuir/dfs/name does not exist.  2011-10-21 05:22:20,506 ERROR or

2014-04-06 09:53:07 1787 1

原创 hadoop学习-mahout-Bayes分类算法示例程序

最近在看《hadoop实战》(陆嘉恒),

2014-04-05 13:22:54 1790

原创 设计模式学习-Decorator装饰者模式

装饰模式,给一个对象额外添加新的功能。

2014-04-04 13:57:39 622

原创 设计模式学习-Observer观察者模式

概念:定义对象间的一种一对多的依赖关系,当一个对象的状态发生改变时,所有依赖于它的对象都得到通知并被自动更新。Observer       观察者接口;        Jack       观察者Jack        Lucy       观察者LucyObservable  被观察者;        Weather        被观察者对象;这里的Weathe

2014-04-03 16:10:52 690

原创 设计模式学习-Strategy策略模式

纸上得来终觉浅,看一遍没啥感觉。重新用C++写一遍有一点点感觉。记下来慢慢看,希望有更多感觉。。。1、类说明Duck 鸭子接口;RedHeadDuck鸭子种类之一,继承于DuckRubberDuck鸭子种类之一,继承于DuckFlyBehavior 飞行行为类,FlyWithWings 飞行行为之一,继承于FlyBehavior;FlyNoWay 飞

2014-04-03 13:27:48 643

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除