- 博客(50)
- 资源 (2)
- 收藏
- 关注
原创 C++ 多线程拷贝文件(demo)
多线程拷贝文件#include <stdio.h>#include <pthread.h>#include <dirent.h>#include <string.h>#include <stdlib.h>#include <iostream>#include <fstream>#include <iterator>#include <string>#include <vector>u
2015-08-11 15:23:35 2717
原创 C++沉思录 第八章 面向对象程序范例
c++沉思录第八章的示例程序很有意思。程序虽小,却很好地诠释了面向对象编程的思想。 正如书上说的仔细研究还是有所收获的。先上代码codeExpr_node.h#pragma once#include "Expr.h"#include<string>using namespace std;//Expr_node 基类class Expr_node { friend class Expr
2015-08-05 16:51:03 892
原创 机器学习-Kaggle竞赛-Titanic
1912.04.15 泰坦尼克号沉没,成为人类历史上重大海难事件之一。 …… 没有足够的救生船,以及部分船没有载满就离开了。导致了大量的游客遇难。 根据幸存者的信息,试图寻找哪些人更容易逃生~~信息解读train.csv test.csv 首先下载2个数据文件。 PassengerId//游客id Survived//1幸存 Pclass//1 2 3 表示社会地位
2015-07-18 11:55:30 1602
原创 机器学习-Kaggle竞赛-Digit recognizer
第一次接触Kaggle比赛。从练习区开始~~~ 做了一个最简单的手写数字识别练习(Digit Recognizer)。 尝试了用KNN,bayes,Logistic Regression。 首页拿到练习数据,digit-recognizer-data 下载train.csv test.csv文件 train.csv train.csv里面是42000*785的数据 每一行代表一个图
2015-07-04 10:16:24 2913
原创 Linux下安装scikit-learn numpy scipy
scikit-learnScikit-Learn是基于python的机器学习模块,其安装依赖numpy scipy等模块。 官方文档介绍有如下依赖: Scikit-learn requires: Python (>= 2.6 or >= 3.3), NumPy (>= 1.6.1), SciPy (>= 0.9). 之前写过一篇linux下安装 numpy sci
2015-05-30 16:24:06 8256
原创 Go语言 安装、Notepad++配置Go 开发环境
安装Go以window7 环境为例:下载go语言安装包https://golang.org/dl/ 选择go1.4.2.windows-386.msi 版本,直接点击安装。配置环境变量: 将C:\Go\bin,加入path环境变量中(默认貌似有了,就不需要加了)打开cmd,输入 go:显示如下就ok了。 配置Notepad++下Go开发环境为什么选择np++呢,是因为周围人反应go的IDE
2015-04-21 19:19:01 2142
原创 机器学习实战-PCA主成分分析、降维
降维技术很多时候,原始数据是多维度的,在计算的时候会带来很大的资源开销。而且数据本身有很多的冗余,我们可以去除一些不必要的特征,使得数据简化,降低算法的计算开销。因此需要利用降维技术来实现。PCA(Principal Component Analysis)主成分分析在PCA中,数据从原来的坐标系转化到新的坐标系中。当然这里新的坐标系也不是随便设定的,而是应该根据数据本身的特征来设计。通常第一个新坐标
2015-04-09 23:14:19 3323 1
原创 机器学习实战-朴素贝叶斯算法
朴素贝叶斯概述朴素贝叶斯也是一个强大的分类算法。其基本原理:假设现在有1,2,3,3种类别,现有一个数据a,其属于这个3种类别的概率分别为p1(a),p2(a),p3(a)p_1(a),p_2(a),p_3(a)。如果这3个概率中p1(a)p_1(a)最大,那么就把数据a归为1类。 这道理好简单啊,就算我们猜谜语也会猜一个可能性最大的嘛~~~ 果然很朴素啊,但是呢,这里还是有一个问题的,这里的3
2015-04-03 13:01:00 1608
原创 机器学习实战-决策树
决策树概述关于决策树的原理,网上有个有趣的比喻,这里直接搬过来吧。讲的是母亲给女儿介绍对象的对话。 女儿:多大岁数了? 母亲:26 女儿:帅么? 母亲:帅。 女儿:高么? 母亲:高。 女儿:有钱么? 母亲:有钱的。 女儿:好,那见个面吧。这个对话是yy的~~哈哈:D,这个对话的过程就像是一个决策树的过程,每一个问题就像是一个决策的节点。女儿根据这
2015-04-02 16:20:24 794
原创 机器学习实战-k近邻算法
1.k-近邻算法概念k-近邻算法主要原理:假设有一个样本集,并且知道数据的类别,对于一个新来的数据,通过计算新数据与已知样本集数据的距离,距离越近越相似。选出k个最相似的数据,在这k个数据中,出现最多的类别作为新数据的类别。2.code代码实现: 现有a,b类别的数据点 a1=(1,1),a2=(1,1.2),b1=(3,3),b2=(3,3.1)a_1=(1,1),a_2=(1,1
2015-03-31 16:30:08 619
原创 机器学习实战-Logistic回归
最近在看《机器学习实战》这本书。机器学习的算法总免不了一堆数学公式的推导,看起来还是比较晦涩难懂。看看网友的文章再自己翻翻高数的书本,尝试自己推导下,总算有点明白了,写下来再加深下理解。Logistic回归属于优化类的算法。Logistic回归的主要思想:根据现有的数据对分类边界线建立回归公式,达到分类的目的。假设我们有一堆数据,需要划一条线(最佳直线)对其分类,这就是Logistic回归的目的了。
2015-03-28 11:22:38 1541 2
原创 linux python 安装 nose lapack atlas numpy scipy
The first step of machine larning .环境配置:
2014-10-26 15:55:32 5622
转载 Hadoop MapReduce 性能调优:减小数据倾斜的性能损失
6.4.4 减小数据倾斜的性能损失数据倾斜是数据中的常见情况。数据中不可避免地会出现离群值(outlier),并导致数据倾斜。这些离群值会显著地拖慢MapReduce的执行。常见的数据倾斜有以下几类:数据频率倾斜——某一个区域的数据量要远远大于其他区域。数据大小倾斜——部分记录的大小远远大于平均值。在map端和reduce端都有可能发生数据倾斜。在map端的数据倾斜会让多样
2014-06-05 20:08:57 1587
转载 Github for Windows使用图文教程
Git已经变得非常流行,连Codeplex现在也已经主推Git。Github上更是充斥着各种高质量的开源项目,比如ruby on rails,cocos2d等等。对于习惯Windows图形界面的程序员来讲,Github的使用是需要点时间和耐心的,然而最近Github发布了Github for Windows 则大大降低了学习成本和使用难度,他甚至比SVN都简单,好吧,你不信,我们来一步一步
2014-04-22 15:27:56 734
转载 Hadoop学习资料、博客及网站汇总
Hadoop官方的中文文档http://hadoop.apache.org/common/docs/r0.18.2/cn/index.html Hadoop学习资料 -- 这里面总结了很多的东西,值得一一细看http://cloud21.javaeye.com/blog/607175 关于Hadoop的两本书 -- 有电子书下载http://caibinbu
2014-04-18 12:26:20 612
原创 设计模式学习--工厂模式(C++)
工厂方法模式的意义是定义一个创建产品对象的工厂接口,将实际创建工作推迟到子类当中。核心工厂类不再负责产品的创建,这样核心类成为一个抽象工厂角色,仅负责具体工厂子类必须实现的接口,这样进一步抽象化的好处是使得工厂方法模式可以使系统在不修改具体工厂角色的情况下引进新的产品。代码:
2014-04-15 16:00:46 864
转载 Ubuntu安装Vmware Tools后hgfs无法看到共享文件的解决方法
1. 选择VMware Workstation程序菜单中Virtual Machine Settings-->Options-->shared folders,设置共享目录。 2. VM-->Install VMware Tools,准备安装工具包3. 在Ubuntu的桌面上会出现挂载的光盘,打开光盘,拷贝tar的包到/tmp目录下,解压缩,运行./Vmware-install.pl
2014-04-06 11:20:47 2823
转载 Hadoop 在关机重启后,namenode启动报错
Hadoop 在关机重启后,namenode启动报错:2011-10-21 05:22:20,504 INFO org.apache.hadoop.hdfs.server.common.Storage: Storage directory /tmp/hadoop-fzuir/dfs/name does not exist. 2011-10-21 05:22:20,506 ERROR or
2014-04-06 09:53:07 1804 1
原创 设计模式学习-Observer观察者模式
概念:定义对象间的一种一对多的依赖关系,当一个对象的状态发生改变时,所有依赖于它的对象都得到通知并被自动更新。Observer 观察者接口; Jack 观察者Jack Lucy 观察者LucyObservable 被观察者; Weather 被观察者对象;这里的Weathe
2014-04-03 16:10:52 706
原创 设计模式学习-Strategy策略模式
纸上得来终觉浅,看一遍没啥感觉。重新用C++写一遍有一点点感觉。记下来慢慢看,希望有更多感觉。。。1、类说明Duck 鸭子接口;RedHeadDuck鸭子种类之一,继承于DuckRubberDuck鸭子种类之一,继承于DuckFlyBehavior 飞行行为类,FlyWithWings 飞行行为之一,继承于FlyBehavior;FlyNoWay 飞
2014-04-03 13:27:48 653
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人