自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

魏同学不会讲故事

不能说のsecret

  • 博客(76)
  • 资源 (1)
  • 收藏
  • 关注

转载 (传送门)Logistic regression (逻辑回归) 概述

http://hi.baidu.com/hehehehello/item/40025c33d7d9b7b9633aff87

2014-04-13 16:24:32 938

原创 使用C++机器学习库 mlpack

最近有几个程序需要用到机器学习,第一次接触,感觉还是很有用的!看了一部分斯坦福的公开课,又了解了一些线性回归和逻辑回归的基本知识,准备利用这两个利器解决一下手头的问题。首先是环境配置,由于最近使用c++,就搜索了一些c++的机器学习类库,然后就决定用mlpack。开始打算在win下使用,就像boost一样编译然后用codeblocks调用,可是,发现这个类库还依赖于其他几个类库,自身对

2014-04-13 14:00:51 5756

原创 主定理与递归树计算算法时间复杂度

主定理如下定义:例如归并排序中,a=b=2,f(n)=n,T(n)=2T(n/2)+n,那么,满足第二种情况,则T(n)=O(nlogn)。对于递归方程T(n)=aT(n/b+f(n)的求解,可以使用递归树,用归并排序为例:每一节点中都将当前的自由项n留在其中,而将两个递归项T(n/2) + T(n/2)分别摊给了他的两个子节点,如此循环。图中所有节点之和为:n

2014-03-18 09:01:09 4270

转载 g++和gcc的比较 与参数分析

gcc和g++都是GNU(一个组织)的编译器。1、对于.c后缀的文件,gcc把它当做是C程序;g++当做是C++程序;2、对于.cpp后缀的文件,gcc和g++都会当做c++程序。3、编译阶段,g++会调用gcc(也就是说);4、连接阶段,通常会用g++来完成,这是因为gcc命令不能自动和c++程序使用的库连接。 gcc可以用来编译c++但是它不会自动调用链接的c++库,你需要

2014-03-09 19:30:37 945

转载 shell中的more命令

more在查看文件内容时很常用。有同学问我,使用more怎样到文件尾,怎样从文件尾开始查看。这些类似的技巧可能大家不怎么关注,的确有时也很有必要。现做个简单的总结。more基本使用类似 cat ,不过会以一页一页的显示方便使用者逐页阅读,而最基本的指令就是按空白键(space)就往下一页显示,按 b 键就会往回(back)一页显示,而且还有搜寻字串的功能(与 vi 相似),使用中使用帮助按

2014-03-09 19:25:21 2979

转载 为什么你不当程序员了

曾经,程序设计竞赛是「聪明人的游戏」。当同龄人还在纠结物理数学的时候,我们已经在二进制的世界里徜徉遨游。DFS\BFS\神奇的递归\优美的动态规划,计算机的世界令我们惊叹。图论、数论、计算几何等数学领域的优美定律也令人陶醉。我们左手掌握着数学,右手拿着计算机的工具,一边吃着巧克力,一边在键盘上健步如飞,攻克了一个又一个难题;如今,程序员被戏称为码农。的确,程序员不再是高智商高学历的代名词。

2014-02-25 20:03:11 1026

转载 jdk与openjdk的区别

使用过LINUX的人都应该知道,在大多数LINUX发行版本里,内置或者通过软件源安装JDK的话,都是安装的openjdk,那么到底什么是openjdk,它与sun jdk有什么关系和区别呢?历史上的原因是,openjdk是jdk的开放原始码版本,以GPL协议的形式放出。在JDK7的时候,openjdk已经成为jdk7的主干开 发,sun jdk7是在openjdk7的基础上发布的,其大部分

2014-02-25 16:24:19 986

原创 C++ primer plus 学习笔记

2014.2.81、使用cout输出一个字符串,或者用strlen获取一个字符串的长度,都是找到该地址开始后面的第一个’\0’为止,对于普通的字符数组,甚至其他类型的数组,是不能使用该方法进行操作的。总之,如果给cout提供一个字符的地址,则它将从该字符开始打印,直到遇到空字符为止。 2、一定要在对指针使用解除引用运算符(*)之前,将指针初始化为一个确定的、适当的地址。int *

2014-02-19 16:21:58 1085

原创 C++参数传递指导原则(何时使用引用参数)

摘自C++ primer plus。使用引用参数的两个主要原因是:1)程序员能够修改调用函数中的数据对象。2)通过传递引用而不是整个数据对象,可以提高程序的运行速度。参数传递的指导原则:对于使用传递的值而不做修改的函数:1)如果数据对象很小,如内置数据类型或小型结构,则按值传递。2)如果数据对象是数组,则使用指针,因为这是唯一的选择,并将指针声明为const的指

2014-02-19 16:09:29 1230

转载 探寻C++最快的读取文件的方案

在竞赛中,遇到大数据时,往往读文件成了程序运行速度的瓶颈,需要更快的读取方式。相信几乎所有的C++学习者都在cin机器缓慢的速度上栽过跟头,于是从此以后发誓不用cin读数据。还有人说Pascal的read语句的速度是C/C++中scanf比不上的,C++选手只能干着急。难道C++真的低Pascal一等吗?答案是不言而喻的。一个进阶的方法是把数据一下子读进来,然后再转化字符串,这种方法传说中很不错,

2014-01-19 19:58:48 784

原创 windows下使用boost库并集成到codeblocks中

最近的工作需要使用,所以接触到了boost这个库,但是在编译使用的过程中遇到了一些麻烦,最后在网上搜索方法才解决。感谢博文http://www.cnblogs.com/wondering/archive/2009/05/21/boost_setup.html首先是下载boost,这个不用多说,感觉挺大的,下载完毕后解压缩,需要一些时间。。。我的版本是boost_1_55_0。

2014-01-18 20:09:44 1965

转载 strtok()函数

strtok()这个函数大家都应该碰到过,但好像总有些问题, 这里着重讲下它首先看下MSDN上的解释:char *strtok( char *strToken, const char *strDelimit );ParametersstrTokenString containing token or tokens.strDelimitSet of delimiter c

2014-01-15 18:29:38 1034

转载 STL map与Boost unordered_map

今天看到 boost::unordered_map, 它与 stl::map的区别就是,stl::map是按照operator而boost::unordered_map是计算元素的Hash值,根据Hash值判断元素是否相同。所以,对unordered_map进行遍历,结果是无序的。 用法的区别就是,stl::map 的key需要定义operator 最后,说

2014-01-14 09:54:32 826

转载 Latent semantic analysis (LSA)

1 LSA IntroductionLSA(latent semantic analysis)潜在语义分析,也被称为LSI(latent semantic index),是Scott Deerwester, Susan T. Dumais等人在1990年提出来的一种新的索引和检索方法。该方法和传统向量空间模型(vector space model)一样使用向量来表示词(terms)和文

2014-01-09 15:15:50 1343

转载 SVD奇异值分解

SVD分解SVD分解是LSA的数学基础,本文是我的LSA学习笔记的一部分,之所以单独拿出来,是因为SVD可以说是LSA的基础,要理解LSA必须了解SVD,因此将LSA笔记的SVD一节单独作为一篇文章。本节讨论SVD分解相关数学问题,一个分为3个部分,第一部分讨论线性代数中的一些基础知识,第二部分讨论SVD矩阵分解,第三部分讨论低阶近似。本节讨论的矩阵都是实数矩阵。基础知识1

2014-01-09 15:14:24 1594

原创 cdsn的code使用方法

详细介绍cdsn的code使用方法

2013-12-25 23:47:21 3514 7

原创 Trie的实现

近期实现的一个数据结构,当做学习C++ 的小练习吧,零基础真的很痛苦。(介绍内容为摘抄http://blog.csdn.net/nash_/article/details/8227610)Trie树(又叫字典树,前缀树,单词查找树,键树)是一种树形数据结构Trie树的特点:根节点为空值,剩下每一个节点保存一个字母。知道这些就够了!我们再来看看这棵树能干什么?如果从根

2013-12-24 15:05:01 1021

转载 C++中 struct和class的关系

从语法上,在C++中(只讨论C++中)。class和struct做类型定义时只有两点区别:  (一)默认继承权限。如果不明确指定,来自class的继承按照private继承处理,来自struct的继承按照public继承处理;  (二)成员的默认访问权限。class的成员默认是private权限,struct默认是public权限。  除了这两点,class和struct基

2013-12-23 23:08:49 847

转载 C++引用与指针的关系

(1)引用总是指向一个对象,没有所谓的 null reference .所有当有可能指向一个对象也由可能不指向对象则必须使用 指针. 由于C++ 要求 reference 总是指向一个对象所以 reference要求有初值. String & rs = string1; 由于没有所谓的 null reference 所以所以在使用前不需要进行测试其是否有值.,而使用指针则需

2013-12-23 23:07:37 868

转载 Hadoop添加删除节点

添加节点1.修改host   和普通的datanode一样。添加namenode的ip 2.修改namenode的配置文件conf/slaves   添加新增节点的ip或host 3.在新节点的机器上,启动服务 [root@slave-004 hadoop]# ./bin/hadoop-daemon.sh start datanode[root@slave

2013-06-02 13:03:36 924

原创 hadoop运行程序是出现java heap space

最近使用hadoop分布式缓存处理数据,经常出现java heap溢出,google了一下,问题解决:方法1:修改hadoop环境配置文件conf/hadoop-env.sh,加入下面两行:export HADOOP_HEAPSIZE=2000export HADOOP_CLIENT_OPTS="-Xmx1024m $HADOOP_CLIENT_OPTS"方法2:以上方法是对所有程

2013-05-29 18:36:11 2265

原创 HDFS文件操作命令

Hadoop使用的是HDFS,能够实现的功能和我们使用的磁盘系统类似。并且支持通配符,如*。1.  查看文件列表查看hdfs中/user/admin/hdfs目录下的文件。a. 进入HADOOP_HOME目录。b. 执行sh bin/hadoop fs -ls /user/admin/hdfs查看hdfs中/user/admin/hdfs目录下的所有文件(包括子目录下的文件)。

2013-01-28 11:21:36 2497

转载 利用Sqoop把SqlServer数据库中的表导入导出到HDFS

为了能够和HDFS之外的数据存储库进行交互,MapReduce程序需要使用外部API来访问数据。Sqoop是一个开源的工具,它允许用户将数据从关系型数据库抽取到Hadoop中,用于进一步的处理。抽取出来的数据可以被Mapreduce程序使用。也可以被其他类似于Hive的工具使用。一旦形成分析结果,Sqoop便可以将这些结果导回数据库,以供其他客户端使用。Sqoop的安装从http://ar

2013-01-27 11:10:58 1613

原创 ubuntu输入了正确的用户名密码但是无法登录(环境变量设置错误所以不能登录系统)

输入用户名密码,用户名密码都是正确的,但是点击登录之后过了一会又回到先前登录界面。如果输入错误的密码就会嘟一声(提示密码错误)。解决方法:Ctrl+Alt+F1 输入用户名 密码因为环境变量设置错误所以不能登录系统,因此需要修改环境变量,这需要使用sudo获得超级用户权限,但是因为环境变量损坏,因此使用时要加上完整路径:输入如下格式:/usr/bin/sudo /usr/bin/vi

2013-01-24 09:21:38 3006

转载 Java中抽象类和接口的区别

在Java语言中, abstract class 和interface 是支持抽象类定义的两种机制。正是由于这两种机制的存在,才赋予了Java强大的 面向对象能力。abstract class和interface之间在对于抽象类定义的支持方面具有很大的相似性,甚至可以相互替换,因此很多开发者在进 行抽象类定义时对于abstract class和interface的选择显得比较随意。其实,两者之

2013-01-23 10:12:59 525

转载 struts2+SiteMesh学习笔记

1,定义装饰页面导入标签更复杂的页面还需要在页面中适当的位置添加如下标签。代表被装饰页面的title部分。可以看出装饰页面是整个应用的母板页,用上述三个标签定义了被装饰页面的各个部分的位置。2,我们将装饰页面统一放到decorators下,在WEB-INF下添加配置decorators.xml,内容如下

2012-12-01 12:03:30 750

转载 程序猿

1、栈和队列的区别是啥? 吃多了拉就是队列;吃多了吐就是栈  2、世界上最遥远的距离不是生与死,而是你亲手制造的BUG就在你眼前,你却怎么都找不到她。。。  3、《c++程序设计语言》比《c程序设计语言》厚了几倍。。。果然有了对象就麻烦很多。。。  4、怎么使用面向对象的方式变得富有?继承。  5、为什么程序员总是分不清万圣节和圣诞节?因为 Oct 31 == Dec 25。

2012-10-30 13:25:59 929

原创 不能说のsecret 8

要,要,柴科闹!           我       我叫你哥,是觉得你很吊   随意说你sb,说明关系很好低头闭口无言,懒得和你争吵话少表情呆滞,心情实在不好耳机不离耳朵,音乐将我迷倒平时交流不多,理解总归太少目标迷茫不清,心里多事烦躁少年各自努力,莫名无依无靠感情伤痕难愈,什么会是解药所谓独木无缘,无非就剩睡觉    IT牛人太多,全被短

2012-08-30 23:44:28 949

原创 不能说のsecret 7

一段混沌时期过去了,有些无奈,有些疯狂,有些欢喜,有些迷失,总之,它是过去了。之前的一段时间给新来的博士老师查资料,关于列车联网的,什么CTCS3,ETCS,CTC,TDCS,TDMS,TDCS,RSM-R等一系列新名词,还好也算努力的去做然后交工了,如果有这方面需要的,可以提供一些资料(只保证近期不会删除)。最近在看了老师给的一些资料,主要是hadoop权威指南,对这个平台,包括HDFS

2012-08-15 20:02:57 858

原创 HDFS学习随笔

1.流式数据访问HDFS的构建思想是这样的:一次写入,多次读取是最高效的访问模式。数据集通常有数据源生成或从数据源复制而来,接着长时间在此数据集上进行各类分析。每次分析都将设计数据集的大部分数据甚至全部,因此读取整个数据集的时间延迟比读取第一条数据的时间延迟更重要。2.关于时间延迟的数据访问要求低时间延迟数据访问的应用,例如几十毫秒的范围,不适合在HDFS上运行,记住,HDFS是为高数

2012-08-13 11:41:42 3176

原创 ubuntu解压压缩及打包命令大全

.tar解包:tar xvf FileName.tar打包:tar cvf FileName.tar DirName(注:tar是打包,不是压缩!)———————————————.gz解压1:gunzip FileName.gz解压2:gzip -d FileName.gz压缩:gzip FileName.tar.gz 和 .tgz解压:tar zxvf F

2012-08-11 15:17:50 2421

转载 ubuntu下更改eclipse提示框的背景颜色(原来为黑色)

eclipse提示框的背景颜色使用的是系统的提示框颜色配置,在windows下为黄色,但在Ubuntu下却是黑色,造成提示内容很难看清。在eclipse中我们是无法修改这个颜色的配置的,只能通过修改系统的颜色配置。在ubuntu11.10以前,我们是可以通过自定义系统外观来修改这一颜色的配置的,但自ubuntu11.10以后,就没有相关的操作界面了,只能通过修改配置文件的方式实现了。这个文

2012-08-09 18:25:19 1259

原创 ubuntu命令笔记

1.强制关闭程序首先使用top命令,查看运行的程序,找到需要强制关闭程序的PID,然后使用sudo kill +PID强制杀死进程。2ubuntu 下查看电脑配置 1). 查看cpu~$ cat /proc/cpuinfo2). 查看内存到使用~$ cat /proc/meminfo3). 硬盘分区$ cd /proc$ cat partitions4).

2012-08-09 16:59:23 567

转载 hadoop运行eclipse生成jar

配置好hadoop基于eclipse的允许环境后,项目右键->run on hadoop后,会在eclipse对应的workspace\.metadata\.plugins\org.apache.hadoop.eclipse下,自动生成jar文件,以及其他文件,包括Haoop的一些具体配置等。如何打包 将创建的Map/Reduce项目打包成jar包,很简单的事情,无需多

2012-08-08 16:48:08 1609

转载 eclipse快捷键

Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对

2012-08-07 10:38:38 553

原创 ubuntu搭建hadoop

搭建hadoop也有一段时间了,真是太没有效率了,小小的记录一下。我的OS是ubuntu11.04,hadoop版本是0.20.203.0,jdk是1.6.0_33。一共3台电脑:ip                               作用172.16.95.50           namenode,jobtracker172.16.95.51

2012-08-06 20:36:06 1551 1

原创 ubuntu使用锐捷认证MentoHUST上网

1.编辑IP地址、子网掩码、DNS是首要的一个步骤。2.下载安装mentohust:mentohust程序依赖于libpcap,所以系统中必须要有libpcap.so.0.8、libpcap.so.0.9、libpcap.so.1.0、libpcap.so.1.1中的一个,现在主流的发行版都满足这一条件建议Ubuntu用户使用deb包安装,Fedora用户使用rpm包安装,

2012-08-06 19:21:46 2784

转载 Hadoop-0.20.203.0通过Eclipse连接编程

对于Hadoop开发者来讲,通过JAVA API编程是进入Map-Reduce分布式开发的第一步。由于Eclipse本身并没有提供对MapReduce编程模式的支持,所以需要一些简单的步骤来实现。1. 安装Hadoop。本文的Hadoop是部署在虚拟机上的伪分布模式。相关软件环境如下:JDK: sun jdk1.6.0_30Hadoop:  hadoop-0.20.203.0L

2012-08-06 15:58:35 1126 1

原创 软件版本 Alpha Beta Express等含义

版本号:V(Version):即版本,通常用数字表示版本号。(如:EVEREST Ultimate v4.20.1188 Beta )Build:用数字或日期标示版本号的一种方式。(如:VeryCD eMule v0.48a Build 071112)SP:Service Pack,升级包。(如:Windows XP SP 2/Vista SP 1)开发阶段划分:α(Alpha

2012-08-05 10:38:34 1049

原创 VMware让ubuntu与win7共享文件

步骤1.安装vmtools for linux:选择VM >Reinstall VMware tools...(或者Install VMware tools...)之后虚拟机中ubuntu桌面出现VMware Tools的光盘符号在ubuntu里输入以下命令(使用root帐号)mkdir  /mnt/cdrommount /dev/cdrom /mnt/cdromcd

2012-08-04 00:30:19 683

(important)伯克利云计算白皮书(英文全)

(important)伯克利云计算白皮书(英文全),了解云计算必看的文章

2012-07-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除