- 博客(14)
- 资源 (1)
- 收藏
- 关注
转载 C++中extern “C”含义深层探索
1.引言 C++语言的创建初衷是“a better C”,但是这并不意味着C++中类似C语言的全局变量和函数所采用的编译和连接方式与C语言完全相同。作为一种欲与C兼容的语言,C++保留了一部分过程式语言的特点(被世人称为“不彻底地面向对象”),因而它可以定义不属于任何类的全局变量和函数。但是,C++毕竟是一种面向对象的程序设计语言,为了支持函数的重载,C++对全局函数的处理方式与C有明显
2012-03-29 18:13:26 837
转载 access(判断是否具有存取文件的权限)
access(判断是否具有存取文件的权限)相关函数 stat,open,chmod,chown,setuid,setgid表头文件 #include定义函数 int access(const char * pathname,int mode);函数说明 access()会检查是否可以读/写某一已存在的文件。参数mode有几种情况组合, R_OK,W_OK,X_OK
2012-03-22 13:32:24 929
转载 C/C++中判断某一文件或目录是否存在
C/C++中判断某一文件或目录是否存在 1.C++很简单的一种办法:#include iostream>#include fstream>using namespace std;#define FILENAME "stat.dat"int main(){ fstream _file; _file.open(FILENAME,i
2012-03-22 12:56:38 1174
转载 linux stat函数讲解
表头文件: #include #include 定义函数: int stat(const char *file_name, struct stat *buf);函数说明: 通过文件名filename获取文件信息,并保存在buf所指的结构体stat中返回值: 执行成功则返回0,失败返回-1,错误代码存于errno错误代码:
2012-03-22 12:55:29 1075
转载 linux 判断目录是否存在并创建
1 用 int access(const char *pathname, int mode); 判断有没有此文件或目录 --它区别不出这是文件还是目录2 用 int stat(const char *file_name, struct stat *buf); 判断该文件或目录是否否存在 ;得到st_mode,然后判断是不是目录文件
2012-03-22 10:11:33 22230
转载 online random forest
传统的SVM和adaboost都是batch mode learning. 所谓的batch mode learning, 简单说,就是所有的训练数据都是available的(或则说所有训练数据都已经在内存中)。这种方法主要有2个缺点:1) 有时候数据量太大,在内存中放不下,处理起来不方便2) 由于应用环境限制,有时候无法在训练之前得到所有训练数据而Online lea
2012-03-16 13:03:05 2270
转载 Gradient Boost Decision Tree(模型测试报告)
Treelink模型测试报告1. 什么是Treelink Treelink是阿里集团内部的叫法,其学术上的名称是GBDT(Gradient Boosting Decision Tree,梯度提升决策树)。GBDT是“模型组合+决策树”相关算法的两个基本形式中的一个,另外一个是随机森林(Random Forest),相较于GBDT要简单一些。
2012-03-16 11:52:25 5930
转载 独立成分分析(Independent Component Analysis)
独立成分分析(Independent Component Analysis)1. 问题: 1、上节提到的PCA是一种数据降维的方法,但是只对符合高斯分布的样本点比较有效,那么对于其他分布的样本,有没有主元分解的方法呢? 2、经典的鸡尾酒宴会问题(cocktail party problem)。假设在party中有n个人,他们可以同时说话,我们也在房间
2012-03-14 17:24:16 44360 5
转载 线性判别分析(Linear Discriminant Analysis)
线性判别分析(Linear Discriminant Analysis)1. 问题 之前我们讨论的PCA、ICA也好,对样本数据来言,可以是没有类别标签y的。回想我们做回归时,如果特征太多,那么会产生不相关特征引入、过度拟合等问题。我们可以使用PCA来降维,但PCA没有将类别标签考虑进去,属于无监督的。 比如回到上次提出的文档中含有“learn”和“st
2012-03-14 17:16:58 37892 3
转载 matlb 文本处理
在Matlab中,我们经常遇到需要将一些中间数据或者最终结果保存为文本形式(*.txt);其中提供了多种保存数据的语句,应该如何选择喃?在此,小弟在使用了fprintf、save、dlmwrite的基础上,对这三种方法进行了一个比较: fprintf(fid, format, A, ...),将数据A以format表示的格式写入fid(文件)中,fid由fopen函数返回得到。
2012-03-14 11:09:38 2743
转载 决策树模型组合之随机森林与GBDT
机器学习中的算法(1)-决策树模型组合之随机森林与GBDT版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com前言: 决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快速,模型容易展示(容易将得到的决策树做成图片展示出来)等。但是同时,单决策树又有一些不好的地
2012-03-11 19:35:31 2728
转载 机器学习中的数学(3)-模型组合(Model Combining)之Boosting与Gradient Boosting
机器学习中的数学(3)-模型组合(Model Combining)之Boosting与Gradient Boosting版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com前言: 本来上一章的结尾提到,准备写写线性分类的问题,文章都已经写得差不多了,但是突然听说最近Team准备做一套分布式的分
2012-03-11 19:25:39 906
转载 C5.0算法学习
C5.0算法学习 C5.0是决策树模型中的算法,79年由J R Quinlan发展,并提出了ID3算法,主要针对离散型属性数据,其后又不断的改进,形成C4.5,它在ID3基础上增加了队连续属性的离散化。C5.0是C4.5应用于大数据集上的分类算法,主要在执行效率和内存使用方面进行了改进。C4.5算法是ID3算法的修订版,采用GainRatio来加以改进方
2012-03-11 17:32:29 6408 1
转载 释放Linux操作系统文件缓存
释放Linux操作系统文件缓存 http://pthread.blog.163.com/blog/static/1693081782011111402639863/自从工作了,再也没有更新过这个技术博客。一来工作了没什么好写的,二来确实也挺忙。最近稍微有点空闲,先开一个写一点吧。记得在公司做新人习题的时候,题目是通过网络和本地分别读取一个约12G的大文
2012-03-04 20:19:47 2758
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人