- 博客(141)
- 资源 (13)
- 问答 (2)
- 收藏
- 关注
原创 ubuntu12.04连接服务器的时候出现错误“terminate called after throwing an instance of 'std::runtime_error' what(”
如题:出现的错误如下:terminate called after throwing an instance of 'std::runtime_error' what(): locale::facet::_S_create_c_locale name not valid
2014-11-03 17:44:59 20395
原创 ubuntu12.04 安装 adobe reader
只需三条命令:sudo apt-add-repository "deb http://archive.canonical.com/ $(lsb_release -sc) partner"sudo apt-get updatesudo apt-get install acroread
2014-11-03 09:14:27 783
原创 ubuntu 12.04 LTS 出现Could not initialize the package information
更新Ubuntu12.04时,出现如下错误:An unresolvable problem occurred while initializing the package information.Please report this bug against the 'update-manager' package and include the following error
2014-10-30 09:26:48 1394
转载 特征选择之二:信息增益
前文提到过,除了开方检验(CHI)以外,信息增益(IG,Information Gain)也是很有效的特征选择方法。但凡是特征选择,总是在将特征的重要程度量化之后再进行选择,而如何量化特征的重要性,就成了各种方法间最大的不同。开方检验中使用特征与类别间的关联性来进行这个量化,关联性越强,特征得分越高,该特征越应该被保留。 在信息增益中,重要性的衡量标准就是看特征能够为分类系统带来多少信息,带
2014-10-24 10:00:04 950
转载 特征选择之一:卡方选择
前文提到过,除了分类算法以外,为分类文本作处理的特征提取算法也对最终效果有巨大影响,而特征提取算法又分为特征选择和特征抽取两大类,其中特征选择算法有互信息,文档频率,信息增益,开方检验等等十数种,这次先介绍特征选择算法中效果比较好的开方检验方法。 大家应该还记得,开方检验其实是数理统计中一种常用的检验两个变量独立性的方法。(什么?你是文史类专业的学生,没有学过数理统计?那你做什么文本分类?在
2014-10-24 09:55:44 1436
原创 ubuntu 12.04 下交互式使用matplotlib
要开始一个交互式matplotlib会话,首先通过 –pylab选项启动IPython(增强的交互式Python shell),就像在shell提示行下一样,输入如下命令行:ipython –pylab这将启动IPython,加载matplotlib和NumPy,并将两者导入全局命名空间。我们的想法是,给出类似于Matlab的集图形、数字及矩阵操作于一体的交互式体验。
2014-10-23 10:59:27 1126
转载 ubuntu12.04 LTS 安装 JDK 7
PPA安装:sudo add-apt-repository ppa:webupd8team/javasudo apt-get updatesudo apt-get install oracle-java7-installer千万不要用 否则会报错安装不了 sudo add-apt-repository ppa:eugenesan/java如果已经用了可以:sudo rm
2014-10-23 08:52:28 832
转载 图像处理中不适定问题
图像处理中不适定问题(ill posed problem)或称为反问题(inverse Problem)的研究从20世纪末成为国际上的热点问题,成为现代数学家、计算机视觉和图像处理学者广为关注的研究领域。数学和物理上的反问题的研究由来已久,法国数学家阿达马早在19世纪就提出了不适定问题的概念:称一个数学物理定解问题的解存在、唯一并且稳定的则称该问题是适定的(Well Posed).如果不满足适定性
2014-10-22 17:42:59 6974
原创 ubuntu 12.04 上遇到的 “GPG 由于没有公钥,无法验证 ”
W: GPG 错误:http://www.remastersys.com oneiric Release: 由于没有公钥,无法验证下列签名: NO_PUBKEY B6068D255563B350取后八位sudo apt-key adv --recv-keys --keyserver keyserver.Ubuntu.com 5563B350
2014-10-17 10:18:43 1225
转载 Deformable Part Model中mex文件在windows下运行的修改方法
最近做的两个实验中,都需要对在linux下编写的mex程序进行修改使得能够在windows平台下编译。其一:deformable part model的源码http://www.cs.brown.edu/~pff/latent/其二:使用HOG特征进行templateMatching的小demo,使用了上述源码中的resize,以及feature提取和convolution
2014-10-12 15:46:51 1125
转载 ubuntu文本界面包安装工具aptitude 使用参考和一些特别功效
aptitude 与 apt-get 一样,是 Debian 及其衍生系统***能极其强大的包管理工具。与 apt-get 不同的是,aptitude 在处理依赖问题上更佳一些。举例来说,aptitude 在删除一个包时,会同时删除本身所依赖的包。这样,系统中不会残留无用的包,整个系统更为干净。Aptitude 最适用于非图形的终端环境,确保命令关键字的适当功能。您可以作为一个普遍用户在终
2014-10-11 11:23:53 1416
原创 解决经常碰到的libjpeg.so.62和 libtiff.so.3找不到的问题
建立软链接。在/usr/lib/i386-linux-gnu/目录下有两个libjpeg文件,一个是libjpeg.so.8,另一个是libjpeg.so.8.0.2。
2014-10-11 10:16:58 12872
转载 一切为了SVM
SVM原理 入门(1-10):(1-3)简介+线性分类器 http://www.blogjava.net/zhenandaci/archive/2009/02/13/254519.html (4) 线性分类器的求解 http://www.blogjava.net/zhenandaci/archive/2009/02/13/254578.html (
2014-10-09 11:31:34 1572
转载 Pearson(皮尔逊)相关系数[ Pearson product-moment correlation coefficient; PPMCC或PCCs]
欧几里德距离欧几里得度量定义欧几里得空间中点 x = (x1,...,xn) 和 y = (y1,...,yn) 之间的距离为但是当评价结果中,评价者的评价相对于平均水平偏离很大的时候欧几里德距离不能很好的揭示出真实的相似度.还有一种评价方法就是使用皮尔逊相关系数,它可以完成"夸大值纠偏":相关系数:考察两个事物(在数据里我们称之为变量)之间
2014-10-08 09:17:32 8024
转载 SVM相关资源汇总[matlab-libsvm-class-regress](by faruto)
SVM相关资源汇总[matlab-libsvm-class-regress](by faruto) ----关于SVM的那点破事 by faruto 可以了,终于可以完结了!这帖子我编辑过n次,不断的往里面添加东西,我想今晚可能是我最后一次编辑这个帖子.在这个帖子里面您
2014-09-23 17:24:12 2488
原创 LIBSVM-3.18在python环境下的使用
1)从python官网上下载windows下的安装包python-2.7.3.msi并安装2)打开IDLE(python GUI),输入>>>import sys>>>sys.version如果你的python是32位,将出现如下字符:‘2.7.3 (default, Apr 10 2012, 23:31:26) [MSC v.1500 32 bit (Intel)]’这个
2014-09-23 16:34:43 7949
转载 SVM学习笔记(1)LIBSVM在matlab下的使用安装
1) 从LIBSVM的官网http://www.csie.ntu.edu.tw/~cjlin/libsvm/上下载最新版本的LIBSVM,当前版本为libsvm-3.16.zip2) 解压压缩包到电脑上一位置,如:C:\Program Files\libsvm-3.163) 假设你使用的是64位的操作系统和matlab。此时将libsvm-3.16文件夹下的windows目录添加到
2014-09-23 15:30:04 1289
转载 关于SSH secury shell中R编程绘图图像显示问题
最近一段时间在捣鼓如何在连接Linux系统的SSH securyshell中R编程的问题,今天总算是有了些眉目,就写写这过程中容易出现的问题和解决办法。在Linux环境下安装R软件包和R中package的安装已经有很多软件介绍了,这里就不再做介绍。下面主要介绍如何在SSH中打开X11绘图设备的问题。 刚开始安装好R后,如果想绘图(比如利用plot()函数)就会没有任何结果出来。输入命令de
2014-09-19 22:16:05 3891
原创 ubuntu 一些常用操作 (复制,删除...)
复制:1)复制压缩文件:cp 原地址 目的地址2)复制文件夹:cp -r 原地址 目的地址删除
2014-09-19 11:13:10 1141
原创 centos 6.5 python 2.6.6 update python 2.7.5 (Only centos 6.5 64bit)
centos 是自带python的。但是版本稍微旧一些。搞python开发,肯定要用新一点的稳定版。所以,要升级一下python。先去python主站下载python的源码包:Python-2.7.5.tar.bz2()安装:tar jxvf Python-2.7.5.tar.bz2cd Python-2.7.5./configuremakemake install
2014-09-18 21:15:20 1889
原创 centos 出现”Error mounting: mount:unknown filesystem type 'ntfs'“
如题 probelm:解决
2014-09-18 20:43:39 11186
原创 ASV格式文件
asv 就是auto save的意思,*.asv文件的内容和相应的*.m文件内容一样,用记事本和matlab都能打开它。它可以作为*.m文件的“备份”。
2014-09-17 20:36:01 4732
转载 关于数学学习,推荐一篇好文(博士生必读)
近一直有师弟师妹和朋友问我数学和研究的关系,研一要去学什么数学课。毕竟在清华,衡量一个研究生最重要的指标之一就是paper,而没有数学,是肯定上不了世界顶级的期刊和会议的,这在计算机学界尤其重要!你会发现,不论哪个领域有价值的东西,都一定离不开数学!在这样一个信息时代,当google已经让世界没有秘密的时候,一种卓越的数学思维,绝对可以成为你的核心竞争力. 无奈本人实在见地有限,且生活慵
2014-09-10 11:53:42 1026
转载 金融大数据创新
什么是大数据“大数据”是“数据化”趋势下的必然产物!数据化最核心的理念是:“一切都被记录,一切都被数字化”。在数据化浪潮的推动下,最近2年所产生的数据量等同于2010年以前整个人类文明产生的数据量总和。我们自己是数据化舞台上当仁不让的主角。艺术家哈桑.伊拉希因为不满安全局对他的监视,干脆在网站www.trackingtransience.net上面记录了他所有到过地方的位置和数万张他所到之
2014-08-24 22:50:30 1802
转载 机器学习中的范数规则化 (L0、L1、L2和核范数)
监督机器学习问题无非就是“minimizeyour error while regularizing your parameters”,也就是在规则化参数的同时最小化误差。最小化误差是为了让我们的模型拟合我们的训练数据,而规则化参数是防止我们的模型过分拟合我们的训练数据。多么简约的哲学啊!因为参数太多,会导致我们的模型复杂度上升,容易过拟合,也就是我们的训练误差会很小。但训练误差小并不是我们的最终
2014-08-24 22:22:23 14553 4
转载 人与人最大差别在思维
无数事例告诉我们,思维方式决定了一个人的命运和前途,今天我们就来看看消极的人和积极的人他们的思维方式有何不同?一、对金钱的思维方式二、看待问题的角度三、理财的方式四、对待人生的选择
2014-08-19 10:51:23 1041
原创 [R记录]
在用Plot画图过程中,出现了这么一个错误:错误于plot.new() : figure margins too large,提示图片边界太大,以至于图片显示不出。
2014-08-01 09:28:37 832
转载 Nature:精神分裂症背后的基因突变
导读:一个国际研究团队通过对数千名精神分裂症患者进行基因测序,发现多个基因的累积效应对精神疾病有影响,有关这项研究的两篇文章发表在本周的《自然》杂志上。日前,一个国际研究团队发现基因突变同精神分裂症之间的关系,有关这项研究的两篇文章发表在本周的《自然》杂志上。这两项研究中,其中一项是通过2500例精神分裂症患者和2500名健康志愿者的基因序列,另一项研究是对超过600名精神分裂症者
2014-07-14 17:19:27 1350
原创 R语言读取spss/sav数据集方法
一、# 导入spss的sav格式数据则要用到foreign扩展包,加载后直接用read.spss读取sav文件library(foreign)mydata=read.spss('d:/test.sav')# 上面的函数在很多情况下没能将sav文件中的附加信息导进来,例如数据的label,# 那么建议用Hmisc扩展包的spss.get函数,效果会更好一些。library(Hmi
2014-07-10 20:36:56 29327
转载 机器学习常见算法分类汇总
机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里 IT 经理网为您总结一下常见的机器学习算法,以供您在工作和学习中参考。 机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的类似性。 学习方式
2014-07-10 09:41:38 949
原创 又一次见证了HTML5的强大
以下是旧金山大学的David Galles教授用HTML5+js制作的数据结构动画课件中算法动画比较部分。教授利用JS+HTML5 Canvas技术分别演示了6中数学排序算法的基本原理,即介绍了数学知识,又让这种教学变得饶有兴趣。你可以看出HTML5技术将会在各个方法起到越来越重要的作用。
2014-07-10 09:36:00 742
转载 VCF (Variant Call Format) version 4.1
Please note the specification is now being maintained in github at https://github.com/samtools/hts-specs0. ExampleVCF is a text file format (most likely stored in a compressed manner). It co
2014-07-02 19:00:40 7162
转载 生物信息——连锁不平衡 Linkage Disequilibrium
不同基因座位的各等位基因在人群中以一定的频率出现。在某一群体中,不同座位某两个等位基因出现在同一条染色体上的频率高于预期的随机频率的现象,称连锁不平衡 (linkage disequilibrium) 由于 HLA 不同基因座位的某些等位基因经常连锁在一起遗传,而连锁的基因并非完全随机地组成单体型,有些基因总是较多地在一起出现,致使某些单体型在群体中呈现较高的频率,从而引起连锁不平衡。
2014-06-16 22:34:21 1629
转载 [Shogun] A large scale machine learning toolbox
A comparison of shogun with the popular machine learning toolboxes weka, kernlab, dlib, nieme, orange, java-ml, pyML, mlpy, pybrain, torch3, scikit-learn. A '?' denotes unkown, '-' feature is missing.
2014-05-22 14:29:24 1506
原创 ubuntu中使用sudo apt-get install 安装之后的软件,怎么看安装在哪里
如题:有两种方式:1)dpkg -L pcmanfm
2014-05-09 15:43:58 30767
转载 全基因组关联分析(GWAS)
全基因组关联分析是一种在人类或动植物全基因组中寻找变异序列的方法,全英文名为Genome-wide association study,缩写名为GWAS。 2005年,Science杂志报道了第一篇GWAS研究——年龄相关性黄斑变性,之后陆续出现了有关冠心病、肥胖、2型糖尿病、甘油三酯、精神分裂症等的研究报道。截至2010年底,单是在人类上就有1212篇GWAS文章被发表,涉及210个性状。GWA
2014-05-05 10:02:05 31419
TA创建的收藏夹 TA关注的收藏夹
TA关注的人