- 博客(5)
- 资源 (2)
- 问答 (1)
- 收藏
- 关注
转载 协方差的意义和计算公式
协方差的意义和计算公式学过概率统计的孩子都知道,统计里最基本的概念就是样本的均值,方差,或者再加个标准差。首先我们给你一个含有n个样本的集合,依次给出这些概念的公式描述,这些高中学过数学的孩子都应该知道吧,一带而过。很显然,均值描述的是样本集合的中间点,它告诉我们的信息是很有限的,而标准差给我们描述的则是样本集合的各个样本点到均值的距离之平均。以这两个集合为例,[0,8,1
2016-07-25 17:41:14 521
转载 从dmesg里分析core原因
服务器上由于怕软件bug以及磁盘的限制,一般会将core文件关掉.ulimit -a查看当前core file size设置.这样程序有bug崩溃以后,只能通过dmesg查看有限信息.典型信息如下:collector[1847]: segfault at 000000000000000c rip 000000000040308a rsp 0000007fbffff820 e
2016-07-14 14:55:56 849
转载 随机森林和GBDT的几个核心问题
GBDT和随机森林的相同点:1、都是由多棵树组成2、最终的结果都是由多棵树一起决定GBDT和随机森林的不同点:1、组成随机森林的树可以是分类树,也可以是回归树;而GBDT只由回归树组成2、组成随机森林的树可以并行生成;而GBDT只能是串行生成3、对于最终的输出结果而言,随机森林采用多数投票等;而GBDT则是将所有结果累加起来,或者
2016-07-11 10:02:35 9863
转载 从最大似然到EM算法浅解
从最大似然到EM算法浅解zouxy09@qq.comhttp://blog.csdn.net/zouxy09 机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题。神为什么是神,因为神能做很多人做不了的事。那么EM算法能解决什么问题呢?或者说EM算法是因为什
2016-07-05 10:27:50 604
转载 Relation Extraction中SVM分类样例unbalance data问题解决 -松弛变量与惩罚因子
1、问题描述做关系抽取就是要从产品评论中抽取出描述产品特征项的target短语以及修饰该target的opinion短语,在opinion mining里面属于很重要的task,很多DM、NLP相关的paper在做这方面的工作。基本的思路是:(1)从sentence的parse tree(比如stanford parser)中选取候选target结点和候选opinion结点,然后对
2016-07-01 17:39:10 1225
ML step by step
2017-09-21
python 正则表达式 findall和search的问题
2015-09-23
TA创建的收藏夹 TA关注的收藏夹
TA关注的人