luoleicn的专栏

Development is a creative pursuit. Whilst many think of it as a purely technical challenge,

EM算法

EM算法 这里作为我的博客备份,因为markdown解析各家标准并不能做到完全一致,特别是针对一些数学公式,如有排版问题,请访问原文EM算法 获得更好的排版体验 最近的工作中要借鉴到EM的思想,把EM又重新整理了下,总结此文。基本原理我们观察到的样本集,有时候仅仅是最终反映出来结果,即可观测的...

2016-10-13 01:30:18

阅读数:1829

评论数:0

Proximal Algorithm 入门

Proximal Algorithm 入门 这里作为我的博客备份,因为markdown解析各家标准并不能做到完全一直,如有排版问题,请访问原文Proximal Algorithm 入门 正则化是机器学习方法实践中用于避免overfitting的主要方法,给优化目标加上基于L1、L2的正则项是常...

2016-09-27 00:38:33

阅读数:8444

评论数:0

博客准备搬家

发现新浪的app engine看上去搞得不错,我打算迁移过去试一试,在此期间这个博客和在新浪的新博客http://luoleicn.sinaapp.com/ 将同时更新,试用新浪一段时间看看再决定是否彻底放弃这个旧的:)

2011-08-03 13:21:26

阅读数:2612

评论数:0

Bias-Variance Tradeoff

统计学习中有一个重要概念叫做residual sum-of-squares:RSS看起来是一个非常合理的统计模型优化目标。但是考虑K-NN的例子,在最近邻的情况下(K=1),RSS=0,是不是KNN就是一个完美的模型了呢,显然不是KNN有很多明显的问题,比如对训练数据量的要求很大

2011-07-28 14:22:33

阅读数:13070

评论数:5

CRF++注释版

CRF++是非常流行的CRF实现,但是作者整个代码下来几乎没有任何注释(crfpp.h注释较好),我差不多花了一个周末的功夫读了他的代码,并写了一些注释,虽然注释写的不规范,我觉得加了这些注释,对于想快速了解CRF++实现的人来说,顺利了解CRF++的数据结构和核心算法还是很容易

2011-07-10 20:23:48

阅读数:7127

评论数:23

最大熵的两个证明

《A maximum entropy approach to natural language processing》这篇论文是最大熵的经典论文。但是这篇论文仍然没有把最大熵模型完全推导出来,有些地方还是直接给的结论,这里补充两个论文中没有给出证明的地方,1、p(y|x)的推导,2、最大熵全局唯一...

2011-06-08 18:34:00

阅读数:5346

评论数:2

牛顿法

平时经常看到牛顿法怎样怎样,一直不得要领,今天下午查了一下维基百科,写写我的认识,很多地方是直观理解,并没有严谨的证明。在我看来,牛顿法至少有两个应用方向,1、求方程的根,2、最优化。牛顿法涉及到方程求导,下面的讨论均是在连续可微的前提下讨论。 1、求解方程。并不是所有的方程都有求根公式,或者求根...

2011-06-05 17:11:00

阅读数:68751

评论数:33

开始MLFS项目

Machine Learning From Scratch项目的目的是通过一些应用场景,实现一些统计机器学习模型,主要目的还是个人的学习,是对模型的理解和熟悉,并不追求在某应用场景下的指标。我有这个想法已经有一段时间了,但一直也没能开始起来,这两天,先简单实现了一个隐马模型,算是作为开始吧。   ...

2011-06-05 14:05:00

阅读数:10013

评论数:2

SVN简介:enjoy时光机

<br /> 我们组要使用SVN共同维护,我写的一个说明文档,大家多指正:)<br />前言:<br />我是SVN初级玩家,只是结合SVN官方的文档以及网上的一点资料写的这个文档,目的是通过实际例子方便大家迅速掌握SVN,SVN官方文档很厚,而常用命令并不多,...

2011-05-17 22:03:00

阅读数:5333

评论数:1

马氏距离的几张截图

<br />这几张图太形象了,只好收藏了。来自:http://xgli0910.blog.163.com/blog/static/46962168201021932741868/<br /> <br /><br /> <br /><...

2011-04-14 21:31:00

阅读数:15850

评论数:1

在中国做唱片怎么赚钱

好久没更新,上来发发牢骚。前两天,看到一博同学人人状态上写的,某歌手刚出了新专辑,没两天某人渣音乐网站上就可以下载到MP3了,他不禁感叹在中国做唱片如何赚钱。我以为,他的理解大错特错了,有些事情是赚钱的,有些事情是赚吆喝的。在这片神奇的土地上,你指望着专心做好一件事情,是不可能“成功"的...

2011-04-14 13:56:00

阅读数:4049

评论数:2

看看微软语料里的特征都是些啥

<br /><br />来自:http://research.microsoft.com/en-us/projects/mslr/feature.aspx<br /> <br />Bing计算一个文档的相关性要用这么多维向量吗?太可怕了。。。<...

2011-02-28 20:44:00

阅读数:3856

评论数:0

Android,开源还是封闭?

<br />来源:http://www.ruanyifeng.com/blog/2010/02/open_android_or_not.html<br /> <br /><br />作者: 阮一峰<br />日期: 2010年2月 4日&...

2011-02-11 23:06:00

阅读数:2510

评论数:0

linux下sort对中文排序

<br />

2011-01-25 09:38:00

阅读数:10625

评论数:7

nutch无法下载中文文件的问题[解决]

nutch无法下载中文文件的问题比如:http://www.example.com/中文.pdfwireshark抓包后发现是其无法正确encode中文。解决办法修改src/java/org/apache/nutch/fetcher/Fetcher.java 加上编码功能附上Fetcher.jav...

2011-01-10 22:39:00

阅读数:3822

评论数:0

Java函数传递对象与C++传递引用

我听说过这么一句话,“Java函数传参都是传递引用。”,貌似还很流行。不知道是不是Java没有指针概念的缘故,总之如果你学过C++,那就要记住,Java对象在函数间的传递不同于C++概念中的传递引用,如果不懂C++,无视这篇blog。不想纠结于概念,看例子。Java代码:public class ...

2010-12-15 13:42:00

阅读数:4945

评论数:0

SQL优化一则

前两天同学一个个性化在线新闻程序,跑的慢了起来,我参与讨论了调优方案的设计,分析原因是数据库规模增长,而且每次访问数据库又要访问挺多次的。当然最后决定使用强力的memcache来做,但是中间考虑了的一个数据库优化例子很有趣,记录一下。我们想要获得一个类别的最新30条新闻,最直接的使用sql语句:m...

2010-11-12 17:00:00

阅读数:2501

评论数:0

GDB调试STL容器

<br />GDB中print方法并不能直接打印STL容器中保存的变量,其实只要http://www.yolinux.com/TUTORIALS/src/dbinit_stl_views-1.03.txt这个文件保存为~/.gdbinit  就可以使用它提供的方法方便调试容器<b...

2010-10-26 23:48:00

阅读数:14931

评论数:3

实时索引一点调研

感觉实时索引一直是一个很神奇的事情,出于兴趣爱好,看了一点Twitter和Google的资料,总结为一个ppt,个人理解,不一定正确 Realtime searchView more presentations from luoleicn.

2010-10-22 01:58:00

阅读数:2453

评论数:0

一个关于O(N*logN)耗时下限的理论

from:http://hxraid.javaeye.com/blog/646760 这里有一个疑问:是不是O(N*logN)是排序算法时间代价最好的极限呢? 当然不是,但是如果排序算法是基于"关键字比较"操作的,那么在最坏情况下确实能够到达的最好效果就是O(N*...

2010-10-14 15:08:00

阅读数:3435

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭