- 博客(19)
- 资源 (4)
- 收藏
- 关注
原创 LDA-线性判别分析(四)其他几个相关问题
本来是要调研 Latent Dirichlet Allocation 的那个 LDA 的, 没想到查到很多关于 Linear Discriminant Analysis 这个 LDA 的资料。初步看了看,觉得数学味挺浓,一时引起了很大的兴趣;再看看,就有整理一份资料的冲动了。网上查到的相关文章大都写得不是很详细,而且在概念和记号等方面也比较混乱,因此,在整理本文时,我有意识地牵了一根主线,想让读者
2013-09-26 10:48:35 3736
原创 LDA-线性判别分析(三)推广到 Multi-classes 情形
本来是要调研 Latent Dirichlet Allocation 的那个 LDA 的, 没想到查到很多关于 Linear Discriminant Analysis 这个 LDA 的资料。初步看了看,觉得数学味挺浓,一时引起了很大的兴趣;再看看,就有整理一份资料的冲动了。网上查到的相关文章大都写得不是很详细,而且在概念和记号等方面也比较混乱,因此,在整理本文时,我有意识地牵了一根主线,想让读者
2013-09-26 10:48:27 7188 3
原创 LDA-线性判别分析(二)Two-classes 情形的数学推导
本来是要调研 Latent Dirichlet Allocation 的那个 LDA 的, 没想到查到很多关于 Linear Discriminant Analysis 这个 LDA 的资料。初步看了看,觉得数学味挺浓,一时引起了很大的兴趣;再看看,就有整理一份资料的冲动了。网上查到的相关文章大都写得不是很详细,而且在概念和记号等方面也比较混乱,因此,在整理本文时,我有意识地牵了一根主线,想让读者
2013-09-26 10:47:29 9998 4
原创 LDA-线性判别分析(一)预备知识
本来是要调研 Latent Dirichlet Allocation 的那个 LDA 的, 没想到查到很多关于 Linear Discriminant Analysis 这个 LDA 的资料。初步看了看,觉得数学味挺浓,一时引起了很大的兴趣;再看看,就有整理一份资料的冲动了。网上查到的相关文章大都写得不是很详细,而且在概念和记号等方面也比较混乱,因此,在整理本文时,我有意识地牵了一根主线,想让读者
2013-09-26 10:47:16 9911
原创 做一个会编程的人
在人人上看到了一个分享(http://blog.renren.com/blog/601730041/913719225),这不恰好就是使计算机类专业学生能安心技术学习的非常好的素材吗?换种形式,用PPT表达出来。 在上课时,每次课间展示一张片子,如必要且时间允许,顺便提及相关人物、机构,或者技术,不也是一件很酷的事吗?我准备这样做了。 愿意将此用于教学的老师,请到CSDN资源中下载完整
2013-09-23 18:06:10 2693
转载 We're on the cusp of deep learning for the masses. You can thank Google later
原文链接Summary: Google researchers have developed new methods for analyzing language using deep learning techniques. They’ve also open sourced an implementation of their work so any researchers c
2013-09-22 15:21:16 1868
转载 大数据分析的众包平台—Kaggle
原文地址: http://www.china-cloud.com/yunhudong/yunzhuanlan/zhuanlanrenwu/chen_/2013/0118/17375.html2013-01-18 09:51众包(Jeff Howe,2006)是一种在互联网蓬勃发展的背景下产生的一种创新的生产组织形式。在这样的商业模式下,企业利用网络将工作分配出去,通过让更合
2013-09-22 14:37:54 5157
原创 为什么国内的网盘公司都在 TB 的级别上竞争,成本会不会太高?
本文来自知乎 @杜鑫 的回答 比如百度 1T,腾讯、360 多 T,就硬件成本来计算,是不是太可怕了,公司会投入这么多么?假设百度盘一千万用户,每人 1T,有人能算算成本么?真相究竟是什么?我想要为每个用户提供 1G 的网络存储空间。如果服务器上有一颗 1000G 的硬盘可以全部为用户提供数据储存,如果每个用户分配 1G 的最大储存空间,那么
2013-09-16 09:26:14 2505 3
转载 不良编程文化
Code culture problem05 September 2013"This is shit" my coworker exclaims as we browse some code looking for a particularly unpleasant bug. "Hmm" I reply.Such accusations, and likewise
2013-09-13 07:35:30 2171
转载 会思考的机器预言家
会思考的机器预言家撰文 亚瑟· S · 阿布-穆斯塔法(Yaser S. Abu-Mostafa)翻译 冷颖琳 通过梳理一套已知数据集,得出特征性的模式,就可以据此预测未来。这种“机器学习”的方法让计算机学会了思考,成了名副其实的“预言家”。 几年前,一家女装公司的主管请我帮忙设计一些时装款式,用以推荐给他们的客户。我对这个领域一点也不了解,任何人如果甚至健全的话,都不
2013-09-12 23:40:59 2531
原创 为什么我们喜欢用 sigmoid 这类 S 型非线性变换?
本文整理自 @老师木 的一条图片新浪微博,从另一个角度给出为何采用 sigmoid 函数作非线性变换的解释。为什么我们喜欢用 sigmoid 这类 S 型非线性变换?
2013-09-09 23:10:11 6856
原创 UFLDL 教程学习笔记(四)主成分分析
UFLDL(Unsupervised Feature Learning and Deep Learning)Tutorial 是由 Stanford 大学的 Andrew Ng 教授及其团队编写的一套教程,内容深入浅出,有很强的实用性,学习起来,让人有种酣畅淋漓的感觉。邓侃博士于今年 2 月 20 日起,在新浪微博上召集志愿者对该教程进行翻译,并于 4 月 8 日全部完成,非常感谢所有参与者的辛勤
2013-09-09 08:08:20 10332 6
原创 关于协方差矩阵的理解
在《主成分分析》中,我们用到了协方差矩阵,但当时并没有对其进行深入的讨论。为此,本文将针对协方差矩阵做一个详细的介绍,其中包括协方差矩阵的定义、数学意义以及计算公式的推导。
2013-09-09 07:45:39 64053 22
原创 UFLDL 教程学习笔记(三)自编码与稀疏性
UFLDL(Unsupervised Feature Learning and Deep Learning)Tutorial 是由 Stanford 大学的 Andrew Ng 教授及其团队编写的一套教程,内容深入浅出,有很强的实用性,学习起来,让人有种酣畅淋漓的感觉。邓侃博士于今年 2 月 20 日起,在新浪微博上召集志愿者对该教程进行翻译,并于 4 月 8 日全部完成,非常感谢所有参与者的辛勤
2013-09-09 07:14:46 8120 8
原创 UFLDL 教程学习笔记(二)反向传导算法
UFLDL(Unsupervised Feature Learning and Deep Learning)Tutorial 是由 Stanford 大学的 Andrew Ng 教授编写的一套教程,内容深入浅出,有很强的实用性,学习起来,让人有种酣畅淋漓的感觉。邓侃博士于今年 2 月 20 日起,在新浪微博上召集志愿者对该教程进行翻译,并于 4 月 8 日全部完成,非常感谢所有参与者的辛勤劳动。本
2013-09-03 23:33:02 13218 13
原创 UFLDL 教程学习笔记(一)神经网络
UFLDL(Unsupervised Feature Learning and Deep Learning)Tutorial 是由 Stanford 大学的 Andrew Ng 教授编写的一套教程,内容深入浅出,有很强的实用性,学习起来,让人有种酣畅淋漓的感觉。邓侃博士于今年 2 月 20 日起,在新浪微博上召集志愿者对该教程进行翻译,并于 4 月 8 日全部完成,非常感谢所有参与者的辛勤劳动。本
2013-09-03 23:20:41 17206 3
转载 Andrew Ng 如何重拾梦想
本文来自 http://www.huxiu.com/article/14357/1.html虎嗅注:人工智能现在是科技界最前沿的话题之一。以谷歌为代表,科技巨头均在这个方向上进行巨大投入。虎嗅曾发表过一篇文章,“谷歌正在如何复制人类大脑”,介绍的是谷歌工程主管雷·库兹韦尔正在如何通过机器学习颠覆传统搜索。而斯坦福大学人工智能实验室主任Andrew Ng(华裔,中
2013-09-03 21:53:58 3711
原创 召回率和精度
召回率(Recall)和精度(Precise)是广泛用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。其中召回率是是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率。精度是检索出的相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率。 从一个大规模数据集合中检索文档时,可把文档分成四组:1. 系统检索到的相关文档(A)2
2013-09-01 23:47:09 5551
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人