2013年09月_皮果提

原创 LDA-线性判别分析（四）其他几个相关问题

本来是要调研 Latent Dirichlet Allocation 的那个 LDA 的, 没想到查到很多关于 Linear Discriminant Analysis 这个 LDA 的资料。初步看了看，觉得数学味挺浓，一时引起了很大的兴趣；再看看，就有整理一份资料的冲动了。网上查到的相关文章大都写得不是很详细，而且在概念和记号等方面也比较混乱，因此，在整理本文时，我有意识地牵了一根主线，想让读者

2013-09-26 10:48:35 3736

原创 LDA-线性判别分析（三）推广到 Multi-classes 情形

本来是要调研 Latent Dirichlet Allocation 的那个 LDA 的, 没想到查到很多关于 Linear Discriminant Analysis 这个 LDA 的资料。初步看了看，觉得数学味挺浓，一时引起了很大的兴趣；再看看，就有整理一份资料的冲动了。网上查到的相关文章大都写得不是很详细，而且在概念和记号等方面也比较混乱，因此，在整理本文时，我有意识地牵了一根主线，想让读者

2013-09-26 10:48:27 7188 3

原创 LDA-线性判别分析（二）Two-classes 情形的数学推导

本来是要调研 Latent Dirichlet Allocation 的那个 LDA 的, 没想到查到很多关于 Linear Discriminant Analysis 这个 LDA 的资料。初步看了看，觉得数学味挺浓，一时引起了很大的兴趣；再看看，就有整理一份资料的冲动了。网上查到的相关文章大都写得不是很详细，而且在概念和记号等方面也比较混乱，因此，在整理本文时，我有意识地牵了一根主线，想让读者

2013-09-26 10:47:29 9998 4

原创 LDA-线性判别分析（一）预备知识

本来是要调研 Latent Dirichlet Allocation 的那个 LDA 的, 没想到查到很多关于 Linear Discriminant Analysis 这个 LDA 的资料。初步看了看，觉得数学味挺浓，一时引起了很大的兴趣；再看看，就有整理一份资料的冲动了。网上查到的相关文章大都写得不是很详细，而且在概念和记号等方面也比较混乱，因此，在整理本文时，我有意识地牵了一根主线，想让读者

2013-09-26 10:47:16 9911

原创做一个会编程的人

在人人上看到了一个分享（http://blog.renren.com/blog/601730041/913719225），这不恰好就是使计算机类专业学生能安心技术学习的非常好的素材吗？换种形式，用PPT表达出来。　　在上课时，每次课间展示一张片子，如必要且时间允许，顺便提及相关人物、机构，或者技术，不也是一件很酷的事吗？我准备这样做了。　　愿意将此用于教学的老师，请到CSDN资源中下载完整

2013-09-23 18:06:10 2693

转载 We're on the cusp of deep learning for the masses. You can thank Google later

原文链接Summary: Google researchers have developed new methods for analyzing language using deep learning techniques. They’ve also open sourced an implementation of their work so any researchers c

2013-09-22 15:21:16 1868

转载大数据分析的众包平台—Kaggle

原文地址: http://www.china-cloud.com/yunhudong/yunzhuanlan/zhuanlanrenwu/chen_/2013/0118/17375.html2013-01-18 09:51众包（Jeff Howe，2006）是一种在互联网蓬勃发展的背景下产生的一种创新的生产组织形式。在这样的商业模式下，企业利用网络将工作分配出去，通过让更合

2013-09-22 14:37:54 5157

原创为什么国内的网盘公司都在 TB 的级别上竞争，成本会不会太高？

本文来自知乎 @杜鑫的回答比如百度 1T，腾讯、360 多 T，就硬件成本来计算，是不是太可怕了，公司会投入这么多么？假设百度盘一千万用户，每人 1T，有人能算算成本么？真相究竟是什么？我想要为每个用户提供 1G 的网络存储空间。如果服务器上有一颗 1000G 的硬盘可以全部为用户提供数据储存，如果每个用户分配 1G 的最大储存空间，那么

2013-09-16 09:26:14 2505 3

转载不良编程文化

Code culture problem05 September 2013"This is shit" my coworker exclaims as we browse some code looking for a particularly unpleasant bug. "Hmm" I reply.Such accusations, and likewise

2013-09-13 07:35:30 2171

转载会思考的机器预言家

会思考的机器预言家撰文亚瑟· S · 阿布－穆斯塔法（Yaser S. Abu-Mostafa）翻译冷颖琳通过梳理一套已知数据集，得出特征性的模式，就可以据此预测未来。这种“机器学习”的方法让计算机学会了思考，成了名副其实的“预言家”。几年前，一家女装公司的主管请我帮忙设计一些时装款式，用以推荐给他们的客户。我对这个领域一点也不了解，任何人如果甚至健全的话，都不

2013-09-12 23:40:59 2531

原创为什么我们喜欢用 sigmoid 这类 S 型非线性变换?

本文整理自 @老师木的一条图片新浪微博，从另一个角度给出为何采用 sigmoid 函数作非线性变换的解释。为什么我们喜欢用 sigmoid 这类 S 型非线性变换?

2013-09-09 23:10:11 6856

原创 UFLDL 教程学习笔记（四）主成分分析

UFLDL（Unsupervised Feature Learning and Deep Learning）Tutorial 是由 Stanford 大学的 Andrew Ng 教授及其团队编写的一套教程，内容深入浅出，有很强的实用性，学习起来，让人有种酣畅淋漓的感觉。邓侃博士于今年 2 月 20 日起，在新浪微博上召集志愿者对该教程进行翻译，并于 4 月 8 日全部完成，非常感谢所有参与者的辛勤

2013-09-09 08:08:20 10332 6

原创关于协方差矩阵的理解

在《主成分分析》中，我们用到了协方差矩阵，但当时并没有对其进行深入的讨论。为此，本文将针对协方差矩阵做一个详细的介绍，其中包括协方差矩阵的定义、数学意义以及计算公式的推导。

2013-09-09 07:45:39 64053 22

原创 UFLDL 教程学习笔记（三）自编码与稀疏性

UFLDL（Unsupervised Feature Learning and Deep Learning）Tutorial 是由 Stanford 大学的 Andrew Ng 教授及其团队编写的一套教程，内容深入浅出，有很强的实用性，学习起来，让人有种酣畅淋漓的感觉。邓侃博士于今年 2 月 20 日起，在新浪微博上召集志愿者对该教程进行翻译，并于 4 月 8 日全部完成，非常感谢所有参与者的辛勤

2013-09-09 07:14:46 8120 8

原创 UFLDL 教程学习笔记（二）反向传导算法

UFLDL（Unsupervised Feature Learning and Deep Learning）Tutorial 是由 Stanford 大学的 Andrew Ng 教授编写的一套教程，内容深入浅出，有很强的实用性，学习起来，让人有种酣畅淋漓的感觉。邓侃博士于今年 2 月 20 日起，在新浪微博上召集志愿者对该教程进行翻译，并于 4 月 8 日全部完成，非常感谢所有参与者的辛勤劳动。本

2013-09-03 23:33:02 13218 13

原创 UFLDL 教程学习笔记（一）神经网络

UFLDL（Unsupervised Feature Learning and Deep Learning）Tutorial 是由 Stanford 大学的 Andrew Ng 教授编写的一套教程，内容深入浅出，有很强的实用性，学习起来，让人有种酣畅淋漓的感觉。邓侃博士于今年 2 月 20 日起，在新浪微博上召集志愿者对该教程进行翻译，并于 4 月 8 日全部完成，非常感谢所有参与者的辛勤劳动。本

2013-09-03 23:20:41 17206 3

转载 Andrew Ng 如何重拾梦想

本文来自 http://www.huxiu.com/article/14357/1.html虎嗅注：人工智能现在是科技界最前沿的话题之一。以谷歌为代表，科技巨头均在这个方向上进行巨大投入。虎嗅曾发表过一篇文章，“谷歌正在如何复制人类大脑”，介绍的是谷歌工程主管雷·库兹韦尔正在如何通过机器学习颠覆传统搜索。而斯坦福大学人工智能实验室主任Andrew Ng（华裔，中

2013-09-03 21:53:58 3711

原创召回率和精度

召回率（Recall）和精度（Precise）是广泛用于信息检索和统计学分类领域的两个度量值，用来评价结果的质量。其中召回率是是检索出的相关文档数和文档库中所有的相关文档数的比率，衡量的是检索系统的查全率。精度是检索出的相关文档数与检索出的文档总数的比率，衡量的是检索系统的查准率。从一个大规模数据集合中检索文档时，可把文档分成四组：1. 系统检索到的相关文档（A）2

2013-09-01 23:47:09 5551

原创逻辑回归详谈

本文从数学上对逻辑回归做了一个详尽的分析，其中包括回归分析、最小二乘法、sigmoid 函数以及梯度下降等知识点的介绍。

2013-09-01 22:03:56 7199

peghoty

原创 LDA-线性判别分析（四）其他几个相关问题

原创 LDA-线性判别分析（三）推广到 Multi-classes 情形

原创 LDA-线性判别分析（二）Two-classes 情形的数学推导

原创 LDA-线性判别分析（一）预备知识

原创做一个会编程的人

转载 We're on the cusp of deep learning for the masses. You can thank Google later

转载大数据分析的众包平台—Kaggle

原创为什么国内的网盘公司都在 TB 的级别上竞争，成本会不会太高？

转载不良编程文化

转载会思考的机器预言家

原创为什么我们喜欢用 sigmoid 这类 S 型非线性变换?

原创 UFLDL 教程学习笔记（四）主成分分析

原创关于协方差矩阵的理解

原创 UFLDL 教程学习笔记（三）自编码与稀疏性

原创 UFLDL 教程学习笔记（二）反向传导算法

原创 UFLDL 教程学习笔记（一）神经网络

转载 Andrew Ng 如何重拾梦想

原创召回率和精度

原创逻辑回归详谈

逻辑回归详谈

线性判别分析(LDA)入门

线性判别分析（LDA）浅析

空空如也