- 博客(36)
- 收藏
- 关注
原创 《PCA的数学原理》读书笔记
《PCA的数学原理》读书笔记最近读了张洋的《 PCA的数学原理 》的文章,受益匪浅,但是文章中也有一些地方不甚明了,本着刨根问底的态度,在此写下自己的理解和阅读之中所遇到的困惑及明悟。作为一只数学狗,个人还是比较喜欢规范化的文字。首先定义一些符号:假设我们有mm个样本数据,每个样本都是一个nn维向量,那么我们的样本矩阵就是一个n×mn \times m的矩阵An∗mA_{n*m},即以列为样本,行为
2015-09-11 13:21:56 1444 2
原创 ubuntu下的hadoop安装
1. 环境ubuntu 14.04 64位 java 1.8.0_45(1.7即可) ssh(sshd运行)2. 安装版本hadoop2.7.2(http://hadoop.apache.org/releases.html)3. 安装过程1.下载hadoop2.7.2的binary版本 http://www.apache.org/dyn/closer.cgi/hadoop/common/hado
2016-05-10 17:45:25 607
原创 python脚本打包发布:pyinstaller
1 安装环境windows发行版:win7 64位 python发行版:Anaconda2 pyinstaller安装pip install pyinstaller测试是否成功安装pyinstaller --version3.23 pyinstaller简例pyinstaller helloWorld.pyorpyinstaller --onefile helloWorld.py命令执行会生成两个
2016-05-05 17:21:00 1131
原创 数值最优化
0. 数学基础多元函数 1. 设多元函数 f:Rn→R f:R^n\rightarrow R 二次连续可微,则 f f 在 xx 处的梯度和Hessian矩阵为:∇f(x)=(∂f(x)∂x1,∂f(x)∂x2,⋯,∂f(x)∂xn)T \nabla f(x) = (\frac{\partial f(x)}{\partial x_1},\frac{\partial f(x)}{\partial
2016-03-15 17:48:13 2002 1
原创 word2vec
Corpuszh_cn搜狗语料库:ftp://ftp.labs.sogou.com/Data/SogouCS/SogouCS.tar.gz 中文维基百科语料库:https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2en英文维基百科语料库:https://dumps.wikimedia.org/en
2016-03-06 14:39:24 893
原创 BP神经网络的反向求导
BP神经网络本文章主要是记录BP神经网络的反向求导的具体过程,主要参考是UFLDL Tutoial。 中文版教程请戳此神经网络经典的神经网络是由多个感知器(神经元)构成的全连接的网络,本质上来说,这样的连接只是简单的线性加权和而已,所以每个神经元加上同一个非线性函数(如sigmoid,tanh等),使得网络能拟合非线性,其中这个非线性函数成为激活函数。符号描述为简便叙述,本文中的神经网络都是最简单
2016-03-05 16:39:17 6175
原创 CNN
参考文献:GradientBased Learning Applied to Document Recognition - Yann LeCun Leon Bottou Yoshua Bengio and Patrick Haner Abst:杨乐村98年基于MNIST的LeNet-5的详细论文 Unsupervised Feature Learning and Deep Learning:UF
2016-03-04 14:37:39 650
原创 My List of Perfect Software and Website
Green SoftwareSumatraPDF-3.1.1(Portable) : 小巧简洁的pdf阅读器灵格斯词霸-2.9.2 (简体中文绿色便携版) : 屏幕取词划词功能极好,支持Sumatra PDF划词。chrome extensionsOctotree:Github查看代码神器Proxy SwitchyOmega:代理管理插件划词翻译:如名websiteSmallpdf:
2016-02-28 12:05:09 550
原创 python matplotlib中文显示乱码解决
问题描述:python matplotlib绘图中文显示乱码 问题根源:matplotlib的默认字体并非中文字体 解决:设置为中文字体linux下查找中文字体:fc-list :lang=zh-cn #注意:前有个空格 windows下中文字体路径:c:\windows\fonts\simsun.ttcfrom matplotlib.font_manager import FontPrope
2016-02-26 15:48:30 5855 2
原创 Python Note
Python NotePython 中文官方文档strstr.translate(table [,deletechars]) -> string>>> from string import punctuation>>> s = 'abc,./123'>>> s.translate(None , punctuation)'abc123'>>> s.translate('a'*256 , p
2016-02-26 09:31:47 516
原创 matplotlib Note
pyplot首先,先导入numpy和pyplotimport numpy as npimport matplotlib.pyplot as plt简单画图示例:x = np.linspace(-10,10,1000)y = np.sin(x)plt.plot(x,y,alpha=0.3)#alpha:float (0.0 transparent through 1.0 opaque)pl
2016-02-24 16:00:00 506
原创 文章标题
date~$ date +%Y-%m-%d+%H:%M:%S2016-01-28+09:39:55~$ date +%Y-%m-%d --date="-1 day"2016-01-27Custom Command在~/.bashrc中添加alias命令,如:alias ll=”ls -al”source ~/.bashrc使之立即生效Simple Tutorial该section节选于C
2016-02-24 14:31:14 351
原创 ubuntu的virtualbox
系统版本:ubuntu 14.04问题:把大文件从共享文件夹中拷到虚拟机中的win7时,虚拟机崩溃了!解决:卸载重装,必须完全卸载! sudo dpkg -P virtualbox-5.0 官网下载deb重装
2016-01-22 18:07:30 344
原创 CNN Note
CNN Note本文主要记录些CNN相关的文章,以为备忘: 1. Deep Learning(深度学习)学习笔记整理系列之(七) 2. Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 3. Deep Learning论文笔记之(五)CNN卷积神经网络代码理解 4. 注解: 1. 此文章详细介绍了卷积神经网络的历史和原理,入门必备。 2.
2016-01-21 11:45:07 407
原创 LaTeX Note
LaTeX Note本Note仅对用过的语法、宏包等做备忘,以及一些总结:基础知识排版相关数学相关图片相关其他基础知识{}:必选参数 []:可选参数 $ $:行内公式 $$ $$:单行公式 空白符基本没什么卵用 \\:换行排版相关“` tex \documentclass{article}\title{firstTest} \author{treasuresss
2016-01-20 11:08:54 1626
原创 平方和的几何解释
平方和的几何解释高斯小时候被老师问到1+2+⋯+99+1001+2+\cdots +99+100的和,聪明机智的高斯几乎脱口而出5050。在我们现在看来其实很简单,也就是一个等差数列的求和公式而已: ∑i=1ni=n(n+1)2\sum_{i=1}^ni = \frac {n (n+1)} 2 一般地,如果等差数列{aia_i}的公差为d,则:∑i=1nai=n(n+1)d2\sum_{i=1}^
2015-09-24 16:57:24 5178
原创 【HDU 1874 2544 2066 2112】 Dijkstra单源最短路径专题 —— 优先队列+邻接表/邻接矩阵
分别基于邻接表和邻接矩阵,采用优先队列高效实现Dijkstra最短路径算法。Dijkstra练习题库
2015-05-02 14:36:22 1058
原创 【HDU 1005】Number Sequence —— 找周期
原题链接Number SequenceTime Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 122213 Accepted Submission(s): 29653Problem Descript
2015-04-27 17:32:08 743
原创 【HDU 1019】Least Common Multiple —— LCM
原题链接解题报告:很简单的水题,就是求LCM而且指明了是在int范围内!唯一值得注意的是:lcm函数中必须先除再乘,否则有溢出的可能!#include using namespace std;int gcd(int a,int b){ if(b==0) return a; return gcd(b,a%b);}int lcm(int
2015-04-23 23:59:05 511
原创 【HDU 1018】Big Number —— n!的位数
原题链接解题报告:由于最大能达到10^7! 故而不能直接用高精度整数算出结果,然后取位数……所以转换思路,从数学角度算出n!的位数,推导如下:因为len(n)=floor( log10(n) )+1设A=n!=1*2*3*...*n所以len(A)-1=floor( log10(A) )=floor( log10(1*2*3*...*n) )=floor( lo
2015-04-23 23:01:38 444
原创 【HDU 1040】As Easy As A+B —— 排序
原题链接解题报告:直接排序即可,没什么可说的!如果想自己写排序算法,倒是一道不错的练习题!#include #include #include #include #include using namespace std;const int MAX=1000000;int a[MAX];int main(){ int T,n;
2015-04-23 22:04:32 407
原创 【HDU 1012】u Calculate e —— 输出格式
原题链接解题报告:输出格式隐含要求是精确到小数点后9位。刚开始用cout#include #include #include #include using namespace std;int main(){ double ans=1.0;int f=1; cout<<"n e"<<endl; cout<<"- ----------
2015-04-23 21:53:57 615
原创 【HDU 1042】N! —— 高精度整数
原题链接解题报告:由于N能达到10000,故而肯定要用高精度整数乘法来解题!考虑到用10来做基数,大大浪费了int的比特数,故而采用10000为基数,但是这时候输出时就要注意输出格式问题:填充0来保持4位。#include #include #include #include using namespace std;int a[100000]={0}
2015-04-23 21:17:30 451
原创 【HDU 5207】Greatest Greatest Common Divisor —— 最大公因子
原题链接Greatest Greatest Common DivisorTime Limit: 4000/2000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Others)Total Submission(s): 665 Accepted Submission(s): 298Problem
2015-04-22 10:18:17 549
原创 【HDU 5206】Four Inages Strategy —— 计算几何之空间正方形
原题链接Four Inages StrategyTime Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Others)Total Submission(s): 664 Accepted Submission(s): 259Problem Descript
2015-04-21 23:40:53 552
原创 【HDU 4150】Powerful Incantation —— 字符串匹配
原题链接Powerful IncantationTime Limit: 5000/2000 MS (Java/Others) Memory Limit: 65535/32768 K (Java/Others)Total Submission(s): 1555 Accepted Submission(s): 688Problem Descrip
2015-04-21 20:30:13 447
原创 【ZOJ 3780】Paint the Grid Again —— 模拟拓扑排序
原题链接Paint the Grid AgainTime Limit: 2 Seconds Memory Limit: 65536 KBLeo has a grid with N × N cells. He wants to paint each cell with a specific color (either black or white).
2015-04-18 17:38:49 485
原创 【HDU 1016】Prime Ring Problem —— DFS
点击打开链接Prime Ring ProblemTime Limit: 4000/2000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 31406 Accepted Submission(s): 13903Problem DescriptionA ring
2015-04-17 19:25:04 433
原创 【HDU 1312】Red and Black —— DFS
原题链接Problem DescriptionThere is a rectangular room, covered with square tiles. Each tile is colored either red or black. A man is standing on a black tile. From a tile, he can move to one of four
2015-04-17 17:40:19 430
原创 Windows下Python的强力助手——Pypi
在Windows下一定要下载安装pypi,如果你要经常导入一些其他库的话!!!这是血与泪的教训啊,特写此文铭记……下面是安装pypi的步骤:1、download get-pip.py2、打开cmd,cd到你刚下载下来的get-pip.py的地址,运行下列语句(ps:运行前确保设置了python环境变量):python get-pip.py安装过程截图如下:3
2015-04-08 17:19:13 784
原创 【更新】排序算法比较:插入排序,冒泡排序,归并排序,堆排序,快速排序,计数排序,基数排序,桶排序
排序算法比较:插入排序,冒泡排序,归并排序,堆排序,快速排序,计数排序,基数排序,桶排序
2015-04-05 17:10:05 967
转载 【转】PCA和白化练习之处理二维数据
在很多情况下,我们要处理的数据的维度很高,需要提取主要的特征进行分析这就是PCA(主成分分析),白化是为了减少各个特征之间的冗余,因为在许多自然数据中,各个特征之间往往存在着一种关联,为了减少特征之间的关联,需要用到所谓的白化(whitening).首先下载数据pcaData.rar,下面要对这里面包含的45个2维样本点进行PAC和白化处理,数据中每一列代表一个样本点。第一步 画出
2015-02-12 21:49:15 671
转载 【转】MATLAB向量点积
两个向量的点积 a = (a1, a2, …, an) and b = (b1, b2, …, bn) 由以下给定: yiibai.coma.b = ∑(ai.bi)计算两个向量a和b的点积点函数。dot(a, b); yiibai.com 例子创建一个脚本文件,用下面的代码:v1 = [2 3 4];v2 = [1 2 3];dp = dot(
2014-09-18 12:46:27 6553
转载 【转】matlab中&&和&的区别
Matlab中的逻辑运算"&&"与"&","||"与"|"的区别如下:&&和||被称为&和|的short circuit形式,A&B(1)首先判断A的逻辑值,然后判断B的值,然后进行逻辑与的计算。(2)A和B可以为矩阵(e.g. A=[1 0],B=[0 0])。A&&B(1)首先判断A的逻辑值,如果A的值为假,就可以判断整个表达式的值为假,就不需要再判断B的值。(2)A和B不能是矩
2014-09-18 12:19:23 33884
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人