数学
晓东邪
扎实基础,记录学习点滴。
展开
-
伯努利分布、二项分布、多项分布、Beta分布、Dirichlet分布、连续分布(正态分布)、大数定理、中心极限定理、贝叶斯理论
机器学习中常遇到关于各种分布的问题,不过这些知识都已经忘得差不多了,就搜了点资料,详细讲解下伯努利分布、二项分布、多项分布、Beta分布、Dirichlet分布 ,用于后期回顾。原创 2017-05-15 00:35:25 · 15312 阅读 · 1 评论 -
假设检验
机器学习中的假设检验: (摘自:《常用数据挖掘算法总结及Python实现》)原创 2017-05-15 00:50:14 · 1670 阅读 · 0 评论 -
机器学习基本数学概念速查
特征向量对于一个给定的线性变换A,它的特征向量(eigenvector,也譯固有向量或本征向量)v 经过这个线性变换之后,得到的新向量仍然与原来的v 保持在同一条直线上,但其长度或方向也许会改变。即 Av=λv特征空间特征空间(eigenspace)是具有相同特征值的特征向量与一个同维数的零向量的集合。假设空间一组函数的集合,这组集合中的函数都能将输入空间映射到输出空间,但是映射的准确性却大不相同转载 2017-05-10 10:04:34 · 6093 阅读 · 0 评论 -
机器学习算法中如何选取超参数:学习速率、正则项系数、minibatch size
当参数时随机变量时,该参数分布中的参数就是超参数,简单的说就是参数的参数,感觉一般在贝叶斯方法中出现。所谓超参数,就是机器学习模型里面的框架参数,比如聚类方法里面类的个数,或者话题模型里面话题的个数等等,都称为超参数。它们跟训练过程中学习的参数(权重)是不一样的,通常是手工设定,不断试错调整,或者对一系列穷举出来的参数组合一通枚举(叫做网格搜索)。深度学习和神经网络模型,有很多这样的参数需要学习,这转载 2017-04-27 20:51:45 · 3773 阅读 · 0 评论 -
相关系数和协方差
from pandas import Sereis, DataFrame import pandas.io.data as weball_data = {} for ticker in ['AAPL','IBM','MSFT','GOOG']: all_data[ticker] = web.get_data_yahoo(ticker,'1/1/2000','1/1/2010')price =原创 2016-11-11 23:32:33 · 13672 阅读 · 0 评论 -
机器学习概念速查
看到的机器学习概念总结,做的挺全的,记录之~转自:机器学习基本概念总结转载 2017-05-09 23:30:52 · 560 阅读 · 0 评论 -
相似度选择
不同条件下选择合适的相似度原创 2017-10-17 22:49:29 · 501 阅读 · 0 评论