笔记
金钗Blue
这个作者很懒,什么都没留下…
展开
-
k近邻——KNN
一、KNN算法分析 K最近邻(k-Nearest Neighbor,KNN)分类算法可以说是最简单的机器学习算法了。它采用测量不同特征值之间的距离方法进行分类。它的思想很简单:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 ...转载 2018-04-26 11:13:07 · 220 阅读 · 0 评论 -
贝叶斯
1.1贝叶斯公式P(A | B)= P(B | A)* P(A)/ P(B)P(A)或P(B):先验概率,表示每种类别分布的概率;P(B | A):条件概率,在某类的前提下,事件发生的概率;P(A | B):后验概率,事件发生,该事件属于某一类别的概率。1.2图解A已发生的条件下B发生的概率:P(B | A)=P(A∩B)/P(A); P((A∩B)=P(B | A) * ...原创 2018-07-16 16:55:58 · 530 阅读 · 0 评论 -
最大似然估计
数学上对最大似然估计的定义,大家看看就好哈~最大似然法(Maximum Likelihood,ML)也称为最大概似估计,也叫极大似然估计,是一种具有理论性的点估计法,此方法的基本思想是:当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大。最大似然估计是一种统计方法,它用来求一个样本集的相关概率密度函数的参数。最大似然法明确地使用概率模...原创 2018-07-16 17:15:41 · 2797 阅读 · 0 评论 -
Python split 例子(代码过于冗长,有没有简洁的方法)
例子 :将'<>'里的数据和':'前的数据提取出来,原始数据如下:OUT_DIAG_NAME 脱垂性内痔<I84.102> 帕金森病性痴呆 <G20.x02+> 混合性白内障<H26.801> I84.201:混合痔 I84.201:混合痔 出血性卵巢黄体囊肿<N83.101> K35.901:急性化脓性...原创 2018-08-06 11:52:44 · 583 阅读 · 0 评论