机器学习
文章平均质量分 60
KyrieLiu52
这个作者很懒,什么都没留下…
展开
-
【机器学习】相似度度量方法总结
相似性度量描述样本之间相似度的方法有很多种,一般来说常用的有相关系数和欧式距离。在做分类时,常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(distance)。采用什么样的方法计算距离是很讲究的,甚至关系到分类的正确与否。欧式距离曼哈顿距离切比雪夫距离闵可夫斯基距离标准化欧氏距离马氏距离夹角余弦汉明距离杰卡德距离&杰卡德相似系数相关系数&相关距离信息熵1.欧式距离平方、求和、开原创 2022-05-18 11:11:54 · 2098 阅读 · 0 评论 -
【机器学习】机器学习中的数学问题(持续更新ing)
文章目录正态分布标准正态分布:μ=0,σ=1高斯函数一维:二维:范数什么是范数?L-P范数L0范数L1范数L2范数范数梯度什么是梯度?符号公式矩阵和向量矩阵矩阵特性特殊矩阵正交矩阵矩阵的迹性质:向量向量乘法特征值、特征向量定义:求解:性质:相似矩阵矩阵的迹和行列式特征分解:矩阵求导偏差和方差偏差(bias)方差(varience)概率知识似然、概率期望期望条件期望指示函数I正态分布f(x)=12πσe−(x−μ)22σ2f(x)=\frac{1}{\sqrt{2 \pi} \sigma} e^{-\f原创 2022-05-18 11:09:36 · 565 阅读 · 0 评论 -
【机器学习】使用e^x函数拟合数据
使用 scipy.optimize.curve_fit 函数实现。curve_fit 的参数如下:scipy.optimize.curve_fit(f, xdata, ydata, p0=None, sigma=None, absolute_sigma=False, check_finite=True, bounds=(- inf, inf), method=None, jac=None, **kwargs)介绍一下使用时需要的基本参数,详细参数查看 官方文档:f:模型函数,yda原创 2021-10-12 16:10:07 · 1503 阅读 · 0 评论 -
【Pandas】解决在pandas中的两个正数相乘结果为负值
前几天使用sklearn拟合数据,发现曲线特别离谱,找了很久的原因,最后发现是因为我在代码中对特征进行了特征之间的相乘操作,来增加特征的维度,但是两个正数相乘之后,变成了负数:下图中 xi 为所有数据的第一个特征, xj 为第二个特征, xij 为两个特征相乘之后的结果在经过下面的代码测试后,发现原因是数据太大,直接相乘不会出错,但是在pandas中进行相乘后结果就是负值。if __name__ == '__main__': a = 10000000000 b = 70000000原创 2021-09-30 19:11:25 · 683 阅读 · 0 评论 -
【Pandas】Pandas中以Series为基础对所有元素进行统一的操作
在使用pandas对数据进行处理时,假设对于二维数组,每一行是一个数据,每一列是一个特征,可能需要对所有数据的特征进行一些缩放、平方、增加数值等操作。本文中介绍的方式,将每一个特征都取出作为一个 Series 来对当前 Series (特征)下的所有数据进行统一的操作。# 假设 X 为所有的数据矩阵, feature 为某一个特征,其数据类型为DataFrame中的Seriesfeature = X[0] # 假设 feature 取第0列表示的特征new_f1 = feature + 1 #原创 2021-09-30 18:23:57 · 1338 阅读 · 0 评论 -
【机器学习】最大似然与EM算法
原文链接:https://blog.csdn.net/zouxy09/article/details/8537620从最大似然到EM算法浅解zouxy09@qq.comhttp://blog.csdn.net/zouxy09 机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题。神为什么是神,因为神能做很多人做不了的事。那么EM算法能解决什么问题呢?或者说EM算法是因为什么而来到...转载 2020-12-28 18:46:00 · 287 阅读 · 0 评论 -
【机器学习】朴素贝叶斯
概率和似然的区别:https://blog.csdn.net/songyu0120/article/details/85059149极大似然估计:https://zhuanlan.zhihu.com/p/26614750极大似然估计中采样需满足一个重要的假设,就是所有的采样都是独立同分布的详解最大似然估计(MLE)、最大后验概率估计(MAP),以及贝叶斯公式的理解:https://blog.csdn.net/u011508640/article/details/72815981贝叶斯估计、最大似然原创 2020-12-07 21:36:17 · 177 阅读 · 1 评论