![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 65
武科大许志伟
武科大计算机本硕博,小青椒,IEEE, ACM, CCF, CAAI, IEEE-SMC, IEEE-CIS会员.研究方向为:演化计算,多目标优化,迁移优化,多任务优化,机器学习。
展开
-
从PCC到MIC,理解变量之间的相关性
选自FreeCoderCamp作者:Peter Gleeson机器之心编译参与:陈韵竹、程耀彤、刘晓坤原文链接:https://medium.freecodecamp.org/how-machines-make-predictions-finding-correlations-in-complex-data-dfd9f0d87889本文为机器之心编译,转载请联系公众号获得授权。本文分享自微信公众号 - 机器之心(almosthuman2014)原文出处及转载信息见文内详细说明,如有侵权,请联系转载 2021-11-28 19:55:32 · 2593 阅读 · 0 评论 -
【转】一文让你通俗理解奇异值分解
一文让你通俗理解奇异值分解觉得有用的话,欢迎一起讨论相互学习~原文来源七月在线,本文仅做学术分享,如有侵权请联系后台删除特征值和奇异值在大部分人的印象中,往往是停留在纯粹的数学计算中。而且线性代数或者矩阵论里面,也很少讲任何跟特征值与奇异值有关的应用背景。奇异值分解是一个有着很明显的物理意义的一种方法,它可以将一个比较复杂的矩阵用更小更简单的几个子矩阵的相乘来表示,这些小矩阵描述的是矩阵的重要的特性。就像是描述一个人一样,给别人描述说这个人长得浓眉大眼,方脸,络腮胡,而且带个黑框的眼镜,这样寥转载 2021-11-09 15:25:11 · 304 阅读 · 0 评论 -
【转】距离相关系数的python实现
距离相关系数的python实现觉得有用的话,欢迎一起讨论相互学习~转载自:https://blog.csdn.net/jiaoaodechunlv/article/details/80655592最近在做特征选择,要考量几个特征的相关性,想找这个方法的描述,发现很难在网页上搜到。以下为整合的:[11] 王黎明, 吴香华, 赵天良,等. 基于距离相关系数和支持向量机回归的PM_(2.5)浓度滚动统计预报方案[J]. 环境科学学报, 2017,37(4):1268-1276.(我是从这篇论文上找的转载 2021-11-06 15:04:06 · 621 阅读 · 0 评论 -
【转】关于相关性的7个最常见的问题
关于相关性的7个最常见的问题作者:常龙本文链接:https://zhuanlan.zhihu.com/p/38353751?ivk_sa=1024320u感谢常龙的分享,仅作学术交流,如有侵权-联系后台删除~觉得有用的话,欢迎一起讨论相互学习~本文来源于7 most commonly asked questions on Correlation,经过翻译和修改后得到的,旨在帮助数据分析和挖掘人员了解相关性的知识,扫除关于相关性分析的知识盲点。关于相关的7个最常见问题介绍学习统计的自然轨转载 2021-11-05 09:06:08 · 2967 阅读 · 0 评论 -
【转】数据清洗中异常值(离群值)的判别和处理方法
数据清洗中异常值(离群值)的判别和处理方法版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。本文链接:https://blog.csdn.net/dhr223/article/details/107086239感谢dhr223的分享,仅作学术交流,如有侵权-联系后台删除~觉得有用的话,欢迎一起讨论相互学习~前天参加面试的时候被问了一个题:选择什么样的指标来代表总体情况?我回答的不是很好,具体怎么回答的记不太清了,感觉回答的不是很好。回来后转载 2021-11-05 09:04:57 · 2625 阅读 · 0 评论 -
【转】一文读懂PCA算法的数学原理
一文读懂PCA算法的数学原理来源:算法数学俱乐部,算法与数学之美,编辑:nhyilin觉得有用的话,欢迎一起讨论相互学习~PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过程,而没有讲述其中的原理。这篇文章的目的是介绍PCA的基本数学原理,帮助读者了解PCA的工作机制是什么。转载 2021-11-03 14:30:44 · 737 阅读 · 0 评论 -
【转】Maximal Information Coefficient (MIC)最大互信息系数详解与实现
Maximal Information Coefficient (MIC)最大互信息系数详解与实现————————————————版权声明:本文为CSDN博主「Font Tian」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/FontThrone/article/details/85227239感谢Font Tian的分享,仅作学术交流,如有侵权-联系后台删除~觉得有用的话,欢迎一起讨论相互学习~MI转载 2021-11-03 12:04:27 · 4619 阅读 · 0 评论 -
【转载】降噪自动编码器
降噪自动编码器降噪自动编码器(Denoising Autoencoder)觉得有用的话,欢迎一起讨论相互学习~转载自:https://www.cnblogs.com/neopenx/p/4370350.html作者:Physcalの大魔導書感谢大佬,大佬的文章就是浅显易懂而NB起源:PCA、特征提取…随着一些奇怪的高维数据出现,比如图像、语音,传统的统计学-机器学习方法遇到了前所未有的挑战。数据维度过高,数据单调,噪声分布广,传统方法的“数值游戏”很难奏效。数据挖掘?已然挖不出有用的东转载 2021-09-25 21:52:34 · 2082 阅读 · 0 评论 -
【转】标准化和归一化请勿混为一谈
【转】标准化和归一化请勿混为一谈觉得有用的话,欢迎一起讨论相互学习~版权声明:本文为CSDN博主「夏洛克江户川」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/weixin_36604953/article/details/102652160...转载 2021-09-09 14:12:48 · 228 阅读 · 0 评论 -
【转】关于数据的异常检测一篇就够了
关于数据的异常检测一篇就够了觉得有用的话,欢迎一起讨论相互学习~版权声明:本文为CSDN博主「携程技术中心」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/Nx2XJBUr4Jg8ef80l1K/article/details/89325127作者简介束开亮,携程大市场部BI团队,负责数据分析与挖掘。同济应用数学硕士,金融数学方向,法国统计学工程师,主修风险管理与金融工程。前言 制造厂商需要抽样检测流水线转载 2021-09-09 13:50:03 · 753 阅读 · 0 评论 -
【转】异常值处理
【转】什么样的值是异常值?觉得有用的话,欢迎一起讨论相互学习~版权声明:本文为CSDN博主「sljwy」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/sinat_23971513/article/details/114918790简单来说,即在数据集中存在不合理的值,又称离群点。我们举个例子,做客户分析,发现客户的年平均收入是80万美元。 但是,有两个客户的年收入是4美元和420万美元。 这两个客户的年收入转载 2021-09-09 13:39:19 · 403 阅读 · 0 评论 -
【转】一文读懂协方差和协方差矩阵
【转】浅谈协方差觉得有用的话,欢迎一起讨论相互学习~转载自:https://www.cnblogs.com/invisible2/p/11442777.html作者:invisible_man转载 2021-09-04 20:37:50 · 199 阅读 · 0 评论 -
【转】直观地理解协方差矩阵
【转】直观地理解协方差矩阵觉得有用的话,欢迎一起讨论相互学习~版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。本文链接:https://blog.csdn.net/a943368093/article/details/103765333需要说明的是,协方差矩阵中研究的样本是一个维度为n的多维向量,因此协方差矩阵一定是一个n*n的方阵...转载 2021-09-04 20:36:52 · 373 阅读 · 0 评论 -
【转】高斯分布函数的乘积与代码实现
【转】高斯分布函数的乘积与代码实现————————————————版权声明:本文为CSDN博主「棕熊的肚皮」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/u012836279/article/details/80036417觉得有用的话,欢迎一起讨论相互学习~注意,转载这篇文章的时候,根据已有的评论,需要注意的是,这说的是 两个高斯分布函数的乘积 ,而不是两个高斯分布的乘积,也不是两个满足高斯分布的数据乘转载 2021-08-18 20:36:27 · 277 阅读 · 0 评论 -
两个高斯函数方程的乘积
两个高斯函数方程的乘积觉得有用的话,欢迎一起讨论相互学习~来源:https://ccrma.stanford.edu/~jos/sasp/Product_Two_Gaussian_PDFs.html另一篇参考资料:[Products and Convolutions of Gaussian Probability Density Functions] http://www.lucamartino.altervista.org/2003-003.pdf...原创 2021-08-18 19:51:22 · 504 阅读 · 0 评论 -
【转】两个高斯分布函数乘积的理论推导
【转】两个高斯分布函数乘积的理论推导————————————————版权声明:本文为CSDN博主「chaosir」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/chaosir1991/article/details/106910668/觉得有用的话,欢迎一起讨论相互学习~注意,转载这篇文章的时候,根据已有的评论,需要注意的是,这说的是 两个高斯分布函数的乘积 ,而不是两个高斯分布的乘积,也不是两个满足高斯转载 2021-08-18 19:11:40 · 1687 阅读 · 0 评论 -
【转】浅谈协方差
【转】浅谈协方差觉得有用的话,欢迎一起讨论相互学习~转载自:http://pinkyjie.com/2010/08/31/covariance/作者:进击的马斯特协方差矩阵Matlab协方差矩阵转载 2021-08-12 18:02:59 · 124 阅读 · 0 评论 -
【转】EM算法MATLAB代码及详细注解
【转】EM算法MATLAB代码及详细注解版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。本文链接:https://blog.csdn.net/qq_23968185/article/details/70940197作者:鼹鼠的胡须觉得有用的话,欢迎一起讨论相互学习~下面代码为PRML所附的基于混合高斯(MoG)的代码,个人认为编码可读性和风格都值得借鉴。function [label, model, llh] = mixGaussEm(X转载 2021-08-11 12:52:47 · 1774 阅读 · 1 评论 -
【转】高斯混合模型
【转】高斯混合模型转载自:https://blog.csdn.net/u010089444/article/details/64921363作者:Joe-Han觉得有用的话,欢迎一起讨论相互学习~转载 2021-08-11 10:54:51 · 88 阅读 · 0 评论 -
【转】详解EM算法与混合高斯模型(Gaussian mixture model, GMM)
【转】详解EM算法与混合高斯模型(Gaussian mixture model, GMM)转载自:https://blog.csdn.net/lin_limin/article/details/81048411作者:林立民爱洗澡觉得有用的话,欢迎一起讨论相互学习~转载 2021-08-10 20:30:37 · 172 阅读 · 0 评论 -
【转】二维高斯分布(Two-dimensional Gaussian distribution)的参数分析
二维高斯分布(Two-dimensional Gaussian distribution)的参数分析转载自:https://blog.csdn.net/lin_limin/article/details/81024228觉得有用的话,欢迎一起讨论相互学习~1、多维高斯分布的概率密度函数2、均值和协方差矩阵对二维高斯分布的影响3. 总结...转载 2021-08-10 18:55:45 · 1421 阅读 · 0 评论 -
多元高斯分布的KL散度
多元高斯分布的KL散度觉得有用的话,欢迎一起讨论相互学习~首先声明,本人是概率论方面的小白,此篇文章纯属自学笔记,文中所有内容可能摘抄自不同的平台,集百家之长,不用作商业用途。非常感谢各位大佬的知识共享,都会标明出处,如果对各位造成了侵权,欢迎指出,将对文章内内容进行修改和删除。摘自:[1] 高斯分布的KL散度 https://blog.csdn.net/HEGSNS/article/details/104857277[2] 多变量高斯分布之间的KL散度(KL Divergence) http转载 2020-06-16 22:53:49 · 2614 阅读 · 0 评论 -
各维度不相关的多元高斯分布
各维度不相关的多元高斯分布觉得有用的话,欢迎一起讨论相互学习~首先声明,本人是概率论方面的小白,此篇文章纯属自学笔记,文中所有内容可能摘抄自不同的平台,集百家之长,不用作商业用途。非常感谢各位大佬的知识共享,都会标明出处,如果对各位造成了侵权,欢迎指出,将对文章内内容进行修改和删除。摘自:[1] https://www.zhihu.com/question/36339816/answer/385944057[2] https://www.cnblogs.com/bingjianing/p/91转载 2020-06-16 20:30:19 · 832 阅读 · 0 评论 -
多元高斯分布
多元高斯分布觉得有用的话,欢迎一起讨论相互学习~转载自:https://www.cnblogs.com/bingjianing/p/9117330.html转载 2020-06-12 13:59:54 · 288 阅读 · 0 评论 -
[GitHub寻宝]机器学习实战python3代码分享
机器学习实战python3代码分享觉得有用的话,欢迎一起讨论相互学习~《机器学习实战》是一本初学者必看的书籍,但是其中代码是由python2写的github上有两个非常好的项目,用python3实现,推荐给大家,欢迎加星,fork,为技术开源做出贡献![1]https://github.com/Jack-Cherish/Machine-Learning[2]https://github.com/wzy6642/Machine-Learning-in-Action-Python3[1][2原创 2020-05-10 14:54:57 · 450 阅读 · 0 评论 -
[吴恩达机器学习笔记]14降维3-4PCA算法原理
14.降维觉得有用的话,欢迎一起讨论相互学习~Follow Me14.3主成分分析原理Proncipal Component Analysis Problem Formulation主成分分析(PCA)是最常见的降维算法当主成分数量K=2时,我们的目的是找到一个低维的投影平面,当把所有的数据都投影到该低维平面上时,希望所有样本 平均投影误差 能尽可能地小。 投影平面 是一个...原创 2018-09-09 17:34:49 · 618 阅读 · 0 评论 -
机器学习数学笔记|大数定理中心极限定理矩估计
机器学习中的数学觉得有用的话,欢迎一起讨论相互学习~Follow Me 原创文章,如需转载请保留出处 本博客为七月在线邹博老师机器学习数学课程学习笔记概率密度/概率分布函数概率密度只是针对连续性变量而言,而分布函数是对所有随机变量取值的概率的讨论,包括连续性和离散型.已知连续型随机变量的密度函数,可以通过讨论及定积分的计算求出其分布函数;当已知连续型随机变量的分布函数时,对其求导就可原创 2017-11-14 20:11:39 · 1598 阅读 · 0 评论 -
S折交叉验证(S-fold cross validation)
S折交叉验证(S-fold cross validation)觉得有用的话,欢迎一起讨论相互学习~Follow Me仅为个人观点,欢迎讨论参考文献https://blog.csdn.net/aliceyangxi1987/article/details/73532651李航-统计学习方法https://blog.csdn.net/jasonding1354/article/detai...原创 2019-03-12 14:52:16 · 2372 阅读 · 0 评论 -
[吴恩达机器学习笔记]16推荐系统5-6协同过滤算法/低秩矩阵分解/均值归一化
16.推荐系统 Recommender System觉得有用的话,欢迎一起讨论相互学习~Follow Me16.5 向量化:低秩矩阵分解Vectorization_ Low Rank Matrix Factorization示例当给出一件产品时,你能否找到与之相关的其它产品。一位用户最近看上一件产品,有没有其它相关的产品,你可以推荐给他协同过滤算法我...原创 2018-09-12 21:42:14 · 1683 阅读 · 0 评论 -
[吴恩达机器学习笔记]15.1-3非监督学习异常检测算法/高斯回回归模型
15.异常检测 Anomaly detection觉得有用的话,欢迎一起讨论相互学习~Follow Me15.1问题动机 Problem motivation飞机引擎异常检测假想你是一个飞机引擎制造商,当你生产的飞机引擎从生产线上流出时,你需要进行 QA(质量控制测试),而作为这个测试的一部分,你测量了飞机引擎的一些特征变量,比如引擎运转时产生的热量,或者引擎的振动等...原创 2018-09-11 12:11:05 · 1725 阅读 · 0 评论 -
[吴恩达机器学习笔记]12支持向量机5SVM参数细节
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料 斯坦福大学 2014 机器学习教程中文笔记 by 黄海广12.5 SVM参数细节标记点选取标记点(landmark)如图所示为l(1),l(2),l(3)l(1),l(2),l(3)l^{(1)},l^{(2)},l^{(3)},设核函数为 高斯函数 ,其中设预测函数y=1 i...原创 2018-09-07 20:56:56 · 515 阅读 · 0 评论 -
[吴恩达机器学习笔记]11机器学习系统设计5数据量对机器学习的影响
11. 机器学习系统的设计觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料 斯坦福大学 2014 机器学习教程中文笔记 by 黄海广11.5 数据量对机器学习的影响 Data For Machine Learning 问题引入很多很多年前,我认识的两位研究人员 Michele Banko 和 Eric Brill 进行了一项有趣的研究,他们尝试通...原创 2018-09-04 22:40:17 · 480 阅读 · 0 评论 -
[吴恩达机器学习笔记]11机器学习系统设计3-4/查全率/查准率/F1分数
11. 机器学习系统的设计觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料 斯坦福大学 2014 机器学习教程中文笔记 by 黄海广11.3 偏斜类的误差度量 Error Metrics for Skewed Classes偏斜类 Skewed Classes类偏斜情况表现为训练集中有非常多的同一种类的实例,只有很少或没有其他类的实例...原创 2018-09-04 20:27:01 · 370 阅读 · 0 评论 -
常用数据标准化方法
常用标准化方法觉得有用的话,欢迎一起讨论相互学习~Follow Me 原创文章,如需转载请保留出处Z-scores把数值标准化到Z分数。标准化后的变量均值为0,标准差为1。系统将每一个值减去正被标准化的变量或观测量的均值,再除以标准差。如果原始数据的标准差为0,则所有值置0。Range -1 to 1把数值标准化到-1到1的范围内。选择该项,对每个值用还正...原创 2018-05-07 11:38:25 · 2801 阅读 · 0 评论 -
机器学习数学笔记|偏度与峰度及其python实现
机器学习中的数学觉得有用的话,欢迎一起讨论相互学习~Follow Me 原创文章,如需转载请保留出处 本博客为七月在线邹博老师机器学习数学课程学习笔记矩对于随机变量X,X的K阶原点矩为 E(Xk)E(X^{k})X的K阶中心矩为 E([X−E(X)]k)E([X-E(X)]^{k})期望实际上是随机变量X的1阶原点矩,方差实际上是随机变量X的2阶中心矩变异系数(Coefficie原创 2017-11-14 15:13:45 · 12599 阅读 · 0 评论 -
机器学习数学笔记|期望方差协方差矩阵
机器学习中的数学觉得有用的话,欢迎一起讨论相互学习~Follow Me 原创文章,如需转载请保留出处 本博客为七月在线邹博老师机器学习数学课程学习笔记简单概率计算Example1我们的思路是,若A先到达则假设A是一条长1cm的线段.B出现的概率是一个点,我们只需要让B这个点落在A这条线段上即可.同理,若B先到达,则假设B是一条长2cm的线段,A出现的概率是一个点,我们需要让A落在B这条原创 2017-11-13 18:48:08 · 1677 阅读 · 0 评论 -
机器学习数学笔记|极大似然估计
机器学习中的数学觉得有用的话,欢迎一起讨论相互学习~Follow Me 原创文章,如需转载请保留出处 本博客为七月在线邹博老师机器学习数学课程学习笔记极大似然估计假设D是样本集合,A是参数集合,我们在D样本集固定的情况下,A取何值时,P(A|D)能取到最大.我们现在的主要目的是求1式的最大值,其中1式通过贝叶斯公式能转换为2式的形式,其中2式的分母相同,我们只需要考虑分子即可–即3式,原创 2017-11-17 16:36:06 · 531 阅读 · 0 评论 -
机器学习数学笔记|概率论基础常见概型分布期望与方差
机器学习中的数学觉得有用的话,欢迎一起讨论相互学习~Follow Me 原创文章,如需转载请保留出处 本博客为七月在线邹博老师机器学习数学课程学习笔记概率论对概率的认识,x表示一个事件,则P(x)表示事件发生的概率,其中不可能发生的事件P(x)=0,一定会发生的事件P(x)=1.P(x)∈[0,1]P(x)\in{[0,1]} 但是事件出现的概率是0,并不意味着这个事件不可能发生.概原创 2017-11-13 11:28:00 · 4244 阅读 · 1 评论 -
机器学习数学笔记|Taylor展开式与拟牛顿
机器学习中的数学觉得有用的话,欢迎一起讨论相互学习~Follow Me 原创文章,如需转载请保留出处 本博客为七月在线邹博老师机器学习数学课程学习笔记Taylor 展式与拟牛顿索引taylor展式计算函数值解释gini系数公式平方根公式牛顿法梯度下降算法拟牛顿法 DFPBFGSTaylor公式如果函数在x0点可以计算n阶导数,则有Taylor展开如果取x0=0,则有原创 2017-11-12 16:04:22 · 1091 阅读 · 0 评论 -
[吴恩达机器学习笔记]15非监督学习异常检测4-6构建与评价异常检测系统
15.异常检测 Anomaly detection觉得有用的话,欢迎一起讨论相互学习~Follow Me15.4开发和评价一个异常检测系统 Developing and Evaluating an Anomaly Detection System异常检测算法是一个非监督学习算法,意味着我们无法根据结果变量 y 的值来告诉我们数据是否真的是异常的。我们需要另一种方法来帮助检验算...原创 2018-09-11 15:44:49 · 1533 阅读 · 0 评论