机器学习
文章平均质量分 76
weixin_42024142
这个作者很懒,什么都没留下…
展开
-
用高斯混合模型分类三维数据
理论高斯混合模型的和详细的EM算法推导见《统计学习方法》这里说明一点:EM算法叫期望极大算法,是先在当前参数下求得完全分布对于隐变量的期望,然后求解对数似然的最大化问题,以获得新一轮迭代的参数。其中核心在于Q函数Q(θ,θ(i))Q(\theta,\theta^{(i)})Q(θ,θ(i)),Q函数是完全数据的对数似然函数logP(Y,Z∣θ)logP(Y,Z|\theta)logP(Y,Z∣θ),关于在给定的观测数据YYY和当前参数θ(i)\theta^{(i)}θ(i)下对未观测数据ZZZ的条原创 2021-03-02 00:55:29 · 1857 阅读 · 0 评论 -
DCIC2021-早高峰共享单车潮汐点的群智优化-算法分析题
1.熟悉比赛提交过程本次比赛用sftp提交各种文件,关于sftp可以参考这篇博文,SFTP.使用SFTP上传文件可以用工具或者命令行。尝试用powershell 提交会出现 登录失败的问题。所以用FileZilla提交,下载连接,用户界面非常友好,比赛官方提供的操作手册也很详细。成功提交,后续优化算法留待更新。...原创 2021-02-20 01:56:26 · 243 阅读 · 0 评论 -
Data Mining Chapter.5 Credibility: Evaluating What’s Been Learned
评估可信度,评估学习结果1.训练和测试2.预测的 性能3.交叉验证4.其他评估方法5.数据挖掘方法比较可信度,评估学习结果评估是数据挖掘关键的一环,我们需要能预测在实际中的性能的评估方法,即在任何能得到的数据集上的能力。1.训练和测试一般学习方法包括两个阶段,第一阶段建立基本结构,第二阶段对结构包含参数进行优化(超参数调参)。这两阶段需要用不同的数据集。但是,所有数据都不可用于估计误差率。training data, validation data,test data。2.预测的 性能测试集的误原创 2021-02-04 01:01:54 · 127 阅读 · 0 评论 -
Data Mining Practical Machine Learning Tools and Techniques
4.数据挖掘基本方法在这一章中,我们来看一下基本思想。最具启发性的教训之一是,简单的想法往往非常有效,我们强烈建议在分析实际数据集时采用“简单性优先”的方法。数据集可以展示许多不同类型的简单结构八种不同数据结构类型只有一个属性完成所有的工作,而其他属性则是不相关或冗余的。属性可能独立地、平等地对最终结果作出贡献。属性具有简单的逻辑结构,只涉及几个属性,这些属性可以被决策树捕获。可能会有一些独立的规则来管理将实例分配给不同的类。属性不同子集之间相互依赖。涉及到数字属性之间的线性依赖,重点是原创 2021-01-19 16:13:42 · 306 阅读 · 0 评论 -
数据挖掘算法
数据挖掘聚类聚类算法主要聚类算法1. k-means1.1优化目标1.2 缺点1.3 变种2. Affinity Propagation2.1 方法描述2.2算法分析3. Mean Shift3.1 算法描述4. Spectral Clustering4.1 算法描述4.2 算法分析5. Hierarchical clustering算法实现6. DBSCAN7. OPTICS8. Birch算法描述9. EM聚类算法部分内容来自:深入浅出聚类算法python聚类算法sklearn中文文档,聚类原创 2021-01-14 09:36:10 · 506 阅读 · 0 评论