概念摘要

最新推荐文章于 2023-06-25 20:05:49 发布

Spring_Hong

最新推荐文章于 2023-06-25 20:05:49 发布

阅读量483

点赞数 1

文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hongtinghua/article/details/81382175

版权

本文介绍了机器学习中的数据清洗、转换，以及数据规约方法。详细讲解了无监督学习中的聚类算法，包括K均值、分层聚类，并讨论了欧氏距离、非欧距离及其在分类中的应用。此外，还探讨了监督学习、决策树、概率分类器和核方法，如SVM和高斯过程。最后，提到了神经网络、回归分析以及评估指标和泛化能力的重要性。

摘要由CSDN通过智能技术生成

1.数据清洗，数据转化：将数据集转化为机器学习要求的格式，归一化，平均，方差，离散化。等等
2.mean（X)：求平均，如果该X是数组就求数组平均，如果是矩阵就按照列求平均。mean(A,1) = mean(A)，mean(A,2)是矩阵求各行的均值
3.st.dev:基于样本估算标准偏差。标准偏差反映数值相对于平均值(mean) 的离散程度。
这里写图片描述
4.数据规约：剔除异常数据，将数据降维（剔除不必要的纬度）(方法：SVD奇异值分解，PCA主成分分析)，数据实例过多的情况下，选取实例子集
5.无监督学习：从没有标签的数据中发现隐藏的结构，类似推荐系统。欧氏距离和非欧距离
6.欧氏距离：在n纬空间中，计算两个元素的距离，常称为P-范数距离，有L1和L2两种
L1（欧氏距离）：各个维度差的平方求和的平方根
L2（曼哈顿距离）：各个维度差的绝对值之和
7.非欧距离：基于元素的属性而非空间位置，比较有名的包括杰卡德距离，余弦距离，编辑距离，汉明距离
杰卡德距离：两个集合之间的相似度

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
概念摘要

1.数据清洗，数据转化：将数据集转化为机器学习要求的格式，归一化，平均，方差，离散化。等等 2.mean（X)：求平均，如果该X是数组就求数组平均，如果是矩阵就按照列求平均。mean(A,1) = mean(A)，mean(A,2)是矩阵求各行的均值 3.st.dev:基于样本估算标准偏差。标准偏差反映数值相对于平均值(mean) 的离散程度。 4.数据规约：剔除异常数据，将数据降维（剔除不...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。