机器学习-专项训练
最新推荐文章于 2024-04-04 00:00:00 发布
准确率是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率
召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率
为了解决准确率和召回率冲突问题,引入了F1分数
规则归纳方法
贝叶斯分类方法
决策树分类方法
基于距离的分类方法
最小最大损失准则
N-P判决
最小二乘-Square loss
SVM-Hinge Loss
Logistic Regression-(log-Loss)
AdaBoost-指数损失函数
CURE算法
ROCK算法
Chameleon算法
BIRCH算法
数据
分析
在训练样本较多的类别中进行欠采样
直接基于原数据集进行学习,对预测值进行再缩放处理
通过对反例中的数据进行插值,来产生额外的反例
神经网络
K-Mean
x+2y=3
在现有模型上,加入新的变量,所得到的R^2的值总会增加
统计
人工智能
对大数据集有较高的效率并且具有可伸缩性。
是一种无监督学习方法。
k值无法自动获取,初始聚类中心随机选择。
感知准则函数
支持向量机
Fisher准则
每次使用K-means算法得到的聚类结果可能会不一样