机器学习
亲爱的你大事不妙
学到头秃
展开
-
机器学习的流程
机器学习流程数据加载 —> 数据清洗 —> 选取特征属性以及目标属性y —>数据集划分 —> 特征工程 —> 模型构建 —> 模型训练 —> 模型评估 —> 模型持久化其中,特征工程对于机器学习的模型的好坏至关重要。...原创 2020-08-16 19:22:14 · 106 阅读 · 0 评论 -
相似度的几种常见计算方法
相似度的计算现有的关于相似度计算的方法,基本上都是基于向量的,也即计算两个向量之间的距离,距离越近越相似。下面是几种常见的相似度计算方法。1.杰卡德相似系数Jaccard(杰卡德)相似性系数主要用于计算符号度量或布尔值度量的样本间的相似度。Jaccard(杰卡德)系数等于样本集交集的个数和样本集并集个数的比值。 Jaccard(杰卡德)距离是用两个集合中不同元素所占元素的比例来衡量两个集合(样本)的区分度。Jaccard系数主要的应用的场景有:1).过原创 2020-07-15 15:30:58 · 34328 阅读 · 0 评论 -
机器学习中的三个评价指标
机器学习中的评价模型性能的指标混淆矩阵1)根据下面的混淆矩阵,我们可以得到下面几个指标,他们是一级指标:真实值是positive,模型认为是positive的数量(True Positive=TP) 真实值是positive,模型认为是negative的数量(False Negative=FN):这就是统计学上的第二类错误(Type II Error) 真实值是negative,模型认为是positive的数量(False Positive=FP):这就是统计学上的第一类错误(Type I Err原创 2020-07-16 18:11:58 · 714 阅读 · 0 评论