![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 91
jmu xzh_0618
在读大学生
展开
-
机器学习-PR曲线与ROC曲线
① 在评估二分类模型的性能时,确保有预测结果的样本标签和概率(或得分):在绘制精确度-召回率曲线和ROC曲线之前,确保你有每个样本的预测结果(类别标签,通常是二元的正例或负例)以及与该预测相关的概率或得分。PR曲线中的P代表的是precision(查准率 / 精准率),R代表的是recall(查全率 / 召回率),其代表的是精准率与召回率的关系,一般情况下,将recall设置为横坐标,precision设置为纵坐标。通常,横坐标为召回率(R),纵坐标为精确率(P),并通过连接这些数据点来生成PR曲线。原创 2023-10-23 21:17:49 · 69 阅读 · 0 评论 -
特征预处理:归一化
在机器学习和数据分析中,特征预处理是一个至关重要的步骤,它有助于提高模型的性能并确保数据的一致性。归一化是特征预处理中的一种常见方法,它可以将特征值缩放到相同的尺度范围,从而避免特征之间的差异影响模型训练。在本文中,我们将探讨不同的归一化方法、它们的优缺点以及适用场景。原创 2023-08-07 18:29:20 · 144 阅读 · 0 评论 -
机器学习-文本特征提取(TF-IDF):使用人工智能探索文本信息
在当今信息爆炸的时代,文本数据的规模不断增长,从社交媒体帖子到新闻文章,都蕴含着无尽的宝贵信息。为了从这些海量的文本数据中提取有价值的信息,机器学习领域涌现出了许多有效的技术。其中,TF-IDF(Term Frequency-Inverse Document Frequency)是一种常用且有效的文本特征提取方法。本文将深入探讨TF-IDF的原理、应用和实际案例,带你走进文本特征提取的精彩世界。原创 2023-08-06 18:11:48 · 643 阅读 · 0 评论