数据挖掘
文章平均质量分 82
Aria_So
这个作者很懒,什么都没留下…
展开
-
数据挖掘导论 Chapter4 读书笔记
在极度不平衡的数据下(Positive的样本较少),PR曲线可能比ROC曲线更实用。:是以假正率(FP_rate)和假负率(TP_rate)为轴的曲线,如L1和L2。= TN/N,表示的是所有负例中被分对的比例,衡量了分类器对负例的识别能力。= TP/P,表示的是所有正例中被分对的比例,衡量了分类器对正例的识别能力。= (FP+FN)/(TP+TN+FP+FN),与ACC是互斥事件。= TP/(TP+FP),即被分为正例的示例中实际为正例的比例。:分类器训练和预测需要的时间。:处理缺失值和异常值的能力。原创 2023-07-22 00:49:07 · 135 阅读 · 0 评论 -
数据挖掘导论 Chapter1~2读书笔记
数据挖掘是数据库中知识发现的一部分。知识发现KDD是将未加工的数据转换为有用信息的整个过程,包括输入数据、数据预处理、数据挖掘、数据后处理、输出信息。原创 2023-07-22 00:45:18 · 145 阅读 · 0 评论