![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 89
learning-striving
积跬步以至千里,积细流以成江海。
展开
-
字典特征提取、文本特征提取、jieba分词处理、tf-idf文本特征提取概念及代码实现
字典特征提取、文本特征提取、jieba分词处理、tf-idf文本特征提取概念及代码实现,特征提取:将任意数据(如文本或图像)转换为可用于机器学习的数字特征,特征值化是为了计算机更好的去理解数据原创 2023-01-06 20:20:54 · 1625 阅读 · 0 评论 -
决策树及分类原理与划分依据:信息熵、信息增益、信息增益率、基尼值和基尼指数
决策树:是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果,本质是一颗由多个判断节点组成的树熵(Entropy):物理学上是“混乱”程度的量度,系统越有序,熵值越低;系统越混乱或者分散,熵值越高从信息的完整性上进行的描述:当系统的有序状态一致时,**数据越集中的地方熵值越小,数据越分散的地方熵值越大从信息的有序性上进行的描述:当数据量一致时,系统越有序,熵值越低,系统越混乱或者分散,熵值越高1948年香农提出了信息熵(Entro原创 2022-12-27 23:57:53 · 5886 阅读 · 2 评论 -
机器学习相关名词解释【学习笔记】
机器学习、深度学习和神经网络相关名词解释原创 2022-08-16 21:54:28 · 1652 阅读 · 0 评论 -
机器学习及其分类
机器学习及其分类原创 2022-08-09 22:01:35 · 2078 阅读 · 0 评论 -
机器学习训练集、验证集、测试集,分类问题和回归问题评估指标,交叉验证法,macro avg与weighted avg含义,roc_auc_score与classification_report函数
机器学习训练集、验证集、测试集,分类问题和回归问题评估指标,数据集划分方式:交叉验证法,precision、recall、f1-score与accuracy介绍,maro avg:宏平均,计算方式为每个类型的算术平均,weighted avg:加权平均,是用每个类型样本数量与对应权重相乘再除以所有类别的样本总数,ROC、AUC原创 2022-08-09 17:07:37 · 7719 阅读 · 2 评论