![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
一个会写代码的老爷爷
这个作者很懒,什么都没留下…
展开
-
决策树-特征选择
决策树的特征选择标准有两种:信息增益,信息增益比0.熵指不稳定程度。熵越大,不稳定程度越高,则越容易分裂。决策树中也指某结点内含信息量较多,分类能力较差.计算公式: H(X)=-∑Pi logPi其中,Pi为随机变量X在样本空间的分布,即第i个类型出现的概率。∑为i到n求和。n为特征取值种类数量.PS:为何使用这样的一个函数?XlogX的函数图像:从图像中可以看出,在Pi取0.5附近时函数取...原创 2018-03-16 14:04:35 · 1640 阅读 · 0 评论 -
可视化利器-matplotlib
本文介绍了matplotlib的基本使用,以及常用图形的绘制代码封装。 可视化,强大,接口多,可以直观了解数据尽量使用numpy.array绘制,图像基本构成:Data: 数据区,包括数据点、描绘形状Axis: 坐标轴,包括 X 轴、 Y 轴及其标签、刻度尺及其标签Title: 标题,数据图的描述Legend: 图例,区分图中包含的多种曲线或不同分类的数据其他的还有图形文本 (Text)、注解 (Annotate)等其他描述常用图形:官方文档 https://mat...原创 2018-03-01 11:25:32 · 345 阅读 · 0 评论