机器学习
文章平均质量分 67
pilipala6868
爱健身的未来程序猿
展开
-
简单梳理对AUC的理解
AUC(Area Under Curve)是机器学习中二分类模型的一个评价指标。定义为ROC曲线中下的面积,但我们先不管定义。 简单解释,AUC代表的是真阳性率(实际阳性、猜测阳性) > 伪阳性率(实际阴性、猜测阳性)的概率。 就拿预测患糖尿病概率这一事例来说,对于真的患有糖尿病的人我们当然应该尽可能预测为阳性,而对没患糖尿病的人应尽可能不预测为阳性,所以真阳性率应该尽...原创 2018-03-25 17:24:15 · 4385 阅读 · 0 评论 -
决策树的ID3、C4.5算法
1、信息熵欲理解ID3算法,首先需要了解一下信息学里的信息熵概念。信息熵是对当前信息情况复杂度、未知度的一种度量,当前情况越复杂,即未知度越高,熵值就越大。举个例子,小明今晚要去电影院看电影,我们想要了解的情况是小明会坐在电影院的哪个位置,这时候有三种情况:1、电影院没有别人,全场50个座位任小明挑选;2、电影院只剩两个处于同个区域的座位;3、电影院一样只剩两个座位,但这两个座位一个在影院的正中间...原创 2018-04-14 15:54:38 · 633 阅读 · 0 评论 -
Scikit-learn:决策树可视化
平常网上看到的关于决策树的Scikit-learn教程大都是直接给出容器的训练、预测代码:clf = tree.DecisionTreeClassifier()clf = clf.fit(X, Y)clf.predict([...]) 然而有时候要的不只是预测数据的结果,选择决策树还想要看到训练出来的决策树是什么样的。于是经过各种搜索,在这里整理一下怎么让生成的决策树可视化。环境安装、配置决策...原创 2018-04-16 18:38:53 · 6906 阅读 · 2 评论