算法
文章平均质量分 57
张五儿
这个作者很懒,什么都没留下…
展开
-
二分类模型评估
分类算法最常见的指标是分类准确率(accuracy),而当样本中的分类极度不均衡时,accuracy不能说明问题(例如在100个观测样本中,有95个0,5个1,全部预测为0,accuracy是95%,已经很高了)。一般我们用混淆矩阵(Confusion matrix)来描述二分类的好坏,也通过此矩阵衍生出一系列指标。举例:ROC曲线ROC意指Receiver Operating Ch...原创 2019-10-03 15:09:20 · 1509 阅读 · 1 评论 -
聚类算法学习笔记
https://nbviewer.jupyter.org/github/CDA-zhanghuarui/-/blob/master/cluster%E7%AE%97%E6%B3%95%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0.ipynb原创 2019-10-08 11:51:36 · 202 阅读 · 1 评论 -
集成算法学习笔记
https://nbviewer.jupyter.org/github/CDA-zhanghuarui/-/blob/master/%E9%9B%86%E6%88%90%E7%AE%97%E6%B3%95%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0.ipynb原创 2019-10-08 16:25:57 · 164 阅读 · 0 评论 -
特征工程之数据预处理(笔记)
特征工程:对原始数据进行一系列工程处理,将其提炼为特征,作为输入供算法和模型使用。特征工程的目的:去除原数据中的杂项和冗余,设计更高效的特征以刻画要求解的问题和预测模型之间的关系。特征工程的重要性:**1.特征越好,灵活性越强。**好的特征的灵活性在于它允许你选择不复杂的模型,同时运行速度也更快,也更容易和维护。**2.特征越好,构建的模型越简单。**好的特征可以在参数不是最优的情况,依然...原创 2019-10-09 19:20:30 · 4097 阅读 · 0 评论 -
决策树(学习笔记)
算法学习算法理解决策树的本质就是从数据集中归纳出一组分类规则,也称‘树归纳’,对于给定数据集,存在许多对他无错编码的树,我们感兴趣的是从中选出最小的树(树的结点数和决策结点的复杂性度量)。(一个if-then规则的集合)从另一个角度看,决策树学习是根据训练数据集估计条件概率模型。基于特征空间划分的类的条件概率模型有无数个,我们选择的数据应该是不仅能对训练数据有很好的拟合,而且对未知数据也有...原创 2019-11-29 11:07:07 · 867 阅读 · 0 评论 -
KNN(学习笔记)
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = 'SimHei' ## 设置中文显示# plt.rcParams['font.family']='Arial Unicode MS' # mac中文显示plt.rcParams['ax...原创 2019-11-22 20:38:25 · 223 阅读 · 0 评论