machine-learning
文章平均质量分 55
yangccnn
这个作者很懒,什么都没留下…
展开
-
精确率 召回率 F1值 准确率 ROC曲线 AUC评价指标
对于二分类问题来说,经过分类器分类后一般会出现下面四种情况(假设positive表正类,negative表负类):将正类预测为正类,记该类样本数为TP (true positive)将正类预测为负类,记该类样本数为FN (false negative)将负类预测为正类,记该类样本数为FP (false positive)将负类预测为负类,记该类样本数为TN (true negative)混原创 2017-09-23 16:11:26 · 1235 阅读 · 0 评论 -
pandas numpy常用函数
python pandas numpy原创 2017-09-19 20:34:42 · 1186 阅读 · 0 评论 -
机器学习模型和算法学习随记
机器学习模型 算法 流程 注意原创 2017-09-04 20:20:18 · 424 阅读 · 0 评论 -
【读书笔记】数理统计学教程 (一)
自己好多数理统计和概率论的知识忘光了,打算沉下心读一读陈老师和倪老师的《数理统计学教程》,回顾以前学过的知识,学习新的知识。后面会记录每一章的知识点,自己的疑问和寻求的答案,希望自己能坚持下来。第一章 基本概念样本和样本分布统计模型就是概率分布,样本分布概率论是统计的基础,统计是概率论的一种应用“总体”的概念总体:估计一个物体重量时,用天平重复称量n次,结果记为X1, X2… Xn。这就是样本原创 2017-08-28 10:09:54 · 2167 阅读 · 1 评论 -
【读书笔记】数据挖掘导论(Introduction to Data Mining) 1
第二章 数据2-1 数据类型如下性质来描述属性 (1) 相异性 = 和 ≠ (2) 序 <, <=, >, >= (3) 加法 (4) 乘法从而定义四种类型 :标称,序数,区间,比率 标称:分类的(定性的)(= 和 ≠) 区分对象 如id等 序数:分类的 (< , >)如矿石硬度等 区间:定量的 (+, -) 值间差异有意义,如温度 比率:定量的 (*, /) 数据集的一般特原创 2017-08-25 17:34:44 · 1724 阅读 · 0 评论 -
【weekly-sharing】决策树简介
决策树简介原创 2017-12-04 15:02:04 · 255 阅读 · 0 评论 -
【weekly-sharing】拉格朗日对偶和线性可分支持向量机
拉格朗日对偶和线性可分支持向量机总结拉格朗日对偶并没有改变原始问题的最优解拉格朗日对偶将支持向量机问题的不等式约束转为了等式约束在上的线性可分支持向量机问题中,原始问题求解的复杂度与特征维度(w,b)有关,而对偶问题求解的复杂度与样本数量(拉格朗日乘子α\alpha的维度)有关线性可分支持向量机其实不一定要用拉格朗日对偶的方法来改变其求解算法的复杂度,因为其输入的特征维度一般低于样本数量。但原创 2017-11-20 10:22:21 · 333 阅读 · 0 评论 -
【weekly-sharing】学习可行性推导记录
学习可行性推导记录原创 2017-11-17 10:46:08 · 244 阅读 · 0 评论 -
【weekly-sharing】反向传播算法在神经网络的应用
反向传播算法在神经网络的应用当通过神经网络输入xx,得到输出y^\hat{y}时,这些信息通过神经网络向前流动,这称之为前向传播(forward propagation)。在网络得到输出时会得到一个代价函数,允许来自代价函数的信息通过网络向后流动,来计算梯度的过程叫反向传播(back propagation)反向传播算法主要用于计算梯度基础导数 描述函数变化率方向导数 某个方向上的导数梯度原创 2017-11-05 19:12:29 · 938 阅读 · 0 评论