- 博客(5)
- 收藏
- 关注
原创 pandas:数据类型的转换
今天做机器学习实验,我们查看数据类型把类别换成我们需要的合适的类别,为后边的处理做准备。把类别category类型转换成dummy/indicator变量。首先介绍get_dummies():pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None,sparse=False, dro...
2018-12-15 14:46:09 3602
原创 数据结构与算法:已知二叉树两种遍历序列,求第三种遍历序列
在笔试题目中经常碰到此类题目,已知先序遍历序列和中序遍历序列,求后序序列或者已知中序序列和后序序列,求先序遍历序列。其中若已知先序序列和后序序列,无法唯一确定一棵树,所以就无法得知中序序列。1.已知先序遍历序列和中序遍历序列,求后序序列递归的去求解,每次找到子树的根节点与子树序列来求解。2.已知中序序列和后序序列,求出先序遍历序列方法跟前边类似,要根据后后序遍历序列判断根节点...
2018-12-11 20:29:46 1455
原创 机器学习性能度量(2):错误接受率 (FAR), 错误拒绝率(FRR),EER计算方法,python实现
上一篇博文中讨论了两种常用的性能度量查准率(precision)查全率(recall,也叫召回率)对应的P-R图与真正例率(TPR),假正例率(FPR)对应的ROC图。详情请看https://blog.csdn.net/qq_18888869/article/details/84848689。今天介绍另一种常用的人的度量方法FAR,FRR,此方法在识别身份,人脸识别等方面运用较多。1.概念...
2018-12-10 20:56:44 20079 4
原创 python matplotlib:figure,add_subplot,subplot,subplots讲解实现
最近又用到了matplotlib 中画图的函数。总结几个常用的函数的作用于区别。from matplotlib import pyplot as plt1.figure()函数定义matplotlib.pyplot.figure(num=None, figsize=None, dpi=None, facecolor=None, edgecolor=None, frameon=True...
2018-12-07 15:46:23 5138
原创 机器学习性能度量(1):P-R曲线与ROC曲线,python sklearn实现
最近做实验要用到性能度量的东西,之前学习过现在重新学习并且实现一下。衡量模型泛化能力的评价标准,这就是性能度量。性能度量反应了任务需求,在对比不同模型的能力时,使用不同的性能度量往往会导致不同的评判结果;什么样的模型是好的,不仅取决于算法和数据,还决定于任务需求。一、性能度量方法1.1错误率与精度错误率是分类错误的样本数占样本总数的比例,精度是分类正确的样本数占样本总数的比例。...
2018-12-06 15:46:34 7113 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人