- 博客(28)
- 资源 (1)
- 收藏
- 关注
原创 PCA之sklearn与sparkmllib源码剖析对比
最近在进行sparkmllib的PCA计算结果验证的时候,发现与相同数据集在sklearn下PCA计算的结果相差很大。首先想到了数据的标准化操作,怀疑sklearn有默认参数设置为对输入数据进行标准化处理,接下来进sklearn官网查看PCA参数设置class sklearn.decomposition.PCA(n_components=None, copy=True, whiten=False...
2019-12-11 14:09:58 892 1
原创 决策树
决策树决策树ID3算法C4.5CART算法连续属性离散化过拟合问题决策树辅助决策的树状知识结构,通过将样本分配到某叶子节点来确定样本所属的类别,由决策节点,分支和叶节点组成,目标:使支持分类的属性越少越好,即用很少的属性就能区分出样本类别。首先选取的一些属性就能区分出大部分样本,少量样本需要扩增属性进一步划分算法通常包括三个步骤:特征选择,决策树的生成,决策树的修剪决策树可表示给定特征下类...
2019-12-04 13:54:48 313
原创 03正则表达式
在Python中字符串的匹配方法用于完全匹配s = 'hi csdn'print(s.find('csdn'))#3ret = s.replace('hi','hello')print(ret)#hello csdnprint(s.split(' '))#['hi', 'csdn']正则表达式用于进行字符串的模糊匹配,在Python中通过引入re模块实现import re...
2019-10-29 13:07:00 5330
原创 机器学习01-基础概念公式
最大似然估计似然函数是一种关于统计模型中的参数的函数,表示模型参数的似然性。似然函数取得最大值表示相应的参数能使统计模型最为合理。L(b∣A)=P(A∣B=b)L(b|A)=P(A|B=b)L(b∣A)=P(A∣B=b)假设空间由输入空间到输出空间的所有模型映射的集合损失函数模型输出的预测值f(X)f(X)f(X)与真实值YYY的非负实值函数风险函数(期望损失)模型f(X)f(X...
2019-10-15 12:05:38 193
原创 mAP_Roi
在看一些目标检测的论文时,经常会提到map和fps两个评价指标,下面就来看一下这些评价指标的规则方法。我们在评价一个目标检测算法的“好坏”程度的时候,往往采用的是pascal voc 2012的评价标准mAP。IOU(交并比)衡量预测框和标签框的重合程度。计算mAP这里需要一些混淆矩阵的知识,需要了解TP,FP,TN,FN,precision,recall的概念1.根据IOU计算TP...
2019-10-15 11:25:04 267
原创 深度学习网络典型架构
深度学习网络发展及优化过程简介,典型网络结构:Alexnet,vgg,inception,xception,resnet,densenet,mobilenet
2019-09-24 11:58:26 361
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人