自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

转载 奇异值

奇异值的物理意义是什么? - 知乎 https://www.zhihu.com/question/22237507

2018-08-02 11:26:37 831

转载 matlab中size()函数的用法

 size():获取矩阵的行数和列数(1)s=size(A),         当只有一个输出参数时,返回一个行向量,该行向量的第一个元素时矩阵的行数,第二个元素是矩阵的列数。(2)[r,c]=size(A),         当有两个输出参数时,size函数将矩阵的行数返回到第一个输出变量r,将矩阵的列数返回到第二个输出变量c。(3)size(A,n)如果在size函数的输入参数中再添加一项n,...

2018-05-17 10:55:32 1244

转载 split()用法

定义和用法:  split() 方法用于把一个字符串分割成字符串数组。  语法:  stringObject.split(separator,howmany)  返回值:  一个字符串数组。该数组是通过在 separator 指定的边界处将字符串 stringObject 分割成子串创建的。返回的数组中的字串不包括separator 自身。  但是,如果 separator 是包含子表达式的正则表...

2018-04-19 10:37:21 449

转载 用python绘制ROC曲线并计算AUC

AUC介绍AUC(Area Under Curve)是机器学习二分类模型中非常常用的评估指标,相比于F1-Score对项目的不平衡有更大的容忍性,目前常见的机器学习库中(比如scikit-learn)一般也都是集成该指标的计算,其计算原理可以参考这个ROC和AUC介绍以及如何计算AUC ,但是有时候模型是单独的或者自己编写的,此时想要评估训练模型的好坏就得自己搞一个AUC计算模块,本文在查询资料时...

2018-04-17 16:42:58 4304 1

转载 正则表达式之re模块compile()

定义: compile(pattern[,flags] ) 根据包含正则表达式的字符串创建模式对象。compile(pattern, flags=0) 通过help可以看到compile方法的介绍,返回一个pattern对象,但是却没有对第二个参数flags进行介绍。第二个参数flags是匹配模式,可以使用按位或’|’表示同时生效,也可以在正则表达式字符串中指定。Pattern对象是不能直接实例化...

2018-04-17 14:16:07 3432

转载 正则表达式之re模块findall()

[python] view plain copy>>> import re >>> s = "adfad asdfasdf asdfas asdfawef asd adsfas " >>> reObj1 = re.compile('((\w+)\s+\w+)') >>> reObj1.findall(

2018-04-17 14:01:50 270

转载 朴素贝叶斯

#---------------------------从文本中构建词条向量-------------------------#1 要从文本中获取特征,需要先拆分文本,这里特征是指来自文本的词条,每个词#条是字符的任意组合。词条可以理解为单词,当然也可以是非单词词条,比如URL#IP地址或者其他任意字符串 #  将文本拆分成词条向量后,将每一个文本片段表示为一个词条向量,值为1表示出现#在文档中,...

2018-04-08 10:53:43 160

转载 matplotlib系列二

首先,我们来绘制一个figure对象。立马就会生成一个这样的窗口:好,这是第一步。但是不能通过空figure绘图。必须使用add_subplot()创建一个或多个subplot才行。看以上三行代码,figure变成了这样:这三行代码的意思是:图像是2X2的,且当前选中是4个中的第n个。(222)就是2X2 中的第二2,(2,2,3)就是2X2中的第三个。可分割也可不分割,当超过10的话需要分割了吧...

2018-03-30 11:47:53 197

转载 matplotlib系列一

实现一个最简单的plot函数调用:1 import matplotlib.pyplot as plt2 3 y=pp.DS.Transac_open # 设置y轴数据,以数组形式提供4 5 x=len(y) # 设置x轴,以y轴数组长度为宽度6 x=range(x) # 以0开始的递增序列作为x轴数据7 8 plt.plot(x,y) # 只提供x...

2018-03-30 11:35:31 132

转载 Python strip()

Python strip() 方法用于移除字符串头尾指定的字符(默认为空格)。语法strip()方法语法:str.strip([chars]);参数chars -- 移除字符串头尾指定的字符。 返回值 返回移除字符串头尾指定的字符生成的新字符串。实例 以下实例展示了strip()函数的使用方法:?12345678#!/usr/bin/python# -*- coding: UTF-8 -*-  s...

2018-03-30 11:34:59 677

转载 numpy.zeros

用法:zeros(shape, dtype=float, order='C')返回:返回来一个给定形状和类型的用0填充的数组;参数:shape:形状            dtype:数据类型,可选参数,默认numpy.float64            dtype类型:t ,位域,如t4代表4位                                 b,布尔值,true or fal...

2018-03-30 10:52:43 1073

转载 Python3 字典 get() 方法

描述Python 字典 get() 函数返回指定键的值,如果值不在字典中返回默认值。语法get()方法语法:dict.get(key, default=None)参数key -- 字典中要查找的键。default -- 如果指定键的值不存在时,返回该默认值值。返回值返回指定键的值,如果值不在字典中返回默认值 None。实例以下实例展示了 get()函数的使用方法:#!/usr/bin/python...

2018-03-29 15:24:45 2748

转载 argsort()函数

1 import numpy as np2 x=np.array([1,4,3,-1,6,9])2.现在我们可以看看argsort()函数的具体功能是什么:x.argsort()输出定义为y=array([3,0,2,1,4,5])。我们发现argsort()函数是将x中的元素从小到大排列,提取其对应的index(索引),然后输出到y。例如:x[3]=-1最小,所以y[0]=3,x[5]=9最大...

2018-03-29 13:00:01 2239

转载 python里面的sum函数.sum(axis=1)

看起来挺简单的样子,但是在给sum函数中加入参数。sum(a,axis=0)或者是.sum(axis=1) 就有点不解了在我实验以后发现 我们平时用的sum应该是默认的axis=0 就是普通的相加 而当加入axis=1以后就是将一个矩阵的每一行向量相加例如:import numpy as npnp.sum([[0,1,2],[2,1,3],axis=1)结果就是:array([3,6])  下面是...

2018-03-29 12:50:25 322

转载 Numpy的tile函数

tile函数是模板numpy.lib.shape_base中的函数。函数的形式是tile(A,reps)A的类型众多,几乎所有类型都可以:array, list, tuple, dict, matrix以及基本数据类型int, string, float以及bool类型。reps的类型也很多,可以是tuple,list, dict, array, int,bool.但不可以是float, stri...

2018-03-29 11:55:12 141

转载 SVM之多类分类问题

“一对多”的方法       One-Against-All这个方法还是比较容易想到的。就是每次仍然解一个两类分类的问题。比如我们5个类别,第一次就把类别1的样本定为正样本,其余2,3,4,5的样本合起来定为负样本,这样得到一个两类分类器,它能够指出一个样本是还是不是第1类的;第二次我们把类别2 的样本定为正样本,把1,3,4,5的样本合起来定为负样本,得到一个分类器,如此下去,我们可以得到5个这...

2018-03-22 14:54:10 2227

转载 SVM支持向量机一些重要算法二

五、核函数       如果我们的正常的样本分布如下图左边所示,之所以说是正常的指的是,不是上面说的那样由于某些顽固的离群点导致的线性不可分。它是真的线性不可分。样本本身的分布就是这样的,如果也像样本那样,通过松弛变量硬拉一条线性分类边界出来,很明显这条分类面会非常糟糕。那怎么办呢?SVM对线性可分数据有效,对不可分的有何应对良策呢?是核方法(kernel trick)大展身手的时候了。     ...

2018-03-22 14:35:51 342

转载 SVM的一些重要算法

线性可分SVM与硬间隔最大化      其实上面这种分类思想就是SVM的思想。可以表达为:SVM试图寻找一个超平面来对样本进行分割,把样本中的正例和反例用超平面分开,但是不是很敷衍地简单的分开,而是尽最大的努力使正例和反例之间的间隔margin最大。这样它的分类结果才更加可信,而且对于未知的新样本才有很好的分类预测能力(机器学习美其名曰泛化能力)。      我们的目标是寻找一个超平面,使得离超平...

2018-03-22 11:51:24 381

转载 机器学习之拉格朗日乘子法(Lagrange Multiplier) 和KKT条件

在求取有约束条件的优化问题时,拉格朗日乘子法(Lagrange Multiplier) 和KKT条件是非常重要的两个求取方法,对于等式约束的优化问题,可以应用拉格朗日乘子法去求取最优值;如果含有不等式约束,可以应用KKT条件去求取。当然,这两个方法求得的结果只是必要条件,只有当是凸函数的情况下,才能保证是充分必要条件。KKT条件是拉格朗日乘子法的泛化。之前学习的时候,只知道直接应用两个方法,但是却...

2018-03-22 11:30:22 919

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除