qq_35311970-CSDN博客

转载奇异值

奇异值的物理意义是什么？ - 知乎 https://www.zhihu.com/question/22237507

2018-08-02 11:26:37 831

转载 matlab中size()函数的用法

size（）：获取矩阵的行数和列数（1）s=size(A), 当只有一个输出参数时，返回一个行向量，该行向量的第一个元素时矩阵的行数，第二个元素是矩阵的列数。（2）[r,c]=size(A), 当有两个输出参数时，size函数将矩阵的行数返回到第一个输出变量r，将矩阵的列数返回到第二个输出变量c。（3）size(A,n)如果在size函数的输入参数中再添加一项n，...

2018-05-17 10:55:32 1244

定义和用法：　　split() 方法用于把一个字符串分割成字符串数组。　　语法：　　stringObject.split(separator,howmany)　　返回值：　　一个字符串数组。该数组是通过在 separator 指定的边界处将字符串 stringObject 分割成子串创建的。返回的数组中的字串不包括separator 自身。　　但是，如果 separator 是包含子表达式的正则表...

2018-04-19 10:37:21 449

转载用python绘制ROC曲线并计算AUC

AUC介绍AUC(Area Under Curve)是机器学习二分类模型中非常常用的评估指标，相比于F1-Score对项目的不平衡有更大的容忍性，目前常见的机器学习库中(比如scikit-learn)一般也都是集成该指标的计算，其计算原理可以参考这个ROC和AUC介绍以及如何计算AUC ，但是有时候模型是单独的或者自己编写的，此时想要评估训练模型的好坏就得自己搞一个AUC计算模块，本文在查询资料时...

2018-04-17 16:42:58 4304 1

转载正则表达式之re模块compile()

定义： compile(pattern[,flags] ) 根据包含正则表达式的字符串创建模式对象。compile(pattern, flags=0) 通过help可以看到compile方法的介绍，返回一个pattern对象，但是却没有对第二个参数flags进行介绍。第二个参数flags是匹配模式，可以使用按位或’|’表示同时生效，也可以在正则表达式字符串中指定。Pattern对象是不能直接实例化...

2018-04-17 14:16:07 3432

转载正则表达式之re模块findall()

[python] view plain copy>>> import re >>> s = "adfad asdfasdf asdfas asdfawef asd adsfas " >>> reObj1 = re.compile('((\w+)\s+\w+)') >>> reObj1.findall(

2018-04-17 14:01:50 270

转载朴素贝叶斯

#---------------------------从文本中构建词条向量-------------------------#1 要从文本中获取特征，需要先拆分文本，这里特征是指来自文本的词条，每个词#条是字符的任意组合。词条可以理解为单词，当然也可以是非单词词条，比如URL#IP地址或者其他任意字符串 # 将文本拆分成词条向量后，将每一个文本片段表示为一个词条向量，值为1表示出现#在文档中，...

2018-04-08 10:53:43 160

转载 matplotlib系列二

首先，我们来绘制一个figure对象。立马就会生成一个这样的窗口：好，这是第一步。但是不能通过空figure绘图。必须使用add_subplot()创建一个或多个subplot才行。看以上三行代码，figure变成了这样：这三行代码的意思是：图像是2X2的，且当前选中是4个中的第n个。（222）就是2X2 中的第二2，（2,2,3）就是2X2中的第三个。可分割也可不分割，当超过10的话需要分割了吧...

2018-03-30 11:47:53 197

转载 matplotlib系列一

实现一个最简单的plot函数调用：1 import matplotlib.pyplot as plt2 3 y=pp.DS.Transac_open # 设置y轴数据，以数组形式提供4 5 x=len(y) # 设置x轴，以y轴数组长度为宽度6 x=range(x) # 以0开始的递增序列作为x轴数据7 8 plt.plot(x,y) # 只提供x...

2018-03-30 11:35:31 132

转载 Python strip()

Python strip() 方法用于移除字符串头尾指定的字符（默认为空格）。语法strip()方法语法：str.strip([chars]);参数chars -- 移除字符串头尾指定的字符。返回值返回移除字符串头尾指定的字符生成的新字符串。实例以下实例展示了strip()函数的使用方法：?12345678#!/usr/bin/python# -*- coding: UTF-8 -*- s...

2018-03-30 11:34:59 677

转载 numpy.zeros

用法：zeros(shape, dtype=float, order='C')返回：返回来一个给定形状和类型的用0填充的数组；参数：shape:形状 dtype:数据类型，可选参数，默认numpy.float64 dtype类型：t ,位域,如t4代表4位 b,布尔值，true or fal...

2018-03-30 10:52:43 1073

转载 Python3 字典 get() 方法

描述Python 字典 get() 函数返回指定键的值，如果值不在字典中返回默认值。语法get()方法语法：dict.get(key, default=None)参数key -- 字典中要查找的键。default -- 如果指定键的值不存在时，返回该默认值值。返回值返回指定键的值，如果值不在字典中返回默认值 None。实例以下实例展示了 get()函数的使用方法：#!/usr/bin/python...

2018-03-29 15:24:45 2748

转载 argsort()函数

1 import numpy as np2 x=np.array([1,4,3,-1,6,9])2.现在我们可以看看argsort()函数的具体功能是什么：x.argsort()输出定义为y=array([3,0,2,1,4,5])。我们发现argsort()函数是将x中的元素从小到大排列，提取其对应的index(索引)，然后输出到y。例如：x[3]=-1最小，所以y[0]=3,x[5]=9最大...

2018-03-29 13:00:01 2239

转载 python里面的sum函数.sum(axis=1)

看起来挺简单的样子，但是在给sum函数中加入参数。sum（a，axis=0）或者是.sum(axis=1) 就有点不解了在我实验以后发现我们平时用的sum应该是默认的axis=0 就是普通的相加而当加入axis=1以后就是将一个矩阵的每一行向量相加例如：import numpy as npnp.sum([[0,1,2],[2,1,3],axis=1)结果就是：array（[3,6]）下面是...

2018-03-29 12:50:25 322

转载 Numpy的tile函数

tile函数是模板numpy.lib.shape_base中的函数。函数的形式是tile(A,reps)A的类型众多，几乎所有类型都可以：array, list, tuple, dict, matrix以及基本数据类型int, string, float以及bool类型。reps的类型也很多，可以是tuple，list, dict, array, int,bool.但不可以是float, stri...

2018-03-29 11:55:12 141

转载 SVM之多类分类问题

“一对多”的方法 One-Against-All这个方法还是比较容易想到的。就是每次仍然解一个两类分类的问题。比如我们5个类别，第一次就把类别1的样本定为正样本，其余2，3，4，5的样本合起来定为负样本，这样得到一个两类分类器，它能够指出一个样本是还是不是第1类的；第二次我们把类别2 的样本定为正样本，把1，3，4，5的样本合起来定为负样本，得到一个分类器，如此下去，我们可以得到5个这...

2018-03-22 14:54:10 2227

转载 SVM支持向量机一些重要算法二

五、核函数如果我们的正常的样本分布如下图左边所示，之所以说是正常的指的是，不是上面说的那样由于某些顽固的离群点导致的线性不可分。它是真的线性不可分。样本本身的分布就是这样的，如果也像样本那样，通过松弛变量硬拉一条线性分类边界出来，很明显这条分类面会非常糟糕。那怎么办呢？SVM对线性可分数据有效，对不可分的有何应对良策呢？是核方法（kernel trick）大展身手的时候了。 ...

2018-03-22 14:35:51 342

转载 SVM的一些重要算法

线性可分SVM与硬间隔最大化其实上面这种分类思想就是SVM的思想。可以表达为：SVM试图寻找一个超平面来对样本进行分割，把样本中的正例和反例用超平面分开，但是不是很敷衍地简单的分开，而是尽最大的努力使正例和反例之间的间隔margin最大。这样它的分类结果才更加可信，而且对于未知的新样本才有很好的分类预测能力（机器学习美其名曰泛化能力）。我们的目标是寻找一个超平面，使得离超平...

2018-03-22 11:51:24 381

转载机器学习之拉格朗日乘子法（Lagrange Multiplier) 和KKT条件

在求取有约束条件的优化问题时，拉格朗日乘子法（Lagrange Multiplier) 和KKT条件是非常重要的两个求取方法，对于等式约束的优化问题，可以应用拉格朗日乘子法去求取最优值；如果含有不等式约束，可以应用KKT条件去求取。当然，这两个方法求得的结果只是必要条件，只有当是凸函数的情况下，才能保证是充分必要条件。KKT条件是拉格朗日乘子法的泛化。之前学习的时候，只知道直接应用两个方法，但是却...

2018-03-22 11:30:22 919

qq_35311970的博客