自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(34)
  • 收藏
  • 关注

转载 jieba中文分词

jieba中文分词¶中文与拉丁语言不同,不是以空格分开每个有意义的词,在我们处理自然语言处理的时候,大部分情况下,词汇是对句子和文章的理解基础。因此需要一个工具去把完整的中文分解成词。jieba是一个分词起家的中文工具。基本分词函数与用法¶安装:pip in...

2019-04-06 14:50:00 302

转载 Python正则表达式

Python 正则表达式¶In[1]:import repattern = re.compile(r'hello.*\!')print(pattern)match = pattern.match('hello,World! how are you?')if match: print(match.group)...

2019-04-06 09:21:00 125

转载 机器学习--------SVM

#SVM的使用(结合具体代码说明,代码参考邹博老师的代码)1、使用numpy中的loadtxt读入数据文件data:鸢尾花数据 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1...

2019-03-04 16:25:00 159

转载 tensor内部结构

内部结构1.tensor分为头信息区(Tensor)和存储区(Storage); 信息区:tensor的形状(size)、步长(stride)、数据类型(type),信息区占用内存较少 存储区:数据保存为连续数组,主要内存占用在存储区2.每一个tensor有着一个对应的storage,storage是在data之上封装的接口;具体操作...

2018-11-22 20:35:00 174

转载 Tensor类型

Tensor类型1.Tensor有不同的数据类型,每种类型又有CPU和GPU两种版本;2.默认的tensor类型是FloatTensor,t.set_default_tensor_type可以修改默认的tensor类型;3.特别的HalfTensor是专门为GPU显存不足设计的,同样的元素个数,显存只占用FloatTensor的一半;---------------...

2018-11-21 13:17:00 607

转载 Tensor索引操作

#Tensor索引操作'''''Tensor支持与numpy.ndarray类似的索引操作,语法上也类似如无特殊说明,索引出来的结果与原tensor共享内存,即修改一个,另一个会跟着修改'''importtorchasta=t.randn(3,4)...

2018-10-23 20:33:00 227

转载 常用的Tensor操作

常用的Tensor操作1、通过tensor.view方法可以调整tensor的形状,但必须保证调整去前后元素总数一致。view不会修改自身的数据,返回新的tensor与原tensor共享内存,即更改其中的一个,另一个也会跟这改变。2、实际中经常需要添加或减少某一维度,可用squeeze和unsqueeze这两函数。import torch as ta = t....

2018-10-23 18:01:00 144

转载 Tensor基本操作

Tensor(张量)1、Tensor,又名张量,从工程角度来说,可简单地认为它就是一个数组,且支持高效的科学计算。它可以是一个数(标量)、一维数组(向量)、二维数组(矩阵)或更高维的数组(高阶数组),torch里的Tensor支持GPU加速。基本操作1、从接口的角度讲,对tensor的操作可分为两类: (1)torch.function,如torch.s...

2018-10-10 20:48:00 192

转载 神经网络

神经网络1、Autograd实现了反向传播功能,但是直接用来写深度学习的代码在很多情况下还是少先复杂,torch.nn是专门为神经网络涉及到的模块化接口。nn构建与Autograd之上,可用来定义和运行神经网络。2、nn.Module是nn中最重要的类,可以把它看做一个网络的封装,包含网络各层定义及forward方法。定义网络1、定义网络,需要继承nn.Mod...

2018-10-10 13:31:00 71

转载 Autograd:自动微分

Autograd1、深度学习的算法本质上是通过反向传播求导数,Pytorch的Autograd模块实现了此功能;在Tensor上的所有操作,Autograd都能为他们自动提供微分,避免手动计算导数的复杂过程。2、autograd.Variable是Autograd中的核心类,它简单的封装了Tensor,并支持几乎所有Tensor操作;Tensor被封装为Variable之...

2018-10-07 20:55:00 95

转载 ipdb介绍及Tensor

ipdb介绍1、现在IPython之外使用debug功能,则需要安装ipdb(pip install ipdb),而后在需要进入调试的地方加上如下代码即可: import ipdb ipdb.set_trace()2、命令 功能 h(elp) 显示帮助信息,help command显示这条命令的帮助信息...

2018-10-05 15:56:00 258

转载 pytorch简介

诞生1.2017年1月,Facebook人工智能研究院(FAIR)团队在GitHub上开源了pyTorch,并迅速占领GitHub热度榜榜首。常见深度学习框架简介Theano1、Theano最初诞生于蒙特利尔大学LISA实验室,于2008年开始开发,是第一个有较大影响力的Python深度学习框架;Theano是一个Python库,可用于定义、优化和计算数学表达...

2018-10-04 22:02:00 219

转载 Python 之map、filter、reduce

MAP1.Python中的map()、filter()、reduce() 这三个是应用于序列的内置函数,这个序列包括list、tuple、str. 格式: 1>map(func,swq1[,seq2,...]) 第一个参数接受一个函数名,后面的参数接受一个或多个可迭代的序列,返回的是一个集合。 Python函...

2018-09-26 20:44:00 71

转载 分类器、logistic回归

相关性1.相关性是一种测度,用来表示两个变量在同一方向上发生变化的程度,如果x和y在变化方向上相同,那么这两个变量就是正相关;如果变化方向相反,就是负相关;如果变量之间没有关系,那么相关性就是0。分类器1.分类模型也称为分类器,用于对样本进行标注,表明这个样本属于一个有限的类别集合中的那个类。2.单分类学习中,训练集中的数据仅来自一个类别,目标是学习一个模型以预测某个...

2018-09-12 10:58:00 121

转载 机器学习方法、距离度量、K_Means

特征向量1.特征向量:以人为例,每个元素可能就对应这人的某些方面,这就是特征,例如:身高、年龄、性别、国际....2.特征工程:目的就是将现有数据中可作为信号的特征与那些仅是噪声的特征区分开来;当数据的维度(即特征的数量)相对于样本量来说比较大时,特征工程就具有较高的失败风险。机器学习方法1.机器学习方法一般都具有以下几部分: 1》模型的表示; 2》用于评...

2018-09-12 10:01:00 197

转载 动态规划、图

最优化问题 #1.最优化问题通常包括两部分 目标函数:需要最大化或最小化的值。eg:两地飞机票价 约束条件集合(可以为空):必须满足的条件集合。eg:旅行时间的上界背包问题 #1.贪婪算法:对于背包问题,找出近似解的最简单方法就是贪婪算法,首先选择最好的物品,然后是次好的,继续下去,知道背包装满。 贪婪算法在每一步都作出当时看起来最佳选择,也就是说,...

2018-09-12 10:00:00 74

转载 T分布

# T分布 #1.T分布是统计分布的一种,同卡方分布(X2分布),F分布并称为三大分布2.T分布又叫student-t分布,常用于根据小样本来估计呈正太分布且方差值未知的样本的均值(如果总体的方差已知的话,则应该用正态分布来估计总体的均值)(所以一个前提条件是:T分布的样本的总体必须符合正态分布)3.T分布一般用于小样本的情形、4.假设X服从标准正态分布即X~N(0,1)...

2018-09-12 09:57:00 2166

转载 置信区间-显著性-P-值

1.置信区间:误差范围(区间)在统计概率中就叫做置信区间;简单来说置信区间就是误差范围 我们用中括号[a,b]表示样本估计总体平均值的误差范围的区间,由于a和b的确切数值取决于你希望自己对于“该区间包含总体均值”这一结果具有可信程度,所以[a,b]被称为置信区间。2.置信水平:我们选择这个置信区间,目的是为了让“a和b之间包含总体平均值”这一结果具有特定的概率,这个概率...

2018-08-18 09:41:00 2190

转载 统计分布简述

基本概率1.确定性:一个程序运行时使用相同输入就会产生相同的输出2.相互独立:在随机过程中,如果一个事件的结果不会影响到另一个事件的结果3.统计推断的指导原则:一个从总体数据中随机抽取的样本往往可以表现出与总体相同的特性4.大数定律(伯努利定理):在独立可重复的实验中,如果每次实验中出现某种特定结果的实际概率为P,那么实验次数接近无穷大时,出现这种结果的比例与实际概率...

2018-08-18 09:40:00 203

转载 随机游走

随机游走1.布朗运动是随机游走的一种,随机游走广泛应用于对物理过程、生物过程(eg:DNA在异源双链中替换RNA的动力学过程)和社会过程(eg:股市走向)的建模本文主要通过醉汉游走来进行阐述问题提出一个酩酊大醉的农夫站在一片田地的正中央,他每秒钟都会向一个随机的方向迈出一步。那么1000秒之后,他与原点的期望距离是多少?如果他走了很多步,那么会离原点越来越远,还是...

2018-08-18 09:38:00 248

转载 python 绘图pylab

绘图1.绘图主要通过代码来进行认知demo: import pylab #绘图库 pylab.figure(1) #创建图一 pylab.plot([1,2,3,4],[1,2,3,4]) #在图一上绘图 pylab.figure(2) ...

2018-08-18 09:37:00 296

转载 抽象数据类型与类

抽象数据类型与类1.抽象数据类型是一个由对象以及对象上的操作组成的集合,对象和操作被捆绑为一个整体,可以从程序的一个部分传递到另一个部分。2.分解和抽象可以使程序易于修改,以控制程序的复杂度,分解使程序具有结构,抽象则隐藏细节程序实例class IntSet(object): """IntSet是一个整数集合""" #关于实现(不是抽象)的信息...

2018-08-18 09:36:00 253

转载 时间复杂度和搜索算法

计算时间复杂度1.一般情况下,我们需要考虑三种常见的情形 1>最佳情况运行时间是输入最有利的情况下算法的运行时间; 2>最差情形运行时间是给定输入规模的情况下最长的运行时间; 3>平均情形运行时间是在给定输入规模的情况下的平均运行时间。渐进表示法1.渐进表示法讨论算法运行时间与输入规模之间的关系;作为一种对“特别大...

2018-08-18 09:33:00 199

转载 DeepCas:an end-to-end predictorof information Cascades

转载于:https://www.cnblogs.com/monkeyT/p/9374292.html

2018-07-26 20:39:00 150

转载 测试、调试、异常、断言

期中测试选择题1.while循环作为主体循环时最多可以包含一个“break”语句和最多包含一个“pass”语句 错误分析: while True: if i > 0: break elif i==0: break else: ...

2018-07-26 20:28:00 130

转载 元组、列表、字典

元组1.与字符串相同的是元组是一些元素的不可变有序序列。与字符串的区别是元组中的元素不一定是字符,其中的按个元素可以是任意类型,且他们彼此之间的类型也可以不同。2.元组可以进行的操作: 重复操作、连接、索引、切片... 3*('a',2) = ('a',2,'a',2,'a',2) ('a',2) + ('b',3) a = (1,2,...

2018-07-26 20:26:00 80

转载 穷举法、for循环、函数、作用域、斐波那契数

1.穷举法枚举所有可能性,直到得到正确的答案或者尝试完所有值。穷举法经常是解决问题的最实用的方法,它实现起来热别容易,并且易于理解。2.for循环for语句一般形式如下: for variable in sequence: code blockfor后面的变量被绑定到序列中的第一个值,并执行下面的代码块,然后变量被赋值给序列中的第二...

2018-07-26 20:25:00 165

转载 Python入门介绍

一、计算机思维计算机能且只能做两件事,执行计算与保存计算结果,但它把两件事都做到了极致。 能够执行哪些计算呢?简单的基本运算,也就是内置运算,它们是由制造商提供给计算机使用的基本元素。 学会如何创造我们自己的计算方法。就要像计算机一样思考,也就是要有计算思维。然后我们按这样的方式思考,以便计算机能够提取它。 计算机思维到底是指什么呢? 计算机思维模式意味着和公式一切都可以看做是一个涉...

2018-07-26 20:21:00 39

转载 Python中将array类型不按科学计数法存在文件中的方法

直接上代码:from numpy import *import numpy as npDrug_array = zeros((708,708),dtype = int)f = open('D:\mat_drug_drug.txt')lines = f.readlines()Drug_row = 0for line in lines: list = line.strip('\n'...

2018-07-12 18:37:00 326

转载 关于numpy

摘要:关于numpy and pandas的使用很多,最近也老用到,但是作为初学者总是模模糊糊,使用不清楚,所以就好好总结了一下,以备后用第一部分:numpy1、基础属性  import numpy as np  array = np.array([ [1,2,3] ,[2,3,4] ])   print(array)  print(array.ndim,'\t',arr...

2018-05-28 14:08:00 59

转载 Python 列表改为嵌套列表再转为矩阵

最终目的--------->【下面的形式我就可以直接转为矩阵,用mat即可】下午为了实现list的这个功能,查找了好多库,但是都没有找到怎么做,索性就自己封装了一个函数实现了其功能:def list_To_matrix(list,mid,data,col):  '''  list为[1,2,3,4,5,6,7,8,9,10] 原列表  mid为[]  中间处理...

2018-05-22 17:18:00 472

转载 Python标准库12 数学与随机数

想用高斯分布生成随机数,在网上看到很强大的总结,保留一下,以备后用  https://www.cnblogs.com/vamei/archive/2012/10/26/2741702.html转载于:https://www.cnblogs.com/monkeyT/p/9070365.html...

2018-05-22 09:08:00 58

转载 Python中关于列表排序并保留id/enumerate()使用方法

新手才开始写博客,不周之处请原谅,有错误请指正。>>> a = [1,4,2,5,3]>>> b = sorted(enumerate(a),key = lambda x:x[1])>>> b[(0, 1), (2, 2), (4, 3), (1, 4), (3, 5)]>>> b[1](2, 2)>&gt...

2018-05-20 14:28:00 111

转载 关于药物重定位(随机游走)论文学习

FiveCrossVerify()是一个五倍交叉分数据代码,写的比较啰嗦,暂时不提供。转载于:https://www.cnblogs.com/monkeyT/p/9023660.html

2018-05-19 21:47:00 246

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除