python
AlexXuZe
研究生,计算机专业
展开
-
如何在python中获得当前时间前几天的日期
使用datetime包#获取当前时间now_time = datetime.datetime.now()#选择要提前的天数change_time = now_time + datetime.timedelta(days=-20)#格式化处理change_time_format = change_time .strftime('%Y-%m-%d')原创 2018-01-14 12:43:17 · 5160 阅读 · 0 评论 -
神经网络中Epoch、Iteration、Batchsize相关理解和说明
https://blog.csdn.net/program_developer/article/details/78597738batchsize:中文翻译为批大小(批尺寸)。简单点说,批量大小将决定我们一次训练的样本数目。batch_size将影响到模型的优化程度和速度。 为什么需要有Batch_Size:batchsize的正确选择是为了在内存效率和内存容量之间寻找最佳...转载 2018-12-07 21:38:21 · 673 阅读 · 0 评论 -
“logits”到底是个什么意思?
1. 什么是logits?说到Logits,首先要弄明白什么是Odds?在英文里,Odds的本意是指几率、可能性。它和我们常说的概率又有什么区别呢?在统计学里,概率(Probability)描述的是某事件A出现的次数与所有事件出现的次数之比: P(A) = 发生事件A的次数 / 所有事件的次数。 (公式1)很显然,概率 P是一个介于0到1之间的实数; P=0,表示...转载 2018-12-05 16:45:00 · 25199 阅读 · 5 评论 -
enumerate() 函数
enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。原创 2018-12-08 22:31:24 · 116 阅读 · 0 评论 -
numpy数组拼接方法介绍(concatenate)
数组拼接方法一思路:首先将数组转成列表,然后利用列表的拼接函数append()、extend()等进行拼接处理,最后将列表转成数组。示例1:>>> import numpy as np>>> a=np.array([1,2,5])>>> b=np.array([10,12,15])>>> a_list=lis...转载 2018-12-08 22:39:39 · 1281 阅读 · 0 评论 -
numpy中的stack操作:hstack()、vstack()、stack()、dstack()、vsplit()、concatenate()
stack():沿着新的轴加入一系列数组。 vstack():堆栈数组垂直顺序(行) hstack():堆栈数组水平顺序(列)。 dstack():堆栈数组按顺序深入(沿第三维)。 concatenate():连接沿现有轴的数组序列。 vsplit():将数组分解成垂直的多个子数组的列表。...原创 2018-12-08 22:46:36 · 253 阅读 · 0 评论 -
numpy.eye() 生成对角矩阵
numpy.eye(N,M=None, k=0, dtype=<type 'float'>)关注第一个第三个参数就行了第一个参数:输出方阵(行数=列数)的规模,即行数或列数第三个参数:默认情况下输出的是对角线全“1”,其余全“0”的方阵,如果k为正整数,则在右上方第k条对角线全“1”其余全“0”,k为负整数则在左下方第k条对角线全“1”其余全“0”。>>&...转载 2018-12-08 22:58:49 · 7072 阅读 · 2 评论 -
np.random.seed()的作用
今天看到一段代码时遇到了np.random.seed(),搞不清楚的seed()作用是什么,特地查了一下资料,原来每次运行代码时设置相同的seed,则每次生成的随机数也相同,如果不设置seed,则每次生成的随机数都会不一样。...转载 2018-12-09 15:04:18 · 3837 阅读 · 0 评论 -
tf.matmul() 和tf.multiply() 的区别
1.tf.multiply()两个矩阵中对应元素各自相乘格式: tf.multiply(x, y, name=None) 参数: x: 一个类型为:half, float32, float64, uint8, int8, uint16, int16, int32, int64, complex64, complex128的张量。 y: 一个类型跟张量x相同的张量。 返回值: x * ...转载 2018-12-09 15:40:25 · 728 阅读 · 0 评论 -
python读取大文件
最近在学习python的过程中接触到了python对文件的读取。python读取文件一般情况是利用open()函数以及read()函数来完成:f = open(filename,'r')f.read()这种方法读取小文件,即读取远远大小小于内存的文件显然没有什么问题。但是如果是将一个10G大小的日志文件读取,即文件大于内存的大小,这么处理就有问题了,会造成MemoryError ......转载 2018-12-09 15:48:13 · 276 阅读 · 0 评论 -
numpy.linspace
numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)在指定的间隔内返回均匀间隔的数字(就是创建一个等差数列)。在[start, stop]之间返回num个均匀分布的样本这个区间的端点可以任意的被排除在外。...原创 2018-12-09 17:10:10 · 114 阅读 · 0 评论 -
一文说清楚pytorch和tensorFlow的区别究竟在哪里
转自:https://blog.csdn.net/ibelieve8013/article/details/84261482最近用了一点pytorch,想着稍稍理一下,这样一个和TensorFlow抗衡的一个框架,究竟是何方神圣?首先我们要搞清楚pytorch和TensorFlow的一点区别,那就是pytorch是一个动态的框架,而TensorFlow是一个静态的框架。何为静态的框架呢?我...转载 2019-01-14 15:17:11 · 9406 阅读 · 0 评论 -
NLP基本任务
下面整理了NLP的基本任务分类,资料来源见下链接。https://edu.csdn.net/course/play/8673词法分析(Lexical Analysis):对自然语言进行词汇层面的分析,是NLP基础性工作分词(Word Segmentation/Tokenization):对没有明显边界的文本进行切分,得到词序列新词发现(New Words Identificatio...原创 2019-01-19 21:25:48 · 264 阅读 · 0 评论 -
AI顶级会议列表 & ACL相关
The First Class: tier-1的conferences, 其实基本上就是AI里面大家比较公认的top conference. 下面同分的按字母序排列. IJCAI (1+): AI最好的综合性会议, 1969年开始, 每两年开一次, 奇数年开. 因为AI实在太大, 所以虽然每届基本上能录100多篇(现在已经到200多篇了),但分到每个领域就没几篇了,象machine learn...转载 2019-01-21 20:23:25 · 2438 阅读 · 0 评论 -
Ubuntu:安装deb文件包
sudo dpkg -i *.deb#如果报依赖错误执行下面语句再试sudo apt-get -f --fix-missing install原创 2019-05-08 19:47:11 · 3368 阅读 · 0 评论 -
千万级微博语料数据
由 千叶正志 博主整理https://blog.csdn.net/nghuyong/article/details/79180449转载 2018-12-07 20:54:57 · 2219 阅读 · 0 评论 -
word2vec基本概念
基本概念作为自然语言处理爱好者,大家都应该听说过或使用过大名鼎鼎的Gensim吧,这是一款具备多种功能的神器。 Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。 它支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法, 支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的API接口...转载 2018-12-07 16:39:24 · 220 阅读 · 0 评论 -
详解机器学习中的梯度消失、爆炸原因及其解决方法
https://blog.csdn.net/qq_25737169/article/details/78847691转载 2018-12-04 22:39:51 · 116 阅读 · 0 评论 -
遍历DataFrame
可用DataFrame属性来进行操作1 .columns属性:每个columns对应的keys2 .shape属性:形状,(a,b),index长度为a,columns数为b3 .index;.values属性:返回index列表;返回value二维array4 .head();.tail();利用如下for循环以及values属性即可进行遍历f原创 2018-01-14 13:16:48 · 3608 阅读 · 0 评论 -
Python 列表(List)
Python 列表(List)序列是Python中最基本的数据结构。序列中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推。Python有6个序列的内置类型,但最常见的是列表和元组。序列都可以进行的操作包括索引,切片,加,乘,检查成员。此外,Python已经内置确定序列的长度以及确定最大和最小的元素的方法。列表是最常用的Python数据类型,它可以作为一个方...原创 2018-03-07 21:25:08 · 233 阅读 · 0 评论 -
tile函数
tile函数 在看机器学习实战这本书时,遇到numpy.tile(A,B)函数,愣是没看懂怎么回事,装了numpy模块后,实验了几把,原来是这样子:重复A,B次,这里的B可以时int类型也可以是远组类型。>>> import numpy >>> numpy.tile([0,0],5)#在列方向上重复[0,0]5次,默认行1次 array([0, 0, ...原创 2018-03-01 16:47:21 · 288 阅读 · 0 评论 -
在 Java 中调用 Python 代码
极少数时候,我们会碰到类似这样的问题:与 A 同学合作写代码, A 同学只会写 Python,不熟悉 Java ,而你只会写 Java 不擅长 Python,并且发现难以用 Java 来重写对方的代码,这时,就不得不想方设法“调用对方的代码”。下面举一些简单的小例子,借此说明:如何在 Java 中调用 Python 代码。 主要内容如下:什么是 Jython ?一个 HelloPython 示例...原创 2018-03-27 13:36:50 · 423 阅读 · 0 评论 -
特征提取方法: one-hot 和 TF-IDF
one-hot 和 TF-IDF是目前最为常见的用于提取文本特征的方法,本文主要介绍两种方法的思想以及优缺点。1. one-hot1.1 one-hot编码 什么是one-hot编码?one-hot编码,又称独热编码、一位有效编码。其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效。举个例子,假设我们有四个样本(行),每个样...转载 2018-09-29 15:52:04 · 273 阅读 · 0 评论 -
python学习:python的星号(*)和双星号(**)用法
最初,星号变量是用在函数的参数传递上的,在下面的实例中,单个星号代表这个位置接收任意多个非关键字参数,在函数的*b位置上将其转化成元组,而双星号代表这个位置接收任意多个关键字参数,在**b位置上将其转化成字典:* 该位置接受任意多个非关键字(non-keyword)参数,在函数中将其转化为元组(1,2,3,4)** 该位置接受任意多个关键字(keyword)参数,在函数**位置上转...原创 2018-11-08 12:07:40 · 288 阅读 · 0 评论 -
MATLAB函数randn简介
randn(random normal distribution)是一种产生标准正态分布的随机数或矩阵的函数,属于MATLAB函数。返回一个n*n的随机项的矩阵。如果n不是个数量,将返回错误信息。用法:Y = randn(n)返回一个n*n的随机项的矩阵。如果n不是个数量,将返回错误信息。Y = randn(m,n) 或 Y = randn([m n])返回一个m*n的随机项矩...转载 2018-11-08 12:24:23 · 1275 阅读 · 0 评论 -
tensorflow的placeholder和Variable函数
placeholder及用法:placeholder,中文意思是占位符,在tensorflow中类似于函数参数,运行时必须传入值 Variable及用法:(变量):创建,初始化,保存和加载 您可以通过构造类Variable的实例向图中添加变量。Variable()构造函数需要变量的初始值,它可以是任何类型和形状的Tensor(张量)。 初始值定义变量的类型和形状。 施工后,变...原创 2018-11-08 16:13:37 · 212 阅读 · 0 评论 -
关于python中带下划线的变量和函数 的意义
总结:变量:1. 前带_的变量: 标明是一个私有变量, 只用于标明, 外部类还是可以访问到这个变量2. 前带两个_ ,后带两个_ 的变量: 标明是内置变量,3. 大写加下划线的变量: 标明是 不会发生改变的全局变量函数:1. 前带_的变量: 标明是一个私有函数, 只用于标明,2. 前带两个_ ,后带两个_ 的函数: 标明是特殊函数 P...转载 2018-11-23 20:33:52 · 85 阅读 · 0 评论 -
Python函数调用的下划线缺省参数“_”问题
def count(a,b): a += 1; b += 2; return a,b;a=0;b=0;c=0;d=0;_,d = count(a,b);print c,d;d调用函数count,赋给_,d(第一个参数是下划线,表示缺省),结果为c=0,d=2,即对c没有操作...转载 2018-11-23 20:36:45 · 257 阅读 · 0 评论 -
深度学习——L0、L1及L2范数
在深度学习中,监督类学习问题其实就是在规则化参数同时最小化误差。最小化误差目的是让模型拟合训练数据,而规则化参数的目的是防止模型过分拟合训练数据。参数太多,会导致模型复杂度上升,容易过拟合,也就是训练误差小,测试误差大。因此,我们需要保证模型足够简单,并在此基础上训练误差小,这样训练得到的参数才能保证测试误差也小,而模型简单就是通过规则函数来实现的。规则化项可以是模型参数向量的范数。如:L...转载 2018-11-26 22:09:12 · 5401 阅读 · 0 评论 -
tf.InteractiveSession()与tf.Session()
tf.InteractiveSession():它能让你在运行图的时候,插入一些计算图,这些计算图是由某些操作(operations)构成的。这对于工作在交互式环境中的人们来说非常便利,比如使用IPython。tf.Session():需要在启动session之前构建整个计算图,然后启动该计算图。意思就是在我们使用tf.InteractiveSession()来构建会话的时候,我们可以先构建...转载 2018-11-26 22:32:04 · 73 阅读 · 0 评论 -
xrange与range之间的区别
首先我们看看range:range([start,] stop[, step]),根据start与stop指定的范围以及step设定的步长,生成一个序列。注意这里是生成一个序列。xrange的用法与range相同,即xrange([start,] stop[, step])根据start与stop指定的范围以及step设定的步长,他所不同的是xrange并不是生成序列,而是作为一个生成器。即...转载 2019-05-19 21:32:05 · 268 阅读 · 0 评论