自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 Construct a Seq2Seq Model with Attention Mechanism

Construct a Seq2Seq Model with Attention Mechanism1. 创建一个seq2seq类class Seq2seq(object): def __init__(self, config): self.attribute = config["attribute"] pass对于seq2seq模型,此处的主要参数有:size of vo...

2019-03-23 22:59:56 493

原创 TensorFlow: Built Graph

1. loss functiontf.nn.sparse_softmax_cross_entropy_with_logits( labels=None, logits=None)tf.nn.softmax_cross_entropy_with_logits( labels=None, logits=None)这两个函数只有输入的labels有区别,前...

2019-03-23 14:25:35 303

原创 tensorflow模块化编写神经网络

1. define a modelclass LSTM(Object): def __init__(self, config): # input attributes as a dictionary # 给成员变量赋值 self.attribute = config["attribute"] pass # set placeholde...

2019-03-21 22:59:30 512

原创 TensorFlow初尝试:CNN for Text Classification

1. Graph and Session in TensorFlowimport tensorflow as tf# create a graph, and define a constant in itwith tf.Graph().as_default() as g: c = tf.constant(1.0)# define a tensor in the default gra...

2019-03-20 20:54:51 433

原创 Python常用模块之PIL

之前人工智能大作业需要用到Keras里Applications中的预训练模型VGG16,VGG16接收的图片大小至少是48*48的三通道RGB图片,而这次MNIST数据集中的图片尺寸均为28*28单通道灰度图片,所以需要将数据集中的图片进行缩放,并且增加通道。但考虑到无法直接对数组进行缩放操作,因此学习了PIL库。思路是,先将28*28的数组转化为单通道灰度图象,再对图片使用PIL库中的函数增加通...

2018-06-17 20:25:06 739

原创 机器学习脉络梳理

参数参数分为两种:可学习得到的参数,和超参数。 机器学习可以归结为学习一个映射函数f : x → y,将输入变量 x映射为输出变量y。一般我们可以假设映射函数为y = f(x, θ)。其中θ 即为函 数的参数。参数可以通过学习算法进行学习。除了可学习的参数之外,还有一类参数是用来定义模型结构或训练策略的, 这类参数叫做超参数(Hyper-Parameter)。超参数和可学习的参数不同,通常是按照人...

2018-06-16 11:51:31 1005

原创 Python常用模块之numpy

numpy在讨论numpy的具体函数和方法之前,我要先说明一下两个问题:1,numpy中的数组和向量。2,numpy中的“多轴数组”。维度vs轴数numpy中里有多维数组,为了避免和线性代数中的多维数组区别开,这里暂时称之为多轴数组。我们首先生成一个三维数组,里面存放数字0-36:arr = np.arange(36).reshape(3, 4, 3)我们可以将这个三轴数组看作一个立方体:每一个...

2018-06-07 09:50:04 1193

原创 Python常用模块之copy、os

Copypython中的赋值方式:mylist = [1, 2, 3, 4, 5]mylist1 = mylistmylist2 = mylist[:]#mylist2 = copy.copy(mylist)这两种赋值方式的效果相同,mylist1和mylist2中的值都是 [1, 2, 3, 4, 5]。但明显,他们的本质不同:mylist1是在mylist这个变量名的旁边重新贴了一个变...

2018-06-07 09:49:53 6559

原创 Python常用模块之random

python自带的有random模块,而numpy中也有random的相关功能,因此为了不造成混淆,在载入random模块的时候我们可以给它起一个别名:import random as rndimport numpy as np接下来我们按照功能的逻辑作为顺序,对比着来分析python自带的random模块,和numpy模块中的random之间的异同:生成0-9之间的一个随机整数:rnd0 =...

2018-06-06 22:17:28 1626

原创 常用代码块

几个常用的程序块,整理一下:计算余弦相似度主要就是计算二范数,以及两个向量内积。'''计算余弦相似度'''from scipy.linalg.misc import normdef cosineSimilarity(vec1, vec2):    cosine = sum(vec1 * vec2) / (norm(vec1) * norm(vec2))    return cosine...

2018-06-06 22:16:20 278

原创 机器学习知识框架

参数参数分为两种:可学习得到的参数,和超参数。 机器学习可以归结为学习一个映射函数f : x → y,将输入变量 x映射为输出变量y。一般我们可以假设映射函数为y = f(x, θ)。其中θ 即为函 数的参数。参数可以通过学习算法进行学习。除了可学习的参数之外,还有一类参数是用来定义模型结构或训练策略的, 这类参数叫做超参数(Hyper-Parameter)。超参数和可学习的参数不同,通常是按照人...

2018-06-06 22:11:50 1232

原创 Python常见报错与解决方案

SyntaxError1. invalid syntax常是丢冒号,丢括号等问题。UnicodeDecodeError:1. 'gbk' codec can't decode byte代码如下:with open('acl-metadata.txt','r') as data:   print(data.readlines(),'\n')报错:UnicodeDecodeError: 'gbk...

2018-06-06 22:09:54 8166 2

原创 文本分类实践:基于sklearn与gensim模块

理论分析通过之前过数据挖掘课程的学习,尝试做过几个基于机器学习的多文档自动摘要,基于文本内容相似度的引文推荐系统,因此对于文本处理的基本流程有了一个比较清晰的认识。无论是挖掘文本内容的语义信息,还是文本之间的相似度,我们的第一步都是进行数据预处理。因此为了用数学语言来描述文本数据,引入向量空间模型(VSM)。我们可以将一篇文档视作向量空间中的一个向量,而将该文档中的每一个词项作为向量空间中的一个轴...

2018-06-01 16:34:00 3935 2

原创 文本处理流程——读取,词袋,TF-IDF及LSI

几个常用的程序块,整理一下:计算余弦相似度主要就是计算二范数,以及两个向量内积。'''计算余弦相似度'''from scipy.linalg.misc import normdef cosineSimilarity(vec1, vec2):    cosine = sum(vec1 * vec2) / (norm(vec1) * norm(vec2))    return cosine...

2018-05-24 16:42:08 3037 1

原创 Python常用模块笔记

randompython自带的有random模块,而numpy中也有random的相关功能,因此为了不造成混淆,在载入random模块的时候我们可以给它起一个别名:import random as rndimport numpy as np接下来我们按照功能的逻辑作为顺序,对比着来分析python自带的random模块,和numpy模块中的random之间的异同:生成0-9之间的一个随机整数:...

2018-05-01 01:53:04 947

原创 Python笔记(不定期更新)

一,常规操作print用print打印多个字符串可用逗号相连,输出中遇到逗号则自动在字符串之间添一个空格;若不想在两个字符串中间添空格,则应该加号连接字符串。不只是print里面可以进行字符串相加,字符串相加即可合并成一个字符串。print ('1 + 2 =', '2 + 1') #是输出了两个字符串print ('1 + 2 ='+ '2 + 1') #实际上是输出了一个字符串input...

2018-03-31 21:28:33 806 1

原创 文本数据挖掘实践

数据预处理1. 煮粥之前先淘米——预处理其实我们应该先寻找算法,有了方向再对数据进行相应的预处理,不过刚好最近在学习正则表达式,以及文件读写,就顺便练手,对数据进行“粗加工”。也就是简单地:去除坏值,比如编码有问题的。我觉得这种认为打了label的数据应该很可靠不应该有太多的问题,但还是有30多个编码有问题的。舍弃冗余内容。比如:id = {D10-1003}author = {Cheung, ...

2018-03-31 21:23:25 1392

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除