Cerisier-CSDN博客

原创 Tensorflow小技巧整理：tf.multinomial()采样

tf.multinomial()做生成任务时，得到 decoder 最终的输出之后，就需要决策选如何利用得到的输出张量进行生成。tf.argmax()是最简单最粗暴的一种方法，直接选取概率最大的词汇作为输出。beam search 等算法的出现，使得生成的结果有了更多的可能性。最近看到一段代码，使用的是 tf.multinomial() 进行采样，也尝试用了一下。tf.multinomial(...

2019-01-25 21:03:06 4778 3

原创 Tensorflow小技巧整理：tf.trainable_variables(), tf.all_variables(), tf.global_variables()的使用

在使用tensorflow搭建模型时，需要定义许多变量，例如一个映射层就需要权重与偏置。当网络结果越来越复杂，变量越来越多的时候，就需要一个查看管理变量的函数，在tensorflow中，tf.trainable_variables(), tf.all_variables(),和tf.global_variables()可以来满足查看变量的要求，来简单说一下他们的不同。

2019-01-17 16:02:34 44872

原创有一个地方，叫做稻城

有一个地方，叫做稻城我希望有个如你一般的人，如山间清爽的风，如古城温暖的光。从清晨到夜晚，由山野到书房。只要最后是你，就好。相信很多朋友初识稻城，和我一样，都要归功于《从你的全世界路过》中这首充满文艺气息的小诗。影片中，那蔚蓝的天空，那白色的雪山，那金黄色的草地，都不由得令人心向往之。终于在毕业入职之前，有机会和本科舍友一起来到稻城，看一场秋天的童话。情歌康定因为大学母校坐落在...

2018-11-17 14:18:00 1498 1

原创谈谈对CNN在NLP中可行性的理解

谈谈对CNN在NLP中可行性的理解谈到CNN，人们的直观感受还是其在图像处理领域取得的巨大成就，虽然近几年越来越多的论文使用到CNN与RNN的模型来探索卷积网络在自然语言处理中的应用，但始终还是无法取代CNN在图像中的地位，或是RNN之于NLP的地位。所以想谈谈自己对于CNN在NLP中可行性的一点个人理解。CNN到底在干什么提起CNN的作用，或者是原理，所有博客，教程等等，都会使用...

2018-05-17 16:26:57 5629 1

原创双向RNN：bidirectional_dynamic_rnn()函数

双向RNN：bidirectional_dynamic_rnn()函数先说下为什么要使用到双向RNN，在读一篇文章的时候，上文提到的信息十分的重要，但这些信息是不足以捕捉文章信息的，下文隐含的信息同样会对该时刻的语义产生影响。举一个不太恰当的例子，某次工作会议上，领导进行“简洁地”总结，他会在第一句告诉你：“下面，为了节约时间，我简单地说两点…”，（…此处略去五百字…），“首先，….”，（...

2018-04-28 15:49:10 16230 3

原创 tf.reverse_sequence()简述

tf.reverse_sequence()简述在看bidirectional_dynamic_rnn()的源码的时候，看到了代码中有调用 reverse_sequence()这一方法，于是又回去看了下这个函数的用法，发现还是有点意思的。根据名字就可以能看得出，这个方法主要是用来翻转序列的，就像双线LSTM中在反向传播那里需要从下文往上文处理一样，需要对序列做一个镜像的翻转处理。先来看一下这...

2018-04-28 11:36:57 4565

原创 Tensorflow小技巧整理：tf.cond()的小应用

Tensorflow小技巧整理：tf.cond()的小应用tf.cond() 方法tf.cond() 的作用类似于平常所使用的 if…else… 语句，但是在 tensorflow 中，所有节点是用图来保存的。而在图中传输的这些 tensor 数据流在我们使用 Session().run() 之前又是无法确定其数值的，所以这个时候传统的条件判断语句就无法使用。比如我们想判断 a 和...

2018-04-04 17:19:08 6921

原创 Tensorflow小技巧整理：修改张量特定元素的值

Tensorflow小技巧整理：修改张量特定元素的值最近在做一个摘要生成的项目，过程中遇到了很多小问题，从网上查阅了许多别人解决不同问题的方法，自己也在旁边开了个jupyter notebook搞些小实验，这里总结一下遇到的一些问题。Tensorflow用起来不是很顺手，很大原因在于tensor这个玩意儿，并不像数组或者列表那么的直观，直接print的话只能看到 Tensor(…) 这样的...

2018-03-16 17:41:12 15683 1

原创初始R语言——决策树

初始R语言——决策树决策树是机器学习里很重要的分类算法，网上也有很多博客进行细致地讲解，这里就不再叙述原理，而是直接运用 R 语言的程序包来进行数据处理。数据描述本文使用的数据是对乳腺癌肿瘤良性还是恶性的分类，使用 Breast Cancer Wisconsin (Original) Data Set 数据集。简单描述一下，数据集共有 699 个样本，根据乳腺癌肿瘤的厚度，细胞大小，细胞形状，附

2017-11-06 23:54:33 2050

原创初识R语言——PCA的实现

初识R语言 —— PCA的实现回顾PCA在之前的文章（老妪能解PCA）中曾经写过一些自己的PCA的看法，今天尝试用R语言来进行PCA的实现。回顾一下什么是PCA，总结来说就是基于对各个特征之间相关性的分析，从而找到主要成分并选取一定个数的特征向量作为新的基，从而得到样本在以新的基所构成的空间中的映射作为新的样本值，也就达到了降维的目的。数据描述这次数据使用的是真实数据，数据的描述如下： Huma

2017-10-22 15:42:37 12294

原创谈谈对泛化误差的理解

个人对泛化误差的看法泛化误差与交叉验证误差这个词我们经常会遇到，在机器学习中，我们最终想要的结果实际上就是减小学习后的估计值和真实值的误差。比如在回归中，我们的 loss function 就表示一个误差。而我们需要做的，就是最小化这个误差，也就是对 object function 的处理。那么什么是泛化误差呢？刚刚说我们最小化了 loss function，那是不是就一定说明我训练了一些样本后，

2017-09-28 13:35:01 18918 5

原创换个角度看回归——极大似然估计

极大似然估计与回归极大似然估计先简单说下似然(likelihood)和概率(probability)的区别，两者都是对可能性的表示。概率是在给定了一定参数值后，表示了一件事物发生的可能性；而似然则反其道而行之，是在给定了一系列结果后，表示了某一组参数值的可能性。那么最大似然估计的思想，就是在给定了一组结果后哪一组参数的可能性最大；反过来说，就是使用这样一组参数，出现给定结果的可能性最大

2017-09-18 10:31:27 4473

原创老妪能解PCA

大白话理解PCA算法原理现在的计算机计算能力越来越大，我们需要处理的数据也日趋复杂。复杂主要体现在数据量越来越多，而每组数据的维数也越来越高。这就出现了一种新的问题——维数灾难（Curse of Dimensionality）。人们开始寻求怎么用更少的维数来表示数据，却又不丢失重要信息。PCA（Principal Component Analysis）算法就是一种常用的降维方法。什么是PCA举一个例

2017-09-07 23:02:58 797

原创常见查找算法（一）

查找问题查找（Searching）问题是最为常见的问题之一，指的是判断在给定的数据元素（或记录）中，是否含有某个特定关键字（Key）。简单来说，就是解决“存在”还是“不存在”的问题。而这个给定的数据元素集合，我们称之为查找表（Search Table）。查找方法有许多种，根据其操作方式可分为两种：静态查找和动态查找。

2017-09-02 21:03:36 1122 1

原创写在入学第一日

初识首大2017年8月28日，中国的传统七夕节，在度过了一个忙碌而又充实的暑期实习后，终于还是到了再次和父母道别的日子。说来也是运气有些不好，青岛和首尔的天空这天都飘起了雨，凄风冷雨中多添了一些离别的愁绪。只是这份愁绪实在维持不了太久，青岛到首尔的航班仅仅用了不到一个班小时就降落在了仁川机场。语言不通，文化差异等等自己已经在申请时就预设好的挑战，这一刻真正开始拉开了序幕。一路奔波从仁川机场到首

2017-08-29 23:23:06 546 2

原创 Java 实现 Manacher 算法

Manacher算法的优点就在于他对p[i]的赋值不再是从1开始，根据回文字符串的对称性，在对p[i]赋初始值时我们可以参考前面已有的点，从而找出p[i]的最小值而不再是直接赋值p[i]=1再进行循环。

2017-08-24 21:50:02 693

Cerisier的博客