chen_mushi的博客

Summary all my learn!

2019-CS224N-Assignment 1: Exploring Word Vectors

认真看2019-cs224n这门课,好好学习! 斯坦福作业一:http://web.stanford.edu/class/cs224n/assignments/a1_preview/exploring_word_vectors.html 首先导入各种包,这里不用自己写代码: # All Impor...

2019-04-04 16:06:13

阅读数 41

评论数 0

Transformer与BERT详解

Transformer 自Attention机制提出后,加入attention的Seq2seq模型在各个任务上都有了提升,所以现在的seq2seq模型指的都是结合rnn和attention的模型,具体原理可以参考传送门的文章。之后google又提出了解决sequence to sequence问题...

2019-03-23 01:51:45

阅读数 26

评论数 0

python-leetcode-547-朋友圈

**题号: **547 **题目: **朋友圈 **难度: **中等 **内容: **班上有 N 名学生。其中有些人是朋友,有些则不是。他们的友谊具有是传递性。如果已知 A 是 B 的朋友,B 是 C 的朋友,那么我们可以认为 A 也是 C 的朋友。所谓的朋友圈,是指所有朋友的集合。 给定一个...

2019-03-21 21:48:25

阅读数 7

评论数 0

Attention 注意力机制

文章来源:https://www.zhihu.com/question/68482809/answer/264632289 注意力模型最近几年在深度学习各个领域被广泛使用,无论是图像处理、语音识别还是自然语言处理的各种不同类型的任务中,都很容易遇到注意力模型的身影。所以,了解注意力机制的工作原理对...

2019-03-19 10:50:44

阅读数 78

评论数 0

python-leetcode-200-岛屿的个数

**题号: **200 **题目: **岛屿的个数 **难度: **中等 **内容: **给定一个由 '1'(陆地)和 '0'(水)组成的的二维网格,计算岛屿的数量。一个岛被水包围,并且它是通过水平方向或垂直方向上相邻的陆地连接而成的。你可以假设网格的四个边均被水包围。 示例 1: 输入: 111...

2019-03-17 22:00:10

阅读数 7

评论数 0

通俗易懂的RNN总结(包含LSTM/GRU/BPTT等)

1、RNN介绍: RNN的基本想法是如何采用序列信息。在传统神经网络中我们假设所有的输入和输出都是相互独立的,但对于很多任务这样的假设并不合适。如果你想预测一个句子的下一个单词,的则需要知道之前的words包括哪些。 RNN被称为循环因为它们对句子的每个元素都执行相同的任务,输出依赖于之前的计算;...

2019-03-17 21:49:25

阅读数 98

评论数 0

对卷积神经网络、池化层、反卷积以及Text-CNN原理的理解

今天,我们来讨论一下卷积,以及卷积神经网络,这里边具体怎么运算的,请看下面分析: 首先选取知乎上对卷积物理意义解答排名最靠前的回答。 然后再来看分析卷积神经网络 1、卷积 来自知乎的优秀回答! 不推荐用“反转/翻转/反褶/对称”等解释卷积。好好的信号为什么要翻转?导致学生难以理解卷积的物理意义。 ...

2019-03-15 09:25:05

阅读数 81

评论数 0

python-leetcode-130-被围绕的区域

**题号: **130 **题目: **被围绕的区域 **难度: **中等 **内容: **给定一个二维的矩阵,包含 'X' 和 'O'( 字母 O )。 找到所有被 'X' 围绕的区域,并将这些区域里所有的 'O' 用 'X' 填充。 示例: X X X X X O O X X X O X X ...

2019-03-14 23:18:06

阅读数 13

评论数 0

从one-hot到word2vec再到FastText

0、one-hot representation(稀疏向量) 稀疏向量,就是用一个很长的向量来表示一个词,向量的长度为词典的大小N,向量的分量只有一个1,其他全为0,1的位置对应该词在词典中的索引。 假设一段文本有1000个词,如果用一个矩阵来表示这个文本,那么这个矩阵的维度为1000*1000。...

2019-03-13 16:50:26

阅读数 53

评论数 0

python-leetcode-128-最长连续序列

**题号: **128 **题目: **最长连续序列 **难度: **困难 **内容: **给定一个未排序的整数数组,找出最长连续序列的长度。 要求算法的时间复杂度为 O(n)。 示例: 输入: [100, 4, 200, 1, 3, 2] 输出: 4 解释: 最长连续序列是 [1, 2, 3,...

2019-03-13 10:19:11

阅读数 45

评论数 0

人工神经网络知识、激活函数、正则化、优化技术、Batch Normalization、Layer Normalization

目录: 1、神经网络基础概念 2、激活函数 3、深度学习中的正则化 4、深度模型中的优化技术 5、batch norm层 6、Layer Normalization 1、神经网络基础概念 前言 对于人工智能,相比大家都经常会听到。各大新闻媒体每天都对一些人工智能项目进行报道,且人工智能如何如何。今...

2019-03-11 16:53:30

阅读数 126

评论数 0

python-leetcode-390-消除游戏

题目描述: 给定一个从1 到 n 排序的整数列表。 首先,从左到右,从第一个数字开始,每隔一个数字进行删除,直到列表的末尾。 第二步,在剩下的数字中,从右到左,从倒数第一个数字开始,每隔一个数字进行删除,直到列表开头。 我们不断重复这两步,从左到右和从右到左交替进行,直到只剩下一个数字。 返回长度...

2019-03-09 22:56:26

阅读数 19

评论数 0

一文读懂如何用LSA、PSLA、LDA和lda2vec进行主题建模

本文来自知乎:https://zhuanlan.zhihu.com/p/37873878 本文是一篇关于主题建模及其相关技术的综述。文中介绍了四种最流行的技术,用于探讨主题建模,它们分别是:LSA、pLSA、LDA,以及最新的、基于深度学习的 lda2vec。 在自然语言理解任务中,我们可以通过...

2019-03-09 21:59:55

阅读数 160

评论数 0

细谈 SVM原理

本文对SVM进行一个很好的介绍,虽然很长,但是认真看完,对SVM会有很深刻的理解,十分佩服作者! 转自:http://www.blogjava.net/zhenandaci/category/31868.html (一)SVM的简介 支持向量机(Support Vector Machine)是Co...

2019-03-09 21:32:36

阅读数 55

评论数 0

机器学习实战:朴素贝叶斯模型之文本分类

在进行利用朴素贝叶斯模型进行文本分类之前,先介绍一下朴素贝叶斯原理! 需要搞清楚的概念: 1.贝叶斯模型是指模型参数的推断用的是贝叶斯估计方法,也就是需要指定先验分布,再求取后验分布。 2.贝叶斯分类是一类算法的总称,这类算法均以贝叶斯定理为基础,故统称贝叶斯分类。 我们称之为“朴素”,是因为整个...

2019-03-09 09:31:00

阅读数 42

评论数 0

文本挖掘预处理之TF-IDF原理 and 互信息的原理

TF-IDF介绍(维基百科): tf-idf(英语:term frequency–inverse document frequency)是一种用于信息检索与文本挖掘的常用加权技术。tf-idf是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文...

2019-03-07 13:36:50

阅读数 109

评论数 0

python-leetcode-671-合并二叉树

描述: 给定两个二叉树,想象当你将它们中的一个覆盖到另一个上时,两个二叉树的一些节点便会重叠。 你需要将他们合并为一个新的二叉树。合并的规则是如果两个节点重叠,那么将他们的值相加作为节点合并后的新值,否则不为 NULL 的节点将直接作为新二叉树的节点。 示例 1: 注意: 合并必须从两个树的根节...

2019-03-06 16:01:45

阅读数 27

评论数 0

python-leetcode-462-最少移动次数使数组元素相等 II

题目描述: 给定一个非空整数数组,找到使所有数组元素相等所需的最小移动数,其中每次移动可将选定的一个元素加1或减1。 您可以假设数组的长度最多为10000。 例如: 输入: [1,2,3] 输出: 2 说明: 只有两个动作是必要的(记得每一步仅可使其中一个元素加1或减1): [1,2,3]...

2019-03-05 10:05:18

阅读数 23

评论数 0

正向最大匹配法、逆向最大匹配法、双向最大匹配法的分析、语言模型中unigram、bigram、trigram的概念以及N-Gram模型介绍

分词算法设计中的几个基本原则: 1、颗粒度越大越好:用于进行语义分析的文本分词,要求分词结果的颗粒度越大,即单词的字数越多,所能表示的含义越确切,如:“公安局长”可以分为“公安 局长”、“公安局 长”、“公安局长”都算对,但是要用于语义分析,则“公安局长”的分词结果最好(当然前提是所使用的词典中有...

2019-03-04 20:54:33

阅读数 81

评论数 0

Python中的collections.Counter模块

1.collections模块介绍: collections是Python内建的一个集合模块,提供了许多有用的集合类。该模块实现了专门的容器数据类型,提供了Python的通用内置容器,dict,list,set和tuple的替代方法。 2.counter类 官网参考:https://docs.py...

2019-03-04 14:58:34

阅读数 24

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭