自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

R

R'sBelief

  • 博客(464)
  • 资源 (2)
  • 论坛 (2)
  • 收藏
  • 关注

原创 Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Transl…_2014【NMT】

文章目录

2020-08-27 21:31:04 55

原创 Statistical Phrase-Based Translation_2003_Koehn【SMT】

论文笔记文章目录论文信息摘要what短语翻译模型decoder 解码器howresultsome notes论文信息论文Statistical Phrase-Based Translation作者Philipp Koehn, Franz Josef Och, Daniel Marcu来源未知年份2003分类【SMT】这是基于短语的统计翻译模型的一篇经典文章,也是清华大学NMT列出的十大必读文章之一。摘要本文提出一个新的基于短语的翻译模型和解码算

2020-08-26 11:20:07 55

原创 Neural Machine Translation by Jointly Learning Align and Translate【NMT】【Attention】【待完成~】

neural machine translation旨在建立和训练一个单独且大的神经网络,读入一个句子然后最大化翻译的性能 输出正确的翻译。最近提出的NMT模型都是encoder-decoder这种思想,将源句encode为一个fixed-length vector,然后decode为目标翻译结果。在这篇论文中,作者推测(conjecture)在encoder-decoder结构中使用fixed-length vector是提升翻译效果的瓶颈。将所有的源句的信息压缩为一个fixed-length ve.

2020-08-21 14:34:36 32

原创 机器学习概述[Introduction of machine learning] 【ML hung-yi Lee】

1. define machine learningmachine learning ≈ 寻找一个函数 - step1 定义一个function 集合 -> 模型 - step2 评估function的好坏 -> 策略 - step3 选择最优的function -> 学习算法2. learning map![learning map](https://img-blog.csdnimg.cn/2020062915473970.png?x-oss-process=image/w

2020-07-13 11:08:51 19

原创 Effective Approaches to Attention-based Neural Machine Translation_2015_Luong 【NMT】【Attention】

文章目录提出背景神经机器翻译NMT模型Global AttentionLocal attention论文链接:Effective Approaches to Attention-based Neural Machine TranslationBy Luong et al. 2015任务对齐(alignments between different modalities):对齐是指比如在翻译任务中,翻译每个词的时候,要找多需要重点关注的原句中的词,也就是将原文中的词和目标文中的词对应起来。对齐权

2020-07-10 15:17:37 60

原创 Latex符号使用小结【持续更新…】【Latex】

文章目录字母上方加符号字母上方加符号加 ^ 号 \hat 或者 \widehat{}加 - 横线 \overline{}加 ~ 波浪线 \widetilde{}加单点号或者双点号 \dot{} 或者 \ddot{}

2020-07-09 10:50:53 67

原创 python nktl语料库下载问题

在执行代码如下代码时报错:from nltk.corpus import stopwordsstops = set(stopwords.words("english"))报错提示需要先下载stopwordsimport nltknltk.download('stopwords')下载 corpora/stopwords.zip/stopwords参考链接:https://www.nltk.org/data.html于是执行两行命令,一直报错Urlopen error,后来直接执行nlt

2020-07-07 22:34:07 67

原创 python spacy库使用总结【待完善】

spacy库的使用说明1.安装2.用法2.1 word tokenize(doc: token)2.2 英文断句(doc.sents: sent)2.3 词干化(doc: token, token_lemma_, token_lemma)2.4 词性标注(doc: token,token.pos_,token.pos)2.5 命名实体识别(doc.ents:ent, ent.label_, ent.label)2.6 名词短语提取(doc.noun_chunks)2.7 基于词向量计算两个单词的相似度 (d

2020-07-07 21:06:35 408

原创 python spacy库安装问题

1.在 pip install -U spacy 安装 spacy 的时候出现SLL配置异常问题,如下图,查询说是服务器的问题,忽略异常,再次重新安装成功。2.下载英文模型数据的时候,出现没有spacy.en.download模块,原因是这个模块已经被弃用,...

2020-07-07 19:36:58 489 1

原创 python字符串编码

python 字符串编码字符编码常见编码python 字符串encode()decode()len()字符编码字符串是一种数据类型,字符串比较特殊的一个问题是字符编码。常见编码ASCII编码:美国发明,最早只有127个字符被编码到计算机,只有英文、数字和一些符号;GB2312编码:中国发明,中文至少需要两个字节,这个编码把中文加了进去;这样的话日本把日文编码到Shift_JIS中,韩国把韩文编码到Eur-JIS中,在读取的时候就会产生乱码的现象,于是产生了Unicode编码。Unicode编码

2020-07-07 14:58:21 357

原创 python 内置函数【持续记录中】

zip() 函数zip() 函数将可迭代的对象作为参数,将对象中的元素打包成一个个的元组,返回由这些元组构成的对象,这样做的好处是节约了不少的内存。可以用list()函数,将对象转换为列表,列表的元素是一个个元组。python 2 zip()函数直接返回的就是元组构成的列表,而python 3 返回的是zip对象,需要用list()函数转换为列表的格式。...

2020-07-07 10:29:15 850

原创 统计学习方法课后习题【第十章】

HMM的代码实现 & exercise10_1,10_2,10_3运行结果目录HMMcodeexercise 10_1:后向算法HMMcodeimport numpy as npclass HMM: def __init__(self): self.alphas = None self.betas = None self.forward_p = None self.backend_p =...

2020-06-25 17:51:10 139

原创 数学希腊字母符号

读都不会,还指望记住怎么用吗………特意记录一下,忘记就来看看1、 Α α alpha a:lf 阿尔法 角度;系数2 、Βbai β beta bet 贝塔du 磁通系数;角度;系数3、 Γ γ gamma ga:m 伽马 电导系数(小zhi写)dao4、 Δ δ delta delt 德尔塔 变动;密度;屈光度5、 Ε ε epsilon ep`silon 伊普西龙 对数之基数6、 Ζ ζ zeta zat 截塔 系数;方位角;阻抗;相对粘度;原子序数7、 Η η eta eit 艾塔 磁

2020-06-25 16:32:10 139

原创 Sequence to Sequence Learning with Neural Networks_2014【machine translation】

论文:Sequence to Sequence Learning with Neural Networks作者:Ilya Sutskever,Oriol Vinyals,Quoc V. Le补习知识:RNN,LSTM,SGD,beam search

2020-06-24 16:14:48 63

原创 K-Means聚类算法 【sklearn.cluster】

classsklearn.cluster.KMeans(n_clusters=8,*,init='kmeans++',n_init=10,max_iter=300,tol=0.0001, precompute_distances='deprecated',verbose=0,random_state=None,copy_x=True,n_jobs='deprecated',algorithm='auto')参数:1、 n_clusters: 聚类类别数量,也是初始聚类中心的...

2020-06-22 22:00:52 119

转载 关于机器翻译,看这一篇就够了

机器翻译技术的发展一直与计算机技术、信息论、语言学等学科的发展紧密相随。从早期的词典匹配,到词典结合语言学专家知识的规则翻译,再到基于语料库的统计机器翻译,随着计算机运算能力的提升和多语言信息资源的爆发式增长,机器翻译技术逐渐走出象牙塔,开始为普通用户提供实时便捷的翻译服务。本文将简单介绍机器翻译技术的发展,包含机器翻译的演进历史与基本思想、端到端的神经翻译网络内部细节、技术落地过程中的...

2020-04-17 12:08:18 680

转载 Python操作数据库之insert、update

1、链接数据库import pymysqldb = pymysql.connect(host='localhost', user='root', password='123456', port=3306, db='spiders')cursor = db.cursor()sql = 'select * from students;'cursor.execute(sql)curso...

2020-01-18 15:27:17 207

原创 jupyter notebook使用

1.启动命令行窗口输入:jupyter notebook2.打开新文档(1)界面介绍:notebook 界面的组成部分1)notebook 的名称2)主工具栏提供了保存、导出、重载 notebook,以及重启内核等选项3)快捷键4)notebook 编辑区最下面的哪个 In [ ]: 的框叫做单元格,你可以把你的代码分成一段段的单元格输入,然后可以逐个单元格地运...

2019-11-23 11:06:20 73

原创 anaconda中安装tensorflow过程

1.安装anaconda本机已经安装python3.9,window64位,下载对应版本的anaconda,(自己python对应的版本网上很多,不安最新的python3.7对应版本,是防止它不稳定)清华镜像地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/,只有按照提示选择自己安装的路径,一路next就行,为防止用户权限...

2019-11-11 16:27:35 133

原创 re正则表达式

2019-10-30 12:09:20 37

原创 Word Embedding

讲解语言模型:专家语法规则模型(80年代):自然语言的语法规则。统计语言模型(00年代):计算一个句子出现的概率,概率越大,句子越合理。神经网络语言模型(至今):2003年Bengio提出词向量的概念,离散变量(高维)/连续变量(具有一定维度的实数向量,单词的分布式表示),可以看作使用神经网络编码的n-gram模型。https://www.cnblogs.com/dyl222/p/...

2019-10-12 21:07:36 48

原创 Python网络爬虫与提取--网络爬虫之正则表达式[Re库]【嵩天】

正则表达式:一种通用的字符串表达框架编译:p = re.compile(regex),将符合正则表达式语法的字符串regex转换成正则表达式特征p3.1 正则表达式的语法(操作符)3.2 Re库importre3.2.1 正则表达式的表示类型re库采用rawstring类型(原生字符串类型)r'text'表示正则表达式,也可用字符串直接表示,但是含有转义字符时...

2019-09-14 09:47:02 74

原创 Python网络爬虫与提取--网络爬虫之提取[BeautifulSoup库]【嵩天】

目录2.1BeautifulSoup库的元素BeautifulSoup库的理解BeautifulSoup库的引用BeautifulSoup库的解析器BeautifulSoup库的基本元素2.2 基于bs4库的HTML内容遍历方法标签树的下行遍历:标签树的上行遍历:标签树的平行遍历:bs4库的编码:2.3信息组织提取2.3.1 信息标记...

2019-09-08 20:10:34 89

原创 Python网络爬虫与信息提取--网络爬虫之规则 [requests库]【嵩天】

requests库的7个主要方法1.1 requests库的get()方法1.1.1 requests.get()requests.get(url, params=None, **kwargs)获取url页面信息,url指定了页面的地址,params和**kwargs等12个控制访问的12个参数是可选项。1.1.2 requests库两个重要对象Respo...

2019-09-07 22:02:12 46

原创 windows10系统搭建django环境

python3.7 + django1.111 安装py3(略)(官网下载)2 安装django1.11(官网下载)(支持py2.7 3.4 3.5 3.6 (but3.7也成功安上,希望之后不会出错))将django1.11的文件夹放在py3的同一根目录下,“cmd”进入终端-->进入django文件夹所在目录,执行“python setup.py install”,然后开始...

2019-03-20 21:51:39 563

原创 python之输入函数

python2.x:raw_input() :将所有输入看做字符串,返回字符串类型>>>a = raw_input("input:")input:123>>> type(a)<type 'str'> # 字符串>>> a = raw_input("input:")inpu

2018-11-20 10:51:42 1879

原创 python第三方库安装之numpy

下载地址:https://pypi.org/project/numpy/ 或者 https://www.lfd.uci.edu/~gohlke/pythonlibs/下载正确版本:我的python3.7 win64 :numpy-1.15.3-cp37-none-win_amd64.whl (13.5 MB)  (cp37对应python3.7)配置环境:系统环境->path :D:...

2018-11-02 14:00:14 2958 1

原创 第八届蓝桥杯省赛练习

3、标题:承压计算X星球的高科技实验室中整齐地堆放着某批珍贵金属原料。每块金属原料的外形、尺寸完全一致,但重量不同。金属材料被严格地堆放成金字塔形。                             7                             5 8                            7 8 8                           9 2 ...

2018-03-31 22:18:44 150

原创 1013. Battle Over Cities【PAT】

1013. Battle Over Cities (25)时间限制400 ms内存限制65536 kB代码长度限制16000 B判题程序Standard作者CHEN, YueIt is vitally important to have all the

2018-03-11 16:55:33 78

原创 词法、语法、语义分析实验

一、词法分析#include #include #include using namespace std;char *rwtab[6]={"begin","if","then","while","do","end"};//syn:单词符号的种别码;//token:单词符号的字符串//sum:整数char token[16];int sum,syn;char program[

2017-12-26 17:51:16 1186 1

原创 java安装 在cmd中配置环境步骤

测试成功:测试版本:

2017-11-11 22:16:30 947

原创 SVN和Git的优缺点

SVN的优点:1、采用集中式,易于管理,保证安全性;2、管理方便,逻辑明确,理念符合常规思维;3、代码的一致性高;4、适合人数不多的项目开发;5、允许一个文件有任意多的可命名属性,会关注所有的文件类型;6、支持二进制文件,更容易处理大文件;7、支持空目录。SVN的缺点:1、服务器压力太大,数据库容量暴增;2、必须连接在服务器上,否则基本不能工

2017-11-01 13:50:57 13890

转载 Wireshark嗅探抓包工具

转自点击打开链接网络抓包工具 wireshark 入门教程Wireshark(前称Ethereal)是一个网络数据包分析软件。网络数据包分析软件的功能是截取网络数据包,并尽可能显示出最为详细的网络数据包数据。Wireshark使用WinPCAP作为接口,直接与网卡进行数据报文交换。网络管理员使用Wireshark来检测网络问题,网络安全工程师使用Wiresh

2017-10-26 17:13:15 1659

原创 codeforce 789 C. Functions again (最大字段和)

C. Functions againtime limit per test1 secondmemory limit per test256 megabytesinputstandard inputoutputstandard outputSomething happened in Uzhlyandia again...

2017-03-30 22:19:56 383

原创 codeforces 789 B. Masha and geometric depression (暴力+细节)

B. Masha and geometric depressiontime limit per test1 secondmemory limit per test256 megabytesinputstandard inputoutputstandard outputMasha really loves algebra

2017-03-30 22:13:00 669 1

原创 code forces 791 C. Bear and Different Names (思维)

C. Bear and Different Namestime limit per test1 secondmemory limit per test256 megabytesinputstandard inputoutputstandard outputIn the army, it isn't easy to fo

2017-03-29 22:17:37 217

原创 codeforces 791 B. Bear and Friendship Condition (DFS搜索)

B. Bear and Friendship Conditiontime limit per test1 secondmemory limit per test256 megabytesinputstandard inputoutputstandard outputBear Limak examines a socia

2017-03-29 22:14:52 218

原创 poj 1365 Prime Land (数学--唯一分解定理)

Prime LandTime Limit: 1000MS Memory Limit: 10000KTotal Submissions: 4098 Accepted: 1856DescriptionEverybody in the Prime Land is using a prime base number syste

2017-03-28 21:39:20 330

原创 唯一分解定理

定理:任意一个大于1 的正整数都能表示成若干个质数的乘积,且表示方法是唯一的。换句话说一个数能被唯一的分解成若干质因数的乘积,成为唯一分解定理。推论:若p是ab的因子,那么p一定是a或b的因子。证明:质数p不能整除a,告诉我们a和p互质,于是存在整数k和l使得ka + lp = 1。等式两边同时乘以b,我们有kab + lpb = b。而ab能被p整除,也即存在整数r使得ab=pr。那

2017-03-28 20:36:17 304

原创 poj 1126 Simply Syntax (反向枚举)

Simply SyntaxTime Limit: 1000MS Memory Limit: 10000KTotal Submissions: 5552 Accepted: 2482DescriptionIn the land of Hedonia the official language is Hedonian. A

2017-03-26 21:25:55 281

MATLAB图像处理

《精通MATLAB图像处理》的完整的光盘资源,含基础知识,视频,代码

2018-05-28

商务风PPT模板

商务工作汇报IOS风PPT模板,颜色华丽但又不乱,工作汇报或一般场合使用

2018-05-28

星空-点点的留言板

发表于 2020-01-02 最后回复 2020-01-02

博客文章注释颜色怎么改

发表于 2016-06-10 最后回复 2016-06-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除