ylyyyy
码龄7年
关注
提问 私信
  • 博客:407,003
    407,003
    总访问量
  • 63
    原创
  • 401,273
    排名
  • 47
    粉丝
  • 0
    铁粉

个人简介:这个人并不懒,但还是什么都没写

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2017-09-14
博客简介:

啊噗啊噗

查看详细资料
个人成就
  • 获得144次点赞
  • 内容获得51次评论
  • 获得539次收藏
  • 代码片获得281次分享
创作历程
  • 31篇
    2019年
  • 38篇
    2018年
成就勋章
创作活动更多

仓颉编程语言体验有奖征文

仓颉编程语言官网已上线,提供版本下载、在线运行、文档体验等功能。为鼓励更多开发者探索仓颉编程语言,现诚邀各位开发者通过官网在线体验/下载使用,参与仓颉体验有奖征文活动。

368人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

关于使用windows启动terminal有时会卡住需要按回车才能继续进行的问题

参见:https://www.v2ex.com/t/472771https://www.v2ex.com/t/351238如题,使用windows启动powerLinux或者cmd时偶尔会遇到这种问题,(powerShell暂时还没遇到),没由来的会卡住,按下回车之后才能继续,大概原因是,windows Powershell 分快速编辑模式和标准模式. 当处于快速编辑模式时, 鼠...
原创
发布博客 2019.07.19 ·
5541 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

t2t模型启动web服务

t2t中是自带api实现web服务的,参考地址https://github.com/tensorflow/tensor2tensor/tree/master/tensor2tensor/serving按照给出的步骤进行即可,1、首先将模型进行export,这里不需要安装任何依赖t2t-exporter --model=${MODEL} \ --hparams_set=$...
原创
发布博客 2019.05.15 ·
1064 阅读 ·
1 点赞 ·
5 评论 ·
0 收藏

反反爬虫策略

反反爬虫的思路:http://www.cnblogs.com/junrong624/p/5533655.html常见网站反爬虫策略:https://www.itcodemonkey.com/article/7936.html
原创
发布博客 2019.04.25 ·
498 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

git基本操作

http://rogerdudler.github.io/git-guide/index.zh.html已经连接上了某个远程仓库,如何将改动提交:将文件myfile.txt添加到缓冲区:git add myfile.txt (git add *)提交改动:git commit -m "add a test file"提交到远程仓库:git pus...
原创
发布博客 2019.03.11 ·
250 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

sublime修改注释颜色及默认语言

下载sublime:https://www.sublimetext.com/注:最好下原版,中文版有点坑的,慎重下载安装完成后启动,默认的主题为Monokai,看起来还是可以的,就是注释的颜色灰不溜秋不好看,进行修改1、ctrl + shift + p,调出命令面板,然后手动输入 Package Control 第一次运行时可能没有这个,会自动下载,等告诉你下载好了之...
原创
发布博客 2019.03.07 ·
3471 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

合并子目录下的文件

比如在当前路径下有这么一个文件系统:./0/mytest.en./1/mytest.en./2/mytest.en./3/mytest.en./4/mytest.en./5/mytest.en./6/mytest.en./7/mytest.en./8/mytest.en要把所有的mytest.en粘贴到同一个文件内,可以使用以下命令:cat `find ./*/my...
原创
发布博客 2019.02.20 ·
1000 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

shell for循环

linux下想要实现0到9的循环,共有三种写法:#可在bash、sh下运行for i in `seq 0 9`do echo $idone#以下两个只能在bash下运行for ((i=0;i<=9;i++))do echo $idonefor i in {0..9}do echo $idone注意:1、注意方法1中是反引号(1...
原创
发布博客 2019.02.20 ·
3417 阅读 ·
3 点赞 ·
0 评论 ·
5 收藏

python中json文件的读写

https://www.cnblogs.com/bigberg/p/6430095.html JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。它基于ECMAScript的一个子集。 JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C、C++、Java、JavaScript、Perl、Python等)。这些特性使JS...
原创
发布博客 2019.02.13 ·
269 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python中的tqdm和retry模块

两个简单的小模块https://blog.csdn.net/langb2014/article/details/54798823https://blog.csdn.net/ricky110/article/details/77727397一、tqdmTqdm 是一个快速,可扩展的Python进度条,可以在 Python 长循环中添加一个进度提示信息,用户只需要封装任意的迭代器 tq...
原创
发布博客 2019.02.13 ·
1428 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

Universal Transformer

参考:https://arxiv.org/pdf/1807.03819.pdf学界 | 谷歌的机器翻译模型 Transformer,现在可以用来做任何事了https://juejin.im/post/5b8f40776fb9a019e04ebe09https://www.leiphone.com/news/201808/1nhPCi9jWWNGv6aw.htmlhttps://...
原创
发布博客 2019.02.11 ·
1280 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏

文档的标点符号转换

https://www.biaodianfu.com/python-convert-between-unicode-fullwidth-halfwidth-characters.html 在文本处理的时候,经常会遇到全角半角不一致的问题。于是需要程序能够快速的在两者之间互转。由于全角半角本身存在着映射关系,所以处理起来并不复杂。具体规则为:全角字符unicode编码从65281~653...
原创
发布博客 2019.01.31 ·
961 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

linux中单引号、双引号、反引号的作用

在网上一搜一大堆,摘抄一个写的比较好的内容如下:(原地址: https://blog.csdn.net/iamlaosong/article/details/54728393)1、由单引号括起来的字符都作为普通字符出现。特殊字符用单引号括起来以后,也会失去原有意义,而只作为普通字符解释。如:$ string=’$PATH’$ echo $string$PATH$可见$保持了其本身...
原创
发布博客 2019.01.29 ·
4043 阅读 ·
0 点赞 ·
0 评论 ·
8 收藏

反向翻译back-translations

参考论文:Rico Sennrich, Barry Haddow, and Alexandra Birch.2016. Edinburgh neural machine translation systems for wmt 16. arXiv preprint arXiv:1606.02891.Rico Sennrich, Barry Haddow, and Alexandra Birc...
原创
发布博客 2019.01.19 ·
5083 阅读 ·
1 点赞 ·
1 评论 ·
1 收藏

字节对编码BPE

参考论文:Rico Sennrich, Barry Haddow, and Alexandra Birch.2016. Edinburgh neural machine translation systems for wmt 16. arXiv preprint arXiv:1606.02891.Rico Sennrich, Barry Haddow,and Alexandra Birch...
原创
发布博客 2019.01.19 ·
4884 阅读 ·
4 点赞 ·
0 评论 ·
8 收藏

conda环境共享

可以参考:https://blog.csdn.net/weixin_40240670/article/details/80784204以及:https://conda.io/docs/user-guide/tasks/manage-environments.html#creating-an-environment-from-an-environment-yml-file 注意:以下操作...
原创
发布博客 2019.01.17 ·
8106 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

机器翻译中的一些名词解释

1、语言模型(language model)与翻译模型(translate model)参考:https://zh.wikipedia.org/wiki/%E7%BB%9F%E8%AE%A1%E6%9C%BA%E5%99%A8%E7%BF%BB%E8%AF%91经常接触两个名词,语言模型(LM)和翻译模型(TM),这一概念最早是从统计机器翻译中来的,统计机器翻译的首要任务是为语言的产生构造...
原创
发布博客 2019.01.16 ·
2821 阅读 ·
2 点赞 ·
0 评论 ·
3 收藏

Pointer Networks简介及其应用

原文: https://zhuanlan.zhihu.com/p/48959800 本文介绍15年发表在NIPS上的一篇文章:Pointer Networks[1],以及后续应用了Pointer Networks的三篇文章:Get To The Point: Summarization with Pointer-Generator Networks[2]、Incorporating Cop...
原创
发布博客 2019.01.14 ·
18186 阅读 ·
23 点赞 ·
3 评论 ·
95 收藏

使用Python构建简单的HTTPServer,服务器之间相互传递文件

假设要传递的文件处于当前路径下原服务器上输入python -m SimpleHTTPServer 8989这里为python2的写法,python3有略微不同,8989为端口号,自己随便写一个,不与已有的冲突就行确定服务器的ip地址,可用ifconfig,寻找第一次出现的 inet addr:后跟着的内容,即为其ip 在目标服务器上输入wget 172.31.138.2...
原创
发布博客 2019.01.14 ·
1787 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

fast_align工具包使用踩坑记录

一个小小的任务用了两天时间,踩了无数坑,记录下来以作警示:1、任务:构建双语词典,用于对新语料的质量进行评分2、思路:由已有的质量较高的语料构建双语词典,在新的语料上计算每句翻译对应成功的概率,有一个阈值,得分较低的语料认为质量差3、流程:对已有的较高质量语料进行预处理-->双语语料进行合并-->利用fast_align工具进行对齐-->构建字典4、遇...
原创
发布博客 2019.01.10 ·
3215 阅读 ·
1 点赞 ·
1 评论 ·
2 收藏

fast_align工具包的使用

fast_align是一个优秀的快速词对齐工具包,在GitHub上有详细的介绍https://github.com/clab/fast_align 注意:使用前必须先进行分词,特别是汉语语料。否则没有实际意义需要注意的是,这里对文件的格式有一定要求,每行是源语言句子及其目标语言翻译,由带有前导和尾随空格(|||)的三重管道符号分隔。例如3句德语 - 英语平行语料库是:doch...
原创
发布博客 2019.01.09 ·
7432 阅读 ·
5 点赞 ·
10 评论 ·
14 收藏
加载更多