- 博客(32)
- 问答 (2)
- 收藏
- 关注
原创 python lexical chain
github地址import nltknltk.download('wordnet_ic')from nltk.corpus import wordnet as wnfrom nltk.corpus import wordnet_icthreshold = 0.6 # treshold for wupjcnTreshold = 0.09 # jcnpathTeshold = 0.1 # pathbrown_ic = wordnet_ic.ic('ic-brown.dat') # l
2022-05-01 21:09:15 758
原创 python利用collection 查找列表中的重复元素并统计重复数量
from collections import Counternouns = [1, 1, 3, 4, 4, 6]result = dict(Counter(nouns))print(result)print ([key for key,value in result.items() if value > 1])print ({key:value for key,value in result.items() if value > 1})#result{1: 2, 3: 1, 4
2022-05-01 20:43:03 816
原创 fairseq学习博客总结
使用fairseq从头开始训练一个中英神经机器翻译模型FaceBook-NLP工具Fairseq漫游指南(1)—命令行工具FaceBook-NLP工具Fairseq漫游指南(2)—扩展模型fairseq | 创建batch iterator部分逻辑源码阅读fairseq | fairseq beam search 源码阅读笔记fairseq-generate data-bin --path checkpoints/checkpoint_best.pt --remove-bpe会发现生成的结果文
2022-05-01 10:41:12 1488 2
原创 python in 字符串列表 部分匹配
word="hello"word_list="hello world"if word in word_list: print("True")else: print("False") result:Trueword="hello"word_list=["hello world","today is sunny","happy new year"]if word in word_list: print("True")else: print("False") # result:Fa
2022-04-29 21:22:07 4617
原创 关于共指消解
Allennlp 安装和使用问题allennlp使用Allen:coreference resolution 共指demo网站AllenNLP是由艾伦人工智能研究所开发的用于构建用于自然语言处理的深度学习模型的开源库。它建立在PyTorch之上,旨在为希望轻松构建高质量深度NLP模型的研究人员,工程师,学生等提供支持。它为现代NLP中的通用组件和模型提供了高级抽象和API。它还提供了可扩展的框架,可以轻松地运行和管理NLP实验。AllenNLP是一个基于PyTorch的NLP研究库,可为开发者提供
2022-04-29 21:21:52 437
原创 good_translation_is_wrong实验记录
Horovod的安装和使用记录一下这两天配置NCCL和horovod的过程(原创)服务器linux环境下horovod安装#下载NCCLnccl_2.1.15-1cuda9.1_x86_64Ubuntu NCCL安装#安装tar xvf nccl_2.1.15-1+cuda9.1_x86_64.txzmv nccl_2.1.15-1+cuda9.1_x86_64 /usr/local/nccl_2.1.15#添加环境变量vim ~/.bashrcexport LD_LIBRARY_PA
2022-04-12 18:50:19 1294
原创 win10 电脑右下角一直有小广告闪烁
鼠标划到任务栏右键,打开“任务栏设置”可以查看到弹窗的名字,注意流氓广告都是起一些系统软件的名字,像万能恢复大师,cloudplayer这一类的。ctrl+shift+esc打开任务管理器,根据流氓广告的名字找到相应的程序,可能是在进程也可能是在后台,右键“打开文件所在位置”,删除相应的内容即可。...
2021-11-21 09:58:55 3035
原创 Conda的使用
查看conda已建立的虚拟环境① conda env list② conda info --env创建conda虚拟环境conda create -n python python=3# -n: 设置新的环境的名字,此处为python,可根据个人习惯更改# python=3 指定新环境的python的版本,非必须参数# 这里也可以用一个-y参数,可以直接跳过安装的确认过程。启动(激活)虚拟环境#启动名为python的虚拟环境conda activate python退出虚拟环境c
2021-09-22 16:44:28 521
原创 中文标点符号unicode码
中文标点符号unicode码名称Unicode符号句号\u3002。分号\uff1b;逗号\uff0c,冒号\uff1a:左单引号\u2018‘右单引号\u2019’左双引号\u201c“右双引号\u201d”左括号\uff08(右括号\uff09)顿号\u3001、问号\uff1f?左书名号\u300a《右书名号\u300b》感叹号\uff0
2021-04-17 21:32:15 17086
原创 图解seq2seq+attention机制
一、注意力机制Attention任务:德文翻译为英文先讲解Encoder部分的注意力机制xix_ixi:表示输入的每一个德文单词(严谨的说,应该是德文单词的向量表示)A:Encoder,隐藏层,可以是GRU、LSTM、RNNhih_ihi:每个时刻最后一层生成的隐藏层变量hmh_mhm:最后一层最后时刻生成的隐藏层变量s0s_0s0:数值上=hmh_mhm,在此记为换个名字αiα_iαi:s0s_0s0与hih_ihi的"相似度"(相关性)的权重表示Weight: αi\a
2021-04-01 18:27:58 336
原创 ‘WindowsPath‘ object has no attribute ‘read_text‘
删除pathlibpip uninstall pathlib小记:pycharm真的有建立虚拟环境的必要了,虽然一直觉得每个环境都需要重新下载一些重复的插件好麻烦,但是如果将包都下载到同一路径下,不同的模型需要下载不同的库,经常出现版本不兼容的问题,导致程序运行不了,每次执行都需要来来回回倒腾,也是很麻烦。...
2021-03-31 12:33:35 5215 2
原创 jupyter notebook import问题
jupyter notebook下安装新库!pip install 包名成功安装后,仍显示not module name ?后来发现可能是路径的原因,jupyter notebook默认的python路径是anaconda目录下自带的python,而通过pip方式的话,可能会安装在其他版本的python下。方法一:将安装的库整个文件夹复制到anaconda/Lib/site-packages下,即可方法二import syssys.path.append('填写pip路径下的pyth
2021-03-30 20:50:07 1686
原创 小白也能解决GitHub访问速度+下载速度慢的问题
1、用文本编辑器打开hosts文件,位于C:\Windows\System32\drivers\etc目录下2、https://www.ipaddress.com/使用 IP Lookup 工具获得下面这两个github域名的ip地址:github.com和github.global.ssl.fastly.net对应的ip。3、将下列信息添加到host文件中(可以放在末尾)#github192.30.xx.xx github.com151.101.xx.xx github.global.ssl.f
2021-03-16 16:21:26 56
原创 Python基础知识(自用)
python是一门解释型、面向对象的高级编程语言。特点:开源免费、支持交互、可跨平台可移植。缺点:速度慢、不能加密应用方向:数据分析、人工智能、科学计算、Web开发、网络爬虫、常规软件开发变量及其类型:变量可以是任意的数据类型,在程序中用一个变量名来表示。变量名必须是大小写英文字母、数字和下划线的组合,且不能以数字开头。标识符和关键字['False', 'None', 'True', 'and', 'as', 'assert', 'async', 'await', 'break', 'cla
2021-03-15 18:05:47 100
原创 markdown指南(自己容易忘记,保存一下)
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar
2021-03-06 21:46:21 297
原创 机器学习(吴恩达)_学习笔记(week one)
学习网址(视频):https://www.bilibili.com/video/BV1tJ411475P学习网址(笔记):https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes:机器学习是让机器自己去学着解决问题,是计算机本身拥有的能力,而不是让设备按照人类写好的既定步骤去解决问题。一、什么是机器学习Tom Mitchell(来自卡内基梅隆):一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P评判,程序
2020-11-14 10:57:55 264
原创 一次学会b站视频下载_合并_剪辑,亲测有效~
①首先打开bilibili视频,找到自己想下载的视频②缓存到本地之后,因为b站下载的视频是分为视频文件和音频文件分开储存的,所以在手机中<我的视频>并不能找到下载好的.mp4文件。因此我们需要在b站的离线缓存中找到视频文件的存储路径,然后再去手机的文件管理寻找,我们会发现在下载的文件夹下有五个文件,分别是entry.json、index.json、audio.m4s(音频文件)、video.m4s(视频文件)、danmaku.xml。将其全部复制出来放在同一个文件夹下。③然后通过视频合并软
2020-10-16 21:34:26 5027
原创 使用apt-get install时出现E: 无法获得锁 /var/lib/dpkg/lock-frontend - open (11: 资源暂时不可用)
使用apt-get install时出现E: 无法获得锁 /var/lib/dpkg/lock-frontend - open (11: 资源暂时不可用)E: 无法获取 dpkg 前端锁 (/var/lib/dpkg/lock-frontend),是否有其他进程正占用它?(1)使用ps -e |grep apt屏幕出现的进程序列号,用sudo kill 序列号,杀死该进程(2)暴力法s...
2019-10-21 16:30:12 1127
原创 Linux虚拟机 如何建立桥接模式,登录别人的端口(CentOS 7)
Linux虚拟机 如何建立桥接模式,登录别人的端口(CentOS 7)我在网上找的好多教程都是eth0,网卡配置文件ip地址,但是我的死活找不到,后来发现刚开始找不到eth0没关系,我的刚开始是ens32,也有人是ens33,但是网卡文件设置好,eth0自动就出来了CentOS7配置网卡为静态IP,如果你还学不会那真的没有办法了!VMware虚拟机三种网络模式详解与配置但是一直弄Esc ...
2019-09-23 20:07:53 351
空空如也
有人研究过中文纠错处理吗
2021-03-24
python调用百度api后语音识别,能否再自主进行后续处理?
2021-03-15
TA创建的收藏夹 TA关注的收藏夹
TA关注的人