自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 服务器ubuntu20.04 安装torch_geometric

最新的pytorch,pytorch-geometric可能还没有适配。要去官网查看符合的版本。

2023-02-24 09:40:28 595

原创 面向任务的对话系统的持续学习方法

本文针对面向任务的对话系统,提出一种有效的持续学习方法(TPEM),该方法采用迭代网络剪枝、扩展和遮蔽,在保持先前任务性能的同时,加快了后续任务的学习进度。具体来说,①利用网络剪枝来保存旧任务的知识,②利用网络扩展来为新任务创建自由权重,③引入任务特定的网络遮蔽来减轻旧任务的固定权重对新任务的负面影响。对来自三个基准数据集的7个不同任务进行了广泛实验,结果表明显著优于强有力的竞争对手。

2022-10-05 22:00:36 396

原创 2021-05-19

自然语言处理中token和tokenization是什么简单来说,tokenization就是通常所说的分词,分出的每一个词语我们把它称为token。tokenization,也叫word segmentation,分词,是一种操作,它按照特定需求,把文本切分成一个字符串序列(其元素一般称为token,或者叫词语)。一般来说,我们要求序列的元素有一定的意义,比如“text mining is time-consuming”需要处理成"text mining/ is/ time-consuming",其中

2021-05-19 10:32:45 136

原创 解决nltk_data LookupError: Resource punkt not found.

nltk_data LookupError: Resource punkt not found.Please use the NLTK Downloader to obtain the resource:一、出现问题命令行运行时出现问题:使用建议的步骤nltk.download()无法下载,所以我选择离线下载自己安装。二、解决方案1.下载,网址: http://www.nltk.org/nltk_data/.2.安装,第三个:3.将文件解压到以下任意文件中: Attempted to lo

2020-11-04 10:33:00 1494 1

原创 ubuntu20.04安装pytorch-geometric

ubuntu安装pytorch-geometric1.environment2.安装流程1.environmentOS:ubuntu20.04Python version:Python 3.6.8PyTorch version:1.4.0CUDA/cuDNN version:10.12.安装流程(1)检查pytorch支持cuda$ python -c "import torch; print(torch.cuda.is_available())">>> True(2

2020-11-01 23:35:08 1137

原创 GPT的前世今生

GPT、GPT-2、GPT-3对比1.GPT1.无监督pre-training2. 有监督fine-tuning二、GPT-2三、GPT-31.GPT简单来说,GPT的底层架构是transformer,是由pre-training和fine-tuning两部分构成的。1.无监督pre-trainingtransformer里有encoder层和decoder层,而GPT里主要用的是decoder层,不过做了一点改变,就是去掉了中间的Encoder-Decoder Attention层(因为没有enc

2020-10-12 23:31:58 1299

原创 对话推荐系统评价指标

对话推荐系统评价指标文章目录对话推荐系统评价指标前言一、语言模型二、语言模型评价指标--perplexity困惑度三、N-gram三、推荐系统评价指标---准确性指标前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、语言模型当前的语言模型是以统计学为基础的统计语言模型,统计语言模型是基于预先人为收集的大规模语料数据,以真实的人

2020-09-23 16:49:31 521

原创 h5py

python库—h5py应用命令行安装pip install -i https://pypi.tuna.tsinghua.edu.cn/simple h5py简单介绍h5py文件是存放两类对象的容器,数据集(dataset)和组(group),dataset类似数组类的数据集合,和numpy的数组差不多。group是像文件夹一样的容器,它好比python中的字典,有键(key)和值(value)。group中可以存放dataset或者其他的group。”键”就是组成员的名称,”值”就是组成员对象本

2020-09-20 21:47:48 526

原创 ubuntu下通过anaconda使用清华镜像安装pytorch

ubuntu下通过anaconda使用清华镜像安装pytorch显示已有镜像源删除镜像安装pytorch测试是否成功查看pytorch的gpu版是否成功显示已有镜像源很多时候,下载的镜像源已经无效,我们需要把他先删除。命令:conda config --show删除命令:conda config --remove channels XXXXXX指网址镜像安装pytorch命令:conda config --add channels https://mirrors.tuna.tsinghua.

2020-09-16 08:48:37 2047

原创 亲测有效!!Ubuntu16.04安装向日葵远程软件(成功)

Ubuntu16.04安装向日葵远程软件(成功)1.官网下载链接: https://sunlogin.oray.com/download/.选择最后一个linux版的,点击下载2.安装在文件夹所在位置打开终端,输入命令行:sudo dpkg -i 软件名我的是sudo dpkg -i SunloginClient-10.0.2.24779_amd64.deb!!!出现了错误:原因及解决方法:缺少依赖包,使用命令sudo apt-get install -f -y即可解决并完成deb的安

2020-09-12 10:21:29 12442

转载 TF-IDF、余弦相似性---找出相似文章

余弦相似性句子A:我喜欢看电视,不喜欢看电影。句子B:我不喜欢看电视,也不喜欢看电影。请问计算上面两句话的相似程度?基本思路是:如果这两句话的用词越相似,它们的内容就应该越相似。因此,可以从词频入手,计算它们的相似程度。第一步,分词。句子A:我/喜欢/看/电视,不/喜欢/看/电影。句子B:我/不/喜欢/看/电视,也/不/喜欢/看/电影。第二步,列出所有的词。我,喜欢,看,电视,电影,不,也。第三步,计算词频。句子A:我 1,喜欢 2,看 2,电视 1,电影 1,不 1,也 0。句子B

2020-06-11 23:36:34 453

转载 自动提取关键词---TF-IDF原理

TF-IDF原理写在前面:假如有一篇很长的文章,要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,怎样才能正确做到?有一个非常简单的算法,TF-IDF就可以很快速的解决这个问题。一、例子讲解假定现在有一篇长文《中国的蜜蜂养殖》,需要用计算机提取它的关键词。一个容易想到的思路,就是找到出现次数最多的词。如果某个词很重要,它应该在这篇文章中多次出现。于是,我们进行"词频"(Term Frequency,缩写为TF)统计。结果你肯定猜到了,

2020-06-11 22:46:31 636 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除