自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 语法型中文文本纠错方案探索

现在NLP的文本纠错还是以纠正拼写错误为主,本文章会对比几个具备语法纠错能力的中文模型,探索其在实际应用中的效果会如何。参与比对的模型或服务:Hanlp2.0文本纠错功能 百度智能云高级纠错功能(其实还测过ModelScope-Large模型,能力和百度智能云持平)ChatGPT3.5模型蓝色为原文有错误的位置或模型进行修改的位置红色为模型进行修改的内容,若是写的删除则是要删掉前面的蓝色文字

2023-07-13 15:39:23 808

原创 yum install gcc后还是报错 no C compile或gcc: command not found

或尝试去配置gcc的环境变量也报标题的错误,我配置了.bashrc和.bash_profile的gcc环境变量都没有用,都会继续报标题的错

2023-06-28 15:36:02 843

原创 windows系统下安装Firefox的geockdriver驱动或使用TableGeneration会遇见的问题

解决报错:common.exceptions.SessionNotCreatedException: Message: Expected browser binary location, but unable to find binary in default location, no 'moz:firefoxOptions.binary' capability provided, and no binary flag set on the command line。下载完安装包中只有一个.exe文件。

2023-06-26 14:35:05 509 1

原创 paddle 使用label_studio.py报错 not exist in

paddle 使用label_studio.py报错 not exist in,不管是paddlenlp,还是paddleocr好像都有这个问题

2023-06-20 11:25:28 242

原创 Liunx环境迁移时报错This is usually due to `pip` uninstalling or clobbering conda managed files

This is usually due to `pip` uninstalling or clobbering conda managed files,Liunx无网环境迁移问题解决

2023-04-13 15:18:02 4260

原创 拿信息抽取模型做指代消解

直接去做指定消解,市面上大多模型要么没法以小样本形式,要么模型太大,就两张k80的我跑不了,提供一种使用PaddleNlp的UIE模型进行指代消解的思路。上面的提到的三条笔录结构比较简单,只有被询问人和一个施害者或一个受害者,所以只有四个标签,可以根据自己的业务进行调整。嫌疑人甲指定词:需要标注实际被询问人提到的第一个涉案人名字,你我他等等。看效果还是不错的,个别词没有替换成功,估测为训练数据太少的原因。被询问人指代词:需要标注实际被询问人名字的指定,你我他等等。被询问人:需要标注实际被询问人名字。

2023-03-14 16:42:37 415

原创 rasa3.0表单源代码篡改记录

rasa表单源代码篡改

2022-12-07 09:46:15 446

原创 rasa-voice-inference报错Recorder is not defined

主要在vm.mediaRecorder = new Recorder(source,{nuwChannels : 1})报错 Recorder is not defined

2022-08-30 17:35:19 583

原创 doccano init报错after drop column:no such column: hidden

doccano init报错after drop column:no such column: hidden

2022-08-15 10:09:57 543

原创 python的requests请求因为中文符号报错:<!DOCTYPE HTML PUBLTC “-//W3C//DTD HTML 4.01 Transitional//EN“>

python的requests请求因为中文符号报错:或者报错You should supply an encoding or a list of encodings to []

2022-07-21 10:39:14 1688

原创 kernel与kernel-devel和kernel-header包的版本号不一致问题解决

kernel与kernel-devel和kernel-header包的版本号不一致问题解决

2022-06-08 17:40:06 7854 3

原创 报错 Building module: cleaning build area... ‘make‘ -j8 NV_EXCLUDE_BUILD_MODULES=‘‘ KERNEL_

Building module: cleaning build area... 'make' -j8 NV_EXCLUDE_BUILD_MODULES='' KERNEL_UNAME=3.10.0-1127.10.1.el7.x86_64 modules..........(bad exit status: 2) Error! Bad return status for module build on kernel: 3.10.0-1127.10.1.el7.x86_64 (

2022-06-08 17:24:03 653

原创 ERNIE3.0多标签多分类模型部署

官方推荐只保存模型参数,但部署文档推荐方法需要完整模型,我就被卡住了,经过这几天提问,成功在百度的大佬帮助下解决了:只保存参数的模型部署请等待官方更新,保存完整模型文件的部署方式如下:注意我选择的是python端部署方式!!这是法研杯多分类实战案例的代码,我在它基础上进行的修改:【快速上手ERNIE 3.0】法律文本多标签分类实战 - 飞桨AI Studio动态图转为静态图的方法是以下链接的修改,看要是缺什么包自己从中复制过来:https://github.com/PaddlePaddle/PaddleNL

2022-06-01 17:40:11 1250

原创 百度ERNIE3.0举的多分类例子中2019法研杯数据没有的解决办法

飞桨AI Studio - 人工智能学习与实训社区点击法律文本多标签分类实战即可跳转到以下界面,但是在自己电脑上部署,没有数据,点击在线运行,你会发现有原始数据文件raw_data,但在线运行不让下载文件夹,只能按住shift批量下载,成功下载程序跑到本地,也流畅运行了...

2022-05-25 17:36:31 159

原创 uie模型微调个人总结

技巧:为什么能不固定prompt?传统Prompt模板各有不同,应对少样本能力不一样UIE用大量数据固定了prompt的构造方式,就是条件加上抽取标签,所以有不固定的特点标签其实模型压根都没见过,模型照样能看出来Prompt技巧1.与原文越相似越好抽2.尽量符合常识3.标注的样本尽量要短训练技巧:1.预测可以将batch_size设置为2或者更高来提高预测效率2.uie-tiny 和base效果差距不大,但性能提高巨大3.需要负样本的环境配

2022-05-24 15:49:14 6123 19

原创 doccano标注完后,标注消失问题

最近要部署uie,需要doccano去标数据,但是1.6.0到1.6.3都有导出数据后标注为空的问题,uie指定需要jsonl(relation)导出格式,导致降版本也不可行,感谢大佬微信的大佬生气波波,成功导出了!!这里贴出大佬的github链接:https://github.com/taishan1994/doccano_export数据标注完后,运行程序,我没标注关系,需要改写写入的程序如图:成功!:...

2022-05-20 10:17:06 1027

原创 pip install paddlepaddle 报错 command ‘/usr/bin/gcc‘ failed with exit code 1 或 command ‘gcc‘ 报错

linux服务器部署paddle的uie时出现的问题,github已经提问https://github.com/PaddlePaddle/PaddleNLP/issues/2193直接以下代码,亲测有效,当时过度执着于pip了conda install paddlepaddle==2.3.0 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/...

2022-05-18 11:32:46 1754

原创 CrimeKgAssitant-master的案件分类模块思路整理(多标签分类模型)

CrimeKgAssitant-master的案件分类模块思路整理(多标签分类模型)

2022-05-16 08:58:35 663 3

原创 flask报错ImportError: cannot import name ‘escape‘ from ‘jinja2‘

flask报错ImportError: cannot import name 'escape' from 'jinja2'

2022-04-21 17:28:09 16582

原创 针对ccks_triple_extract_master完全运行遇到的问题

三元组抽取模型,根据苏神模型修改,针对ccks_triple_extract_master完全运行遇到的问题

2022-04-14 10:40:21 1119

原创 seq 2 seq(编码器-中间张量-基于注意力的解码器) 难点整理

以英译法为例,要将 i am the best 翻译成 Je suis le meilleur资源数据(sources)是 i am the best目标词(targets)是Je suis le meilleur(targets中的任意一个单词,称为target)知识点一:target 与sources 之间是 一对全部的关系,因为有几个目标词就有几个权重分布,一个权重分布中包含任意一个target和全部sources,记录着有关该target的sources众多权重系数。(这也是

2021-10-22 21:35:58 152

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除