听雨江南牛
码龄6年
关注
提问 私信
  • 博客:53,020
    53,020
    总访问量
  • 21
    原创
  • 806,947
    排名
  • 11
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:安徽省
  • 加入CSDN时间: 2019-01-12
博客简介:

qq_44497995的博客

查看详细资料
个人成就
  • 获得31次点赞
  • 内容获得26次评论
  • 获得106次收藏
  • 代码片获得883次分享
创作历程
  • 6篇
    2023年
  • 14篇
    2022年
  • 1篇
    2021年
成就勋章
创作活动更多

开源数据库 KWDB 社区征文大赛,赢取千元创作基金!

提交参赛作品,有机会冲刺至高2000元的创作基金,快来参与吧!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

语法型中文文本纠错方案探索

现在NLP的文本纠错还是以纠正拼写错误为主,本文章会对比几个具备语法纠错能力的中文模型,探索其在实际应用中的效果会如何。参与比对的模型或服务:Hanlp2.0文本纠错功能 百度智能云高级纠错功能(其实还测过ModelScope-Large模型,能力和百度智能云持平)ChatGPT3.5模型蓝色为原文有错误的位置或模型进行修改的位置红色为模型进行修改的内容,若是写的删除则是要删掉前面的蓝色文字
原创
发布博客 2023.07.13 ·
951 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

yum install gcc后还是报错 no C compile或gcc: command not found

或尝试去配置gcc的环境变量也报标题的错误,我配置了.bashrc和.bash_profile的gcc环境变量都没有用,都会继续报标题的错
原创
发布博客 2023.06.28 ·
984 阅读 ·
0 点赞 ·
1 评论 ·
1 收藏

windows系统下安装Firefox的geockdriver驱动或使用TableGeneration会遇见的问题

解决报错:common.exceptions.SessionNotCreatedException: Message: Expected browser binary location, but unable to find binary in default location, no 'moz:firefoxOptions.binary' capability provided, and no binary flag set on the command line。下载完安装包中只有一个.exe文件。
原创
发布博客 2023.06.26 ·
584 阅读 ·
0 点赞 ·
1 评论 ·
2 收藏

paddle 使用label_studio.py报错 not exist in

paddle 使用label_studio.py报错 not exist in,不管是paddlenlp,还是paddleocr好像都有这个问题
原创
发布博客 2023.06.20 ·
291 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Liunx环境迁移时报错This is usually due to `pip` uninstalling or clobbering conda managed files

This is usually due to `pip` uninstalling or clobbering conda managed files,Liunx无网环境迁移问题解决
原创
发布博客 2023.04.13 ·
5756 阅读 ·
16 点赞 ·
0 评论 ·
33 收藏

拿信息抽取模型做指代消解

直接去做指定消解,市面上大多模型要么没法以小样本形式,要么模型太大,就两张k80的我跑不了,提供一种使用PaddleNlp的UIE模型进行指代消解的思路。上面的提到的三条笔录结构比较简单,只有被询问人和一个施害者或一个受害者,所以只有四个标签,可以根据自己的业务进行调整。嫌疑人甲指定词:需要标注实际被询问人提到的第一个涉案人名字,你我他等等。看效果还是不错的,个别词没有替换成功,估测为训练数据太少的原因。被询问人指代词:需要标注实际被询问人名字的指定,你我他等等。被询问人:需要标注实际被询问人名字。
原创
发布博客 2023.03.14 ·
497 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

rasa3.0表单源代码篡改记录

rasa表单源代码篡改
原创
发布博客 2022.12.07 ·
478 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

rasa-voice-inference报错Recorder is not defined

主要在vm.mediaRecorder = new Recorder(source,{nuwChannels : 1})报错 Recorder is not defined
原创
发布博客 2022.08.30 ·
668 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

doccano init报错after drop column:no such column: hidden

doccano init报错after drop column:no such column: hidden
原创
发布博客 2022.08.15 ·
576 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python的requests请求因为中文符号报错:<!DOCTYPE HTML PUBLTC “-//W3C//DTD HTML 4.01 Transitional//EN“>

python的requests请求因为中文符号报错:或者报错You should supply an encoding or a list of encodings to []
原创
发布博客 2022.07.21 ·
1840 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

kernel与kernel-devel和kernel-header包的版本号不一致问题解决

kernel与kernel-devel和kernel-header包的版本号不一致问题解决
原创
发布博客 2022.06.08 ·
9369 阅读 ·
4 点赞 ·
3 评论 ·
14 收藏

报错 Building module: cleaning build area... ‘make‘ -j8 NV_EXCLUDE_BUILD_MODULES=‘‘ KERNEL_

Building module: cleaning build area... 'make' -j8 NV_EXCLUDE_BUILD_MODULES='' KERNEL_UNAME=3.10.0-1127.10.1.el7.x86_64 modules..........(bad exit status: 2) Error! Bad return status for module build on kernel: 3.10.0-1127.10.1.el7.x86_64 (
原创
发布博客 2022.06.08 ·
798 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

ERNIE3.0多标签多分类模型部署

官方推荐只保存模型参数,但部署文档推荐方法需要完整模型,我就被卡住了,经过这几天提问,成功在百度的大佬帮助下解决了:只保存参数的模型部署请等待官方更新,保存完整模型文件的部署方式如下:注意我选择的是python端部署方式!!这是法研杯多分类实战案例的代码,我在它基础上进行的修改:【快速上手ERNIE 3.0】法律文本多标签分类实战 - 飞桨AI Studio动态图转为静态图的方法是以下链接的修改,看要是缺什么包自己从中复制过来:https://github.com/PaddlePaddle/PaddleNL
原创
发布博客 2022.06.01 ·
1409 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

百度ERNIE3.0举的多分类例子中2019法研杯数据没有的解决办法

飞桨AI Studio - 人工智能学习与实训社区点击法律文本多标签分类实战即可跳转到以下界面,但是在自己电脑上部署,没有数据,点击在线运行,你会发现有原始数据文件raw_data,但在线运行不让下载文件夹,只能按住shift批量下载,成功下载程序跑到本地,也流畅运行了...
原创
发布博客 2022.05.25 ·
177 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

uie模型微调个人总结

技巧:为什么能不固定prompt?传统Prompt模板各有不同,应对少样本能力不一样UIE用大量数据固定了prompt的构造方式,就是条件加上抽取标签,所以有不固定的特点标签其实模型压根都没见过,模型照样能看出来Prompt技巧1.与原文越相似越好抽2.尽量符合常识3.标注的样本尽量要短训练技巧:1.预测可以将batch_size设置为2或者更高来提高预测效率2.uie-tiny 和base效果差距不大,但性能提高巨大3.需要负样本的环境配
原创
发布博客 2022.05.24 ·
6513 阅读 ·
6 点赞 ·
20 评论 ·
36 收藏

doccano标注完后,标注消失问题

最近要部署uie,需要doccano去标数据,但是1.6.0到1.6.3都有导出数据后标注为空的问题,uie指定需要jsonl(relation)导出格式,导致降版本也不可行,感谢大佬微信的大佬生气波波,成功导出了!!这里贴出大佬的github链接:https://github.com/taishan1994/doccano_export数据标注完后,运行程序,我没标注关系,需要改写写入的程序如图:成功!:...
原创
发布博客 2022.05.20 ·
1154 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

pip install paddlepaddle 报错 command ‘/usr/bin/gcc‘ failed with exit code 1 或 command ‘gcc‘ 报错

linux服务器部署paddle的uie时出现的问题,github已经提问https://github.com/PaddlePaddle/PaddleNLP/issues/2193直接以下代码,亲测有效,当时过度执着于pip了conda install paddlepaddle==2.3.0 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/...
原创
发布博客 2022.05.18 ·
1887 阅读 ·
2 点赞 ·
0 评论 ·
1 收藏

CrimeKgAssitant-master的案件分类模块思路整理(多标签分类模型)

CrimeKgAssitant-master的案件分类模块思路整理(多标签分类模型)
原创
发布博客 2022.05.16 ·
734 阅读 ·
0 点赞 ·
3 评论 ·
5 收藏

flask报错ImportError: cannot import name ‘escape‘ from ‘jinja2‘

flask报错ImportError: cannot import name 'escape' from 'jinja2'
原创
发布博客 2022.04.21 ·
16752 阅读 ·
2 点赞 ·
0 评论 ·
1 收藏

针对ccks_triple_extract_master完全运行遇到的问题

三元组抽取模型,根据苏神模型修改,针对ccks_triple_extract_master完全运行遇到的问题
原创
发布博客 2022.04.14 ·
1165 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏
加载更多