nlp 中文文本纠错_文章总有错别字怎么办?AI帮你来纠错

本文介绍了使用NLP技术及百度API开发一款中文文本纠错工具的过程,包括准备、纠错功能实现、用户界面创建,并提供演示视频和未来功能扩展计划。项目已开源在GitHub,关注并私信可获取成品。
摘要由CSDN通过智能技术生成

开发背景

目前很多网页编辑器在文本编辑的时候都会智能提示,是否有错别字。在大家常用的文本编辑软件office与wps中,office只会对英文单词进行检测,而wps作为一款国产中文软件,并没有内置中文纠错。既然目前找不到合适的中文纠错软件,那就自己写一个吧。

f3e7aa8f48e20c3785701fbd293d5992.png

准备工作

下面我将使用NLP技术对文本进行纠错,为了减少AI部分代码,下面将使用百度现成的api进行AI纠错。

  1. 注册百度AI开发平台账号(可以使用百度账号直接注册登录)
  2. 进入NLP SDK文档https://ai.baidu.com/ai-doc/NLP/tk6z52b9z
  3. 登录控制台,选择自然语言处理,选择创建应用
d16284692195377202d2bd194c11059f.png
  1. 随便输入一个应用名,随便写一个应用描述,立即创建,返回应用列表。
3f47bb61a45c8dcd2efc570ccadba9fc.png
  1. 纪录下你的app_id, api_key, secret_key
ecb9ccdc2ff4671470eb90ba534a6266.png

开始工作

  • 使用sdk提供的ecnet函数,可以对文本进行纠错
from aip import AipNlpclient = AipNlp(app_id, api_key, secret_key)result = client.ecnet(text1)
  • 使用python-docx输出错误报告对比,错误字体颜色标红
from docx import Documentfrom docx.shared import RGBColor
  • 使用PysimpleGUI给你的python文件封装一个用户界面。

具体代码已经开源到GitHub。

https://github.com/Tlntin/text_ai_analyse

演示视频

演示视频

https://www.ixigua.com/i6819083356483879431/

界面展示:

951f735c34acb73468b8e5a9838c4aa6.png
1428ddd16b26815006276ddfb9560b37.png
cbf3c159974bbb73ed112ad9176cd681.png

支持的功能

  1. 保存api相关信息到本地
  2. 加载api文件到输入框
  3. 按中文句号“。”,中文分号“;”进行分句
  4. 输出word对比报告

后期将会支持的功能

  1. 直接输出AI分析结果到原文件批注
  2. 直接将结果替换原文件,并且显示修订记录
  3. 使用C#重新编译成office/wps插件,集成到办公软件中
  4. 使用NLP技术在本地进行纠错,用户可以选择在线纠错与离线纠错
  5. 集成多家AI技术,提高NLP纠错正确率
  6. 自动生成摘要与总结
  7. 根据xmind框架自动生成文章。
  8. 未完待续。。。。

成品获取

关注,并后台私信“纠错帮1.1”即可获取相关文件。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值