关于本地部署屏蔽词/敏感词库服务步骤
服务名称:sensitive-word-admin
最近越来越多的开发者喜欢自己部署一套本地的开源大语言模型,而为了避免出现一些包括但不限于的政治、宗教、色情、暴力、贪腐、反动等领域内的词条,所以非常有必要在调用大模型之前先进行敏感词/屏蔽词校验。
那么在无公网环境的情况下,我们没办法直接通过API来调用大厂提供的现成儿的服务怎么办?或者我是个偏向医疗领域的服务,需要动态放开一些类似于“吗啡”、“可卡因”、“利多卡因”等药物就必须手动自己来控制哪些内容需要释放到白名单内,哪些需要加入到屏蔽词内。
项目信息
项目名称:sensitive-word-admin
项目地址:https://github.com/houbb/sensitive-word-admin
- 克隆仓库到本地路径 :如果需要进行二次开发最好还是clone到自己的环境下;
- 部署本地服务环境:JDK8.0+、MySql5.7数据库服务。
- 在mysql数据库中执行创建数据库表结构的sql脚本;
- 代码同步完成后,更新maven依赖;
- 修改application.yml配置文件中的数据库链接和账号密码为你搭建好的数据库信息;
- 如果不需要二次开发,直接package成jar包,通过java -jar启动服务即可,服务默认占用8080端口;
- 服务启动后访问localhost:8080地址进入控制台页面,如果IP或端口更换需要访问对应地址;
- 敏感词校验可以通过使用postman或者浏览器直接调用接口尝试;
如:127.0.0.1:8080/api/sensitiveWord/contains?text=24口交换机
接口成功调用后会返回
{
"respCode": "0000",
"respMessage": "成功",
"result": false
}
JSON数据中result是个布尔值,true代表包含了屏蔽词,false代表不包含。