https://www.douban.com/note/751754807/?from=author
阿里云
文本垃圾内容检测 https://help.aliyun.com/document_detail/70439.html?spm=a2c4g.11186623.6.675.74993db3PNarcb 结合行为、内容,采用多维度、多模型、多检测手段,识别文本中的垃圾内容,规避色情、广告、灌水、渉政、辱骂等内容风险。
- normal:正常文本
- spam:含垃圾信息
- ad:广告
- politics:涉政
- terrorism:暴恐
- abuse:辱骂
- porn:色情
- flood:灌水
- contraband:违禁
- meaningless:无意义
- customized:自定义(例如命中自定义关键词)
腾讯小程序
内容安全接口 https://developers.weixin.qq.com/miniprogram/dev/api-backend/open-api/sec-check/security.msgSecCheck.html 检查一段文本是否含有违法违规内容。
应用场景举例:
- 用户个人资料违规文字检测;
- 媒体新闻类用户发表文章,评论内容检测;
- 游戏类用户编辑上传的素材(如答题类小游戏用户上传的问题及答案)检测等。
腾讯云
敏感词识别 http://www.lbtyeya.com/cloud_tencent_/document/product/271/35501 接口请求域名: nlp.tencentcloudapi.com 。
敏感词识别接口能够识别出文本中的所有敏感词,帮助用户及时、精准地防范违规风险,广泛用于各种高危涉敏场景(如资讯、评论、聊天室)的敏感信息过滤。
该功能基于10万级大规模敏感词库,结合多种文本对抗方法、政策权威指令等,高效识别敏感词及其各类变种。同时我们会根据大规模语料和实时反误杀系统,不断更新迭代,确保效果持续提升。
目前能够支持对政治、色情、辱骂/低俗、暴恐/毒品、广告/灌水、迷信/邪教、其他违法、综合等8大类敏感信息的识别。
百度 AI
文本审核 https://ai.baidu.com/tech/textcensoring 功能介绍运用业界领先的深度学习技术,判断一段文本内容是否符合网络发文规范,实现自动化、智能化的文本审核,大幅节省内容审核的人力成本,为您的产品体验保驾护航
智能鉴黄 对文本中的色情行为描述、色情资源链接、低俗交友、污秽文爱等内容进行识别 暴恐违禁 对暴力行为、恐怖描述、赌博、毒品、枪支弹药等违禁内容进行识别 政治敏感 对文本中的敏感事件、涉政人物、散布谣言、反动宣传等内容进行识别 恶意推广 对文本中带有售卖意向的软文广告,微信、QQ等个人联系方式等违规内容及变体进行识别 低俗辱骂 对文本中的侮辱谩骂、人身攻击、消极宣泄等内容进行识别 低质灌水 对网络社区常见的乱码、水帖、刷屏等无意义的灌水信息进行识别
网易网盾
文本识别体验 https://dun.163.com/trial/text
- 广告过滤 文本信息中包含宣传、推广为目的给第三方导流的内容
- 智能鉴黄 文本信息中包含描述或传授性技巧及性行为等淫亵性内容
- 违禁检测 文本信息中包含国家法律法规限制的物品信息
- 涉政检测 文本信息中包含法律法规相违背的涉政敏感等不良信息
网易云
文本检测 https://www.163yun.com/help/documents/150425947576913920 接口描述
根据发布的内容、发布者、ip、设备id等信息来检测是否为需拦截内容。接口同步返回易盾内容安全服务实时反垃圾引擎检测结果,产品可以根据该结果对数据进行初步过滤。该接口返回结果状态分以下三种:
- 不通过:表示是确认内容非法,产品可对数据做删除隐藏处理。
- 嫌疑:表示该内容疑似非法,需内容安全云服务离线检测模块进一步确认处理,确认结果需产品自行定期调用文本离线检测结果获取获取,产品对嫌疑数据可以做特殊策略处理,如本人可见等。
- 通过:表示云安全反垃圾云服务实时反垃圾引擎未识别为非法内容,产品对该类数据可以直接放过,发表成功。云安全反垃圾云服务离线检测模块也会对这些数据做进一步分析处理,分析结果需产品自行定期调用文本离线检测结果获取获取。
支付宝
文本风险识别 https://opendocs.alipay.com/mini/introduce/text-identification 概述
文本风险识别是对互联网上产生的文本类内容进行风险识别的产品,有效识别垃圾广告、恶意言论、黄赌毒、暴恐政等非法用户原创内容(UGC),净化平台内容,维护平台秩序,保障平台信息安全及声誉。
应用场景 文本风险识别产品可用于解决在为用户提供服务的过程中产生 UGC 的风险识别问题,可在用户注册、登陆、发帖、回帖、站内信、直播弹幕等场景以及一切需要对文本内容进行安全管控的应用中,提前识别内容中违法、广告、涉政、涉黄等关键词,当识别到风险时商户可对内容进行拦截或屏蔽。