文本分类
文本分类用电脑对文本集(或其他实体或物件)按照一定的分类体系或标准进行自动分类标记。属于一种基于分类体系的自动分类,是朴素贝叶斯分类方法。
应用广泛
垃圾邮件分类:二分类问题,判断邮件是否为垃圾邮件
情感分析
二分类问题,判断文本情感是积极(positive)还是消极(negative)
多分类问题,判断文本情感属于{非常消极,消极,中立,积极,非常积极}中的哪一类
新闻主题分类:判断新闻属于哪个类别,如财经、体育、娱乐等自动问答系统中的问句分类
社区问答系统中的问题分类:多标签分类,如知乎看山杯更多应用:
让AI当法官: 基于案件事实描述文本的罚金等级分类(多分类)和法条分类(多标签分类)。
判断新闻是否为机器人所写: 二分类
.......
ED平台操作,相信小伙伴已经很熟悉了。
小帅为了方便开发者们都能体验一把。把训练用到的数据集上传了到群文件。请自行下载上传测试哦。QQ群号;185289236
接下来小帅就直接给调用文本分类接口示例代码
其他语言示例代码 http://aixiaoshuai.mydoc.io/?t=334303
Java示例代码
需要额外使用到的jar&工具类
com.alibaba
fastjson
1.2.35
----------------------------------------------------------
HttpUtil
https://ai.baidu.com/file/544D677F5D4E4F17B4122FBD60DB82B3
示例代码:
import com.xs.util.baidu.HttpUtil;
/**
* 文本分类接口示例代码 -JavaAPI
* @author 小帅丶
*
*/
public class TextClsAPISample {
static final String TEXT_CLS_API ="https://aip.baidubce.com/rpc/2.0/ai_custom/v1/text_cls/xstext";
static final String ACCESS_TOKEN = "";
public static void main(String[] args) throws Exception {
String text = "今天老师不在";
String result = getTextClsResult(ACCESS_TOKEN, text);
System.out.println(result);
}
/**
* 请求EasyDL文本分类接口
* @param accessToken 鉴权的token
* @param text
* @return String
* @throws Exception
*/
public static String getTextClsResult(String accessToken,String text) throws Exception {
// 请将API地址替换为EasyDL所提供的API地址
String url = TEXT_CLS_API;
// access_token获取方法请详见API使用说明,请注意access_token有效期为30天
String access_token = accessToken;
// 返回分类数量top_num设置为5 如不设置默认返回6条结果
String params = "{\"text\":\"" + text + "\",\"top_num\":5}";
String result = HttpUtil.post(url, access_token, params);
// 输出识别结果
System.out.println(result);
return result;
}
}
返回的结果
{
"log_id": 2954506822969007600,
"results": [
{
"name": "campus",
"score": 0.883552074432373
},
{
"name": "sport",
"score": 0.07205522060394287
},
{
"name": "publish",
"score": 0.03141676262021065
},
{
"name": "woman",
"score": 0.012975791469216347
}
]
}