产品价值
自然语言处理是为各类企业及开发者提供的用于文本分析及挖掘的核心工具,已经广泛应用在电商、文化娱乐、金融、物流等行业客户的多项业务中。自然语言处理API可帮助用户搭建内容搜索、内容推荐、舆情识别及分析、文本结构化、对话机器人等智能产品,也能够通过合作,定制个性化的解决方案。
产品服务
支持文本实体抽取、文本分类、关键短语抽取、情感分析、关系抽取、商品评价解析等NLP定制化算法能力,用户无需拥有丰富的算法背景,仅需标注或上传适量文档数据,即可通过平台快速创建算法模型并使用。
适用文本实体抽取、文本分类、关键短语抽取、短文本匹配、关键抽取、简历抽取、商品评价解析、情感分析等
其产品优势有:
易用:使用流程简单,无需工程与算法背景
快捷:全链路优化,平均训练模型耗时<30分钟
专业:专业技术沉淀,500+标注数据时,模型准确率预计>85%
将连续的自然语言文本,切分成具有语义合理性和完整性的词汇序列,同时保持对数据、模型的不断迭代更新,目前支持简体中文、英文及泰文。
适用文本搜索、指令解析、自动回答。
其产品优势有:
多粒度支持:包含基本语义粒度,更小的检索粒度以及扩展检索粒度
海量数据沉淀:基于阿里核心业务沉淀,在通用、电商、文娱领域都处于领先水平
多语言支持:除中文外,还支持英文小粒度分词、泰语分词
使用灵活:通过多年的语料及算法研发积累,可在短时间内分析海量文本,帮助客户更好更精确的挖掘出文本价值
词性标注
通过词性标注服务,用户可以快速的为每一个词附上对应的词性,结合分词服务,可以快速进行更深层次的文本挖掘处理,无需担心新词发现、歧义消除等问题。
适用指令搜索、文本解析、关键词发现。
命名实体
我们为您提供的命名实体服务,可以帮助您快速识别文本中的实体,进而挖掘各实体间的关系,是进行深度文本挖掘,知识库构建等常用自然语言处理领域里的必备工具。目前主要针对电商领域,识别品牌、产品、型号等,同时也包括一些通用领域实体如人名、地名、机构名、时间日期等。
适用文本搜索、舆情分析、知识库构建。
情感分析
又称倾向性分析,或意见挖掘,它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。利用情感分析能力,可以针对带有主观描述的自然语言文本,自动判断该文本的情感正负倾向并给出相应的结果。
适用于舆论分析、影视分析、人物口碑追踪。
文本信息抽取
抽取文本中具有特定意义的实体,当前已支持合同领域的文本信息抽取。如需更多实体类型的定制化抽取。
适用于审核审计、搜索导航、知识库构建
智能文本分类
按照给定类目体系对输入文本进行自动分类,当前已支持新闻资讯领域和电商领域的文本分类。如需更多类目体系的定制化,请使用NLP自学习平台。
适用于个性化推荐、文本聚合、内容管理
中心词提取
多语言中心词(目前支持中文及英文)基于海量数据,使用电商标题中心词以及类目进行训练,通过给每个词计算一个相关性分数来衡量每个词与句子的相关性程度,进而识别并提取出句子的中心词。适用于提取电商搜索query、标题及其他类似短文本(一般小于25个词)的中心词。
适用于商品搜索、商品推荐、相关性计算
基于电商行业的大量语料研发,对消费者历史评价和新增评价的商品维度属性自动解析,高效甄别正负面评价,当前已支持24个行业类别。如需更多行业与商品维度的定制化,请使用NLP自学习平台。
适用于商品口碑分析、问题追踪、属性分类