引言
好友们在聊你不认识的明星八卦,想参与讨论又不知所措?
产品刚投入市场,想了解用户最真实的反馈而不只是抽样调查?
平台上运营着数万家电商,想从中挑出口碑好、潜力大的客户针对性重点扶持?
……
互联网时代,用户产生了海量的评论信息。电商、美食、酒店、旅游、购物……面对这些海量的评论数据,如果没有优质的自然语言处理(NLP)技术,它们就只能静静地躺在数据库里,无法创造价值。那么如何从这些海量的文本数据中提取有价值的信息?
情感分类技术:区分好评差评的利器
以分析明星口碑为例,开发人员可以通过爬虫获取大量关于这个明星的网友评论和媒体报道,然后运用情感分类模型,就能直接得到用户对明星的情感倾向。
更进一步,如果对这些数据按照时间排序,分别统计每天的口碑数值,我们就能得到该明星的舆情走势图,甚至预测其未来趋势。
同样,对于刚投入市场的新品、拥有大量用户评论的电商,我们都可以分析它们的舆情及其趋势。
百度在2018年7月开源了其基于语义和大数据的情感分类系统——Senta,将模型和源码通过Github进行免费技术开放。如果觉得拿模型跑太麻烦,百度AI开放平台上也免费开放了评论观点抽取服务,直接调用其api就能够实现情感分类,能够实现最快速的原型开发。