python用社交网络分析_Python社交媒体情感分析入门

python用社交网络分析

自然语言处理(NLP)是一种机器学习,可解决口语/书面语言与这些语言的计算机辅助分析之间的相关性。 从写作帮助和建议到实时语音翻译和口译,我们在日常生活中经历了NLP的众多创新。

本文研究了NLP的一个特定领域:情感分析,重点在于确定输入语言的积极,消极或中性性质。 这一部分将解释NLP和情感分析的背景,并探讨两个开源Python软件包。 第2部分将演示如何开始构建自己的可扩展的情感分析服务。

自然语言和文字数据

一个合理的起点是定义:“什么是自然语言?” 作为人类,这是我们彼此交流的一种方式。 交流的主要方式是口头和文字。 我们可以更进一步,只专注于文本交流。 毕竟,生活在无处不在的Siri,Alexa等时代,我们知道语音是远离文本的一组计算。

数据格局与挑战

限于文本数据,关于语言和文本我们能说些什么? 首先,语言(尤其是英语)充满了规则,多种含义和上下文差异的例外,这些例外甚至会混淆人类的解释程序,更不用说是计算语言了。 在小学,我们学习语音和标点符号的文章,通过讲母语,我们可以直观地了解哪些单词在搜索含义时意义不大。 后者的示例是诸如“ a”,“ the”和“ or”之类的词类,它们在NLP中被称为停用词 ,因为传统上,当到达LP中的这些词之一时,NLP算法对意义的搜索就会停止。一个序列。

由于我们的目标是自动将文本分类为情感类,因此我们需要一种以计算方式处理文本数据的方法。 因此,我们必须考虑如何向机器表示文本数据。 众所周知,使用和解释语言的规则很复杂,输入文本的大小和结构可能会有很大差异。 我们需要将文本数据转换为数字数据,这是机器和数学的选择形式。 这种转换属于特征提取领域

在提取输入文本数据的数字表示形式之后,可以给定一个文本输入主体来进行细化,以确定上面列出的语音文章的一组定量统计数据,并可能基于这些统计数据对文档进行分类。 例如,过多的副词可能

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值