文本分析杂记之二 场景及要点

文本分析的整体大的背景,对于理解文本分析显得至关重要。因为不理解这个大的背景的情况下,过分的聚焦于具体的技术,可能会完全的走偏。尤其是对于我现在这种已经有了具体应用场景的学习者来言,每个层次能做什么,才是最关注的事情。


首先谈谈文本分析解决什么问题。(Text Mining 和 Text Analytics在严格的意义上是不一样的。但是在这里探讨的时候,认为是约等的,不特殊说明的情况下不做区分。)文本分析主要是通过对文本数据进行分析,得到现实可用的知识,这些现实可用的知识最终将用于现实世界。比如:预测、辅助决策等。


文本挖掘和文本分析的场景。

简单说起来,这里面有三个环节:现实世界、观察者、文本数据。观察者通过观察现实世界,得到自己的想法,然后把自己的想法表达为文本数据。看似一脉相承,但是每个环节所包含的信息是完全不同的。观察者看到的信息并不和真实世界完全一样,其表达成为文本数据的内容,也不一定和他的想法一样。这在文本分析的过程中,是必须要明确的。

从文本数据里可以:挖掘自然语言的知识、挖掘文本数据的内容、挖掘观察者的知识和推断其它现实世界的变量。


本课程所覆盖的要点。这个要点其实和上图文本挖掘和分析的场景是对应的。场景的图里面标明的是目的,而这个图里面标明的是手段。手段是服务于目的的。

本文中的图片摘自课程https://www.coursera.org/learn/text-mining/的PPT。概念定义和使用等也和该课程保持一致。侵删。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值