摘要:
每天生成的文字数量急剧增加。 大量非结构化文本的大量数据不能被计算机简单地处理和感知。 因此,需要有效且高效的技术和算法来发现有用的模式。 文本挖掘是从文本中提取有意义的信息,近年来受到了大量的关注。 在本文中,我们描述了几个最基本的文本挖掘任务和技术,包括文本预处理,分类和聚类。 此外,我们还介绍了生物医学和保健领域的文本挖掘。
每天生成的文字数量急剧增加。 大量非结构化文本的大量数据不能被计算机简单地处理和感知。 因此,需要有效且高效的技术和算法来发现有用的模式。 文本挖掘是从文本中提取有意义的信息,近年来受到了大量的关注。 在本文中,我们描述了几个最基本的文本挖掘任务和技术,包括文本预处理,分类和聚类。 此外,我们还介绍了生物医学和保健领域的文本挖掘。