- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 R语言文本分析入门
1. 文本挖掘概述文本挖掘是指从文本中提取有用的信息。成功应用主要有如下几方面:信息检索、内容管理、市场监测、市场分析等方面。文本挖掘被描述为 “自动化或半自动化处理文本的过程”,包含了文档聚类、文档分类、自然语言处理、文体变化分析及网络挖掘等领域内容。对于文本处理过程首先要拥有分析的语料,比如报告、信函、出版物等。而后根据这些语料建立半结构化的文本库。而后生成包含词频的结构化的词条-文档矩阵。2...
2018-05-21 08:48:48 9844 4
2019年统计用区划代码
2019年统计用区划代码,数据来自国家统计局网站(http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/)2019年行政区划数据,共5级区域,支持excel和csv两种格式
2020-12-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人