- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 基于大数据做文本分析
在对大数据的认识中,人们总结出它的4V特征,即容量大、多样性、生产速度快和价值密度低,为此产生出大量的技术和工具,推动大数据领域的发展。为了利用好大数据,如何有效的从其中提取有用特征,也是重要的一方面,工具和平台化必须依靠正确的数据模型和算法才能凸显出其重要的价值。现在就文本分析作为案例来分析数据处理技术在大数据领域的作用和影响。首先讨论文本分析的三种模型:词袋模型、TF-IDF短语加权表示和
2016-03-01 10:52:04 9869
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人