- 博客(1)
- 收藏
- 关注
原创 文本数据集的简单处理(将文本转化为one-hot、TF、TF-IDF矩阵)
本次实验要求处理给定的数据集,得到对应的 onehot,TF,TF_IDF 矩阵,还要将 onehot 矩阵转为三元矩阵的形式,并完成三元矩阵相加的功能。 我的思路是: <1>建立单词集和单词表:先按行读入数据集,由于一行中,两个 tab 之间的数据是无 用的,因此舍弃掉前面的数据后,按照空格分隔字符串,得到一个个的单词,每分隔出一个 单词,就将其加入到单词集 word_set 和单词...
2018-06-11 11:39:12 6423
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人