自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 收藏
  • 关注

原创 文本数据集的简单处理(将文本转化为one-hot、TF、TF-IDF矩阵)

本次实验要求处理给定的数据集,得到对应的 onehot,TF,TF_IDF 矩阵,还要将 onehot 矩阵转为三元矩阵的形式,并完成三元矩阵相加的功能。 我的思路是: <1>建立单词集和单词表:先按行读入数据集,由于一行中,两个 tab 之间的数据是无 用的,因此舍弃掉前面的数据后,按照空格分隔字符串,得到一个个的单词,每分隔出一个 单词,就将其加入到单词集 word_set 和单词...

2018-06-11 11:39:12 6399

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除