FeeBee数据集介绍

qq_861706249

已于 2022-04-27 22:17:17 修改

阅读量181

点赞数

文章标签：贝叶斯误差率

于 2022-04-27 18:57:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41786778/article/details/124448242

版权

MNIST:

CIFAR10:

CIFAR100:

后面三者是文本分类任务，没有原始特征数据直接进行BER评估的。前面三者不仅有特征转换的数据也都有原始图像像素特征数据。

后面三者都需要词袋模型进行预处理是因为，现有BER的方法（这篇论文中所提到的）都是处理数值数据的，符号数据的处理不了。

那前面三者依据需要预处理是为了减少计算量，现实数据集中特征维度都很高。降维实现计算量的减少。当然前面三个还是会跑一下原始数据看看情况，只是相当费时。

IMDB:IMDB数据集的解释_西檬饭的博客-CSDN博客_imdb数据集

其中需要词袋模型将文本转成数值特征文本预处理：词袋模型（bag of words，BOW）、TF-IDF_天泽28的博客-CSDN博客_自然语言处理词袋模型

文本表示之词袋模型 - 知乎

基于Doc2vec训练句子向量 - 知乎

SST2:

YELP:

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
FeeBee数据集介绍

MNIST:CIFAR10:CIFAR100:后面三者是文本分类任务，没有原始特征数据直接进行BER评估的。前面三者不仅有特征转换的数据也都有原始图像像素特征数据。后面三者都需要词袋模型进行预处理是因为，现有BER的方法（这篇论文中所提到的）都是处理数值数据的，符号数据的处理不了。那前面三者依据需要预处理是为了减少计算量，现实数据集中特征维度都很高。降维实现计算量的减少。当然前面三个还是会跑一下原始数据看看情况，只是相当费时。IMDB:IMDB数据集的解释_西檬饭的博客-CSDN博客
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。