IMDB数据集来自 IMDB网站 的 25,000 条电影评论,以情绪(正面/负面)标记。评论已经过预处理,并编码为词索引(整数)的序列表示。为了方便起见,将词按数据集中出现的频率进行索引,例如整数 3 编码数据中第三个最频繁的词。这允许快速筛选操作,例如:「只考虑前 10,000 个最常用的词,但排除前 20 个最常见的词」。
下载地址:链接:https://pan.baidu.com/s/1zvFeXTLPRItJLbF8ENnVbQ
提取码:snho
IMDB数据集来自 IMDB网站 的 25,000 条电影评论,以情绪(正面/负面)标记。评论已经过预处理,并编码为词索引(整数)的序列表示。为了方便起见,将词按数据集中出现的频率进行索引,例如整数 3 编码数据中第三个最频繁的词。这允许快速筛选操作,例如:「只考虑前 10,000 个最常用的词,但排除前 20 个最常见的词」。
下载地址:链接:https://pan.baidu.com/s/1zvFeXTLPRItJLbF8ENnVbQ
提取码:snho