尝试将BERT应用于IMDB情感分类任务

最新推荐文章于 2024-05-17 06:26:09 发布

tedist

最新推荐文章于 2024-05-17 06:26:09 发布

阅读量2.5k

点赞数 5

分类专栏：机器学习文章标签：深度学习 nlp 自然语言处理 BERT

本文链接：https://blog.csdn.net/qq_41372972/article/details/104492389

版权

前言之前在学习《Python深度学习》这本书的时候记得在书中有一个使用GloVe词嵌入的方式进行IMDB数据集的情感分类任务，而最近在网上学习了一个使用BERT进行关系抽取的项目，于是乎考虑尝试用BERT来再次尝试对IMDB数据集的情感分类任务。同样的这次也是采取随机的200个数据集作为训练集，10000个数据集作为测试集。全部代码在github上已经给出。步骤本次实验的大致步骤同书中的例...

摘要由CSDN通过智能技术生成

前言

之前在学习《Python深度学习》这本书的时候记得在书中有一个使用GloVe词嵌入的方式进行IMDB数据集的情感分类任务，而最近在网上学习了一个使用BERT进行关系抽取的项目，于是乎考虑尝试用BERT来再次尝试对IMDB数据集的情感分类任务。同样的这次也是采取随机的200个数据集作为训练集，10000个数据集作为测试集。全部代码在github上已经给出。

步骤

本次实验的大致步骤同书中的例子一致：
分词->向量化+Dense层

数据集

从http://mng.bz/0tIo,下载到的原始IMDB数据集，我们使用解压后文件中的aclimdb文件夹中的train数据集，其中包含12500个neg样本和12500个pos样本。对其进行如下处理：

# 从pos以及neg样例中共抽取25000个样本
import os
imdb_dir = '/Users/ted/Desktop/NLP/IMDB-BERT/aclImdb'
train_dir = os.path.join(imdb_dir, 'train')
labels = []
texts = []
for label_type in ['neg', 'pos']:
    dir_name = os.path.join(train_dir, label_type)
    for fname in os.listdir(dir_name):
        if fname[-4:] ==</

最低0.47元/天解锁文章

tedist

关注

5
点赞
踩
17

收藏

觉得还不错? 一键收藏
4
评论
尝试将BERT应用于IMDB情感分类任务

前言之前在学习《Python深度学习》这本书的时候记得在书中有一个使用GloVe词嵌入的方式进行IMDB数据集的情感分类任务，而最近在网上学习了一个使用BERT进行关系抽取的项目，于是乎考虑尝试用BERT来再次尝试对IMDB数据集的情感分类任务。同样的这次也是采取随机的200个数据集作为训练集，10000个数据集作为测试集。全部代码在github上已经给出。步骤本次实验的大致步骤同书中的例...
复制链接

扫一扫