文本分类（5）-TextCNN实现文本分类

最新推荐文章于 2021-04-02 15:16:39 发布

番茄要去皮

最新推荐文章于 2021-04-02 15:16:39 发布

阅读量1.1w

点赞数 1

分类专栏：深度学习文章标签： TetxCNN 文本分类深度学习

本文链接：https://blog.csdn.net/weixin_44766179/article/details/95867005

版权

该博客介绍了如何使用TextCNN模型对IMDB Review文本数据集进行分类，提供了数据集的下载链接和提取码。

摘要由CSDN通过智能技术生成

利用TextCNN对IMDB Reviwe文本进行分类，数据集地址：https://pan.baidu.com/s/1EYoqAcW238saKy3uQCfC3w
提取码：ilze

import numpy as np
import logging

from keras import Input
from keras.layers import Conv1D, MaxPool1D, Dense, Flatten, concatenate, Embedding
from keras.models import Model
# from keras.utils import plot_model
from keras.utils.vis_utils import plot_model
import pandas as pd
import warnings
import keras
import re
import matplotlib.pyplot as plt
from nltk.stem import WordNetLemmatizer
from nltk.corpus import stopwords
from keras.preprocessing.text import Tokenizer
from keras.preprocessing.sequence import pad_sequences
from keras.layers import Dense, LSTM, Embedding, Dropout, Conv1D, MaxPooling1D, Bidirectional
from keras.models import Sequential
from keras.utils import np_utils

warnings.filterwarnings('ignore')

# get data
df1 = pd.read_csv('word2vec-nlp-tutorial/labeledTrainData.tsv', sep='\t', error_bad_lines=False)
df2 = pd.read_csv('word2vec-nlp-tutorial/imdb_master.csv', encoding="latin-1")
df3 = pd.read_csv('word2vec-nlp-tutorial/testData.tsv', sep='\t', error_bad_lines=False)

df2 = df2.drop(['Unnamed: 0','type','file'],axis=1)
df2.columns