文本分类(TextCNN,Keras)

数据集是网上找的,已上传至我的 Github,项目完整地址:https://github.com/cyandn/practice/tree/master/text-classification

 

流程:

  1. 加载数据集,去停用词
  2. 使用 Keras 的 Tokenizer 将每一文本用数字表示
  3. 创建 TextCNN 模型,训练并预测

 

在 1080Ti 上 batch_size = 128 时每一 epoch 用时 2 s,跑 6、7 个 epoch 测试集准确率就到 1.0000 了 。。数据集太小太简单

也可以使用词袋模型进行实验,这里不在赘述

 

参考:

https://www.jianshu.com/p/3c8591a12bd6

https://blog.csdn.net/edogawachia/article/details/79446354

https://blog.csdn.net/John_xyz/article/details/79210088

http://www.52nlp.cn/tag/textcnn

https://hunto.github.io/nlp/2018/03/29/TextCNN%E6%96%87%E6%9C%AC%E5%88%86%E7%B1%BB%E8%AF%A6%E8%A7%A3.html

 

转载于:https://www.cnblogs.com/cyandn/p/11148962.html

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是基于KerasTextCNN文本分类的代码示例: ```python from keras.layers import Input, Embedding, Conv1D, GlobalMaxPooling1D, Dense from keras.models import Model # 定义超参数 max_sequence_length = 100 max_vocab_size = 20000 embedding_dim = 100 num_filters = 100 filter_sizes = [3, 4, 5] hidden_dims = 50 num_classes = 2 # 定义模型输入 input_layer = Input(shape=(max_sequence_length,)) # 定义嵌入层 embedding_layer = Embedding(max_vocab_size, embedding_dim, input_length=max_sequence_length)(input_layer) # 定义卷积层和池化层 conv_blocks = [] for filter_size in filter_sizes: conv_layer = Conv1D(num_filters, filter_size, activation='relu')(embedding_layer) max_pool_layer = GlobalMaxPooling1D()(conv_layer) conv_blocks.append(max_pool_layer) # 拼接卷积层和池化层的输出 concat_layer = keras.layers.concatenate(conv_blocks) # 定义全连接层 dense_layer = Dense(hidden_dims, activation='relu')(concat_layer) # 定义输出层 output_layer = Dense(num_classes, activation='softmax')(dense_layer) # 构建模型 model = Model(inputs=input_layer, outputs=output_layer) # 编译模型 model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy']) # 训练模型 model.fit(x_train, y_train, batch_size=64, epochs=10, validation_data=(x_val, y_val)) ``` 在上述代码中,我们使用了Keras中的`Input`,`Embedding`,`Conv1D`,`GlobalMaxPooling1D`,`Dense`等模块来构建TextCNN模型。我们首先定义了一些超参数,然后定义了模型的输入层。我们接着定义了嵌入层,并将其作为卷积层的输入。接着,我们定义了多个不同大小的卷积层和池化层,最后将它们的输出拼接在一起。我们接着定义了一个全连接层和输出层,并使用`Model`函数将所有层连接起来。最后,我们使用`compile`函数来编译模型,并使用`fit`函数来训练模型。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值