文本分类识别系统1-keras版本

bug生成中

已于 2023-02-05 12:59:05 修改

阅读量517

点赞数 1

分类专栏： python实用思路讲解文章标签： python keras nlp

于 2021-08-20 13:19:52 首次发布

本文链接：https://blog.csdn.net/qq_34904125/article/details/119750820

版权

python实用思路讲解专栏收录该内容

106 篇文章 58 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

数据中包含了10个类别（书籍、平板、手机、水果、洗发水、热水器、蒙牛、衣服、计算机、酒店），共6万多条评论数据，数据有两个字段,其中cat字段表示类别,review表示用户的评价信息,数据总量为62774,且评价内容全部为中文。还有label，用0、1表示评论的积极和消极，这里用不到。

本次训练使用的是keras版本的代码，训练的模型保存为my_model.h5格式，

网上找的代码不能正常预测，这里写了个预测的代码

import pandas as pd
import re
import jieba as jb
from keras.preprocessing.text import Tokenizer
from keras.models import load_model
from keras.preprocessing.sequence import pad_sequences

classes = ['书籍','平板','手机','水果','洗发水','热水器','蒙牛','衣服','计算机','酒店']  #需要分的类别

#删除文本中的标点符号,特殊符号,还要删除一些无意义的常用词(stopword)
# 定义删除除字母,数字，汉字以外的所有符号的函数                      ##
def remove_punctuation(line):
    line = str(line)
    if line.strip() == '':
        re

了解本专栏

超级会员免费看

bug生成中

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
2
评论
文本分类识别系统1-keras版本

数据中包含了10个类别（书籍、平板、手机、水果、洗发水、热水器、蒙牛、衣服、计算机、酒店），共6万多条评论数据，数据有两个字段,其中cat字段表示类别,review表示用户的评价信息,数据总量为62774,且评价内容全部为中文。还有label，用0、1表示评论的好坏，这里用不到...
复制链接

扫一扫