基于深度学习的文本分类

最新推荐文章于 2024-01-07 02:08:13 发布

Jack123456Jack

最新推荐文章于 2024-01-07 02:08:13 发布

阅读量232

点赞数

本文链接：https://blog.csdn.net/Jack123456Jack/article/details/107628244

版权

本文介绍了使用fasttext库进行文本分类的步骤，包括读取数据、构建模型和训练过程，并展示了如何评估模型性能。

摘要由CSDN通过智能技术生成

import pandas as pd
from sklearn.metrics import f1_score
train_df = pd.read_csv(’…/input/train_set.csv’, sep=’\t’, nrows=15000)
train_df[‘label_ft’] = ‘label’ + train_df[‘label’].astype(str)
train_df[[‘text’,‘label_ft’]].iloc[:-5000].to_csv(‘train.csv’, index=None, header=None, sep=’\t’)

读取文件

import fasttext# 调用第三方库
model = fasttext.train_supervised(‘train.csv’, lr=1.0, wordNgrams=2, verbose=2, minCount=1, epoch=25, loss=“hs”)#构建模型
val_pred = [model.predict(x)[0][0].split(’__’)[-1] for x in train_df.iloc[-5000:][‘text’]] # 训练模型
print(f1_score(train_df[‘label’].values[-5000:].astype(str), val_pred, average=‘macro’))
“”"
训练一个监督模型, 返回一个模型对象

@param input: 训练数据文件路径
@param lr: 学习率
@param dim: 向量维度
@param ws: cbow模型时使用
@param epoch: 次数
@param minCount: 词频阈

最低0.47元/天解锁文章

Jack123456Jack

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
基于深度学习的文本分类

import pandas as pdfrom sklearn.metrics import f1_scoretrain_df = pd.read_csv(’…/input/train_set.csv’, sep=’\t’, nrows=15000)train_df[‘label_ft’] = ‘label’ + train_df[‘label’].astype(str)train_df[[‘text’,‘label_ft’]].iloc[:-5000].to_csv(‘train.csv’, in
复制链接

扫一扫