- 博客(2)
- 收藏
- 关注
原创 商品情感分析
介绍 比赛链接: https://www.heywhale.com/home/competition/609cc718ca31cd0017835fdc 内含4个数据集: 商品信息.csv (product_information.csv) 商品类别列表.csv (product_cls.csv) 训练集.csv (product_train.csv) 测试集.csv (product_test.csv) 我们首先对product_train.csv进行预处理。 数据ID,用户ID,商品ID,评论时间戳
2021-06-21 18:46:53 465
原创 UER-py快速上手
快速上手UER模型及数据集书评语料 模型及数据集 我们首先使用BERT模型和豆瓣书评分类数据集。我们在书评语料上对模型进行预训练,然后在书评分类数据集上对其进行微调。这个过程有三个输入文件:书评语料,书评分类数据集和中文词典。 模型链接:UER-py 书评语料 书评语料是由书评分类数据集去掉标签得到的。我们将一条评论从中间分开,从而形成一个两句话的文档,具体可见corpora文件夹中的book_review_bert.txt 分类数据集的格式如下: 词典文件的格式是一行一个单词,我们使用谷歌提供的包含2
2021-04-10 17:04:11 1363
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人