- 博客(2)
- 收藏
- 关注
原创 商品情感分析
介绍比赛链接:https://www.heywhale.com/home/competition/609cc718ca31cd0017835fdc内含4个数据集:商品信息.csv (product_information.csv)商品类别列表.csv (product_cls.csv)训练集.csv (product_train.csv)测试集.csv (product_test.csv)我们首先对product_train.csv进行预处理。数据ID,用户ID,商品ID,评论时间戳
2021-06-21 18:46:53 433
原创 UER-py快速上手
快速上手UER模型及数据集书评语料模型及数据集我们首先使用BERT模型和豆瓣书评分类数据集。我们在书评语料上对模型进行预训练,然后在书评分类数据集上对其进行微调。这个过程有三个输入文件:书评语料,书评分类数据集和中文词典。模型链接:UER-py书评语料书评语料是由书评分类数据集去掉标签得到的。我们将一条评论从中间分开,从而形成一个两句话的文档,具体可见corpora文件夹中的book_review_bert.txt分类数据集的格式如下:词典文件的格式是一行一个单词,我们使用谷歌提供的包含2
2021-04-10 17:04:11 1259
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人