Windows下使用Glove训练自己的中文语料库
一、 准备自己的语料库使用爬虫爬取数据,爬取之后的中文文本数据不能直接使用,需要进行分词,分完词后保存为data.txt(这是我爬取的豆瓣影评的数据)二、下载Glove代码https://github.com/stanfordnlp/GloVe将数据data.txt保存在Glove的主文件夹下三、修改bash打开 demo.sh,修改相应的内容修改如下:因为demo默认是下载网上的语料来训练的,如果想要训练自己的语料,就需要注释掉,并且把语料替换掉,修改如下:下边的代码,原来是这样
原创
2021-04-07 17:34:58 ·
2548 阅读 ·
4 评论