跑项目实况
文章平均质量分 86
Otto_1027
The best way to not feel hopeless is to get up and do something.
展开
-
word2vec工具实战(使用gensim)
接下来就是正式使用word2vec的时候了,以下是使用word2vec的文件。然后就全部成了简体了,使用word2vec工具需要做的最后一步是分词。直接浏览,可以看出这里面全是繁体字,所以下面需要把繁体转换成简体。的文件名,第二个是要处理的数据文件名,第三个是要输出的文件名。文件放在同一个目录下,并且用命令行跳转到这个目录,然后执行。然后解压后放在一个能记住的位置,例如我是。其中,这一句是配置需要分词的文件。文件也是放到同一个目录下,然后在。这个库来解决,以下是分词的文件。文件所在的目录,在命令行输入。原创 2023-07-05 10:33:31 · 1516 阅读 · 0 评论 -
复现论文ChineseBERT(ONTONOTES数据集)
首先解决一下CUDA和Pytorch的版本匹配问题,再次检查一下作者提供的Pytorch安装代码,发现和我CUDA版本是不匹配的,看来这个需要自己修改一下,不能无脑复制。文件,再运行之前需要修改两个个参数,把这两个位置的地址换成自己的。的过程,最近感觉老在调包,一天下来感觉什么也没干,就直播记录一下跑模型的过程吧。改到一半的时候发现,好像这其他路径也得该啊,而且这个是在。等了一会也没反应,看了下说明,好像说是模型没训练初始化?又看了眼文档,好像是跑错文件了?的文件夹啊,是要把这个地址修改成自己的…原创 2023-06-29 17:30:03 · 1194 阅读 · 0 评论