自然语言处理学习笔记
文章平均质量分 64
跟自然语言处理有关的学习笔记
超能力猪
白手起家搞科研
展开
-
CLIP的model.py学习笔记
CLIP在github上的代码目录如下图 (左)所示,目录的展开图如下图 (右)所示,CLIP代码的模型部分在/clip文件夹下的model.py文件中,这个文件是后面重点剖析对象。/date文件夹下面为一些说明文件,/notebooks文件夹下是一些关于如何测试CLIP的教程。/ModelPt文件夹下是作者预训练的一些模型,是本地部署的时候下载加入的,在github上的代码没有这部分。此帖用于本人课程学习报告的支撑材料。原创 2024-01-11 11:08:57 · 783 阅读 · 0 评论 -
使用中文维基百科训练word2vec模型
训练结束后会产生三个模型文件wiki_zh.model、wiki_zh.model.wv.vectors.npy、wiki_zh.model.syn1neg.npy,找到其中的:opencc-1.0.1-win64,将wiki_zh.txt拷贝到该文件夹下,在opencc-1.0.1-win64文件夹下使用如下命令。命令执行一会,执行结束后会产生一个文件wiki_zh_jian.txt,这个文件就是简体的文本。执行结束后生成一个文件wiki_zh_jian_cut.txt。原创 2023-11-15 10:53:32 · 453 阅读 · 1 评论