Papaya沐-CSDN博客

原创图片类word报告生成器

由于最近需要收集同伴们的核酸检测报告，做成word文档提交，就写了一个程序。本代码推荐使用jupyter notebook打开。输入数据：图片文件，图片文件命名需为“姓名+其他字段”。输出要求格式：姓名+固定词（例如：李华核酸检测报告），后填对应图片。结果示例如下：需要用到的工具包pip install os #使用 os 工具包读取文件名称pip install python-docx # 使用python-docx制作word文档p

2022-05-02 15:15:53 2523

原创利用Word2Vec在语料中构建种子词集同类词

nlp小白努力探索的第n天......今天记录和分享利用gensim.model.word2vec.Word2Vec在语料中构建种子词集同类词先说明任务情况：全量语料数据中包含：已打标语料，未打标语料。从已打标语料中提取出关键词，我们将这部分词汇成为种子词集。现需要从全量语料数据中找到种子词集的同类词。步骤：1）对语料库建立word2vec词向量模型；2）利用 gensim.model 联动的词汇相似度计算方法，以种子词集作为研究对象在语料库中找出同类词。数据展示：文件名：u

2022-04-06 17:28:44 3781 1

原创使用gensim.models.word2vec.LineSentence之前的语料预处理

nlp小白摸爬滚打的叨叨叨记录在进行自然语言处理工作时，不可避免使用大型语料库。在这里记录并分享做自己实验的时候读函数文档，以及参考各路大神，终于明白LinSentence如何使用的历程。函数文档链接：models.word2vec – Word2vec embeddings — gensim（课题师兄说使用库的时候尽量看库文档）LinSentence 函数在使用之前需要对待处理的文本数据进行分词，并以空格分隔；函数在运行时，按行读取已经以空格分隔的文档。以下是实验代码导..

2022-04-06 10:41:57 5269 3

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 图片类word报告生成器

原创 利用Word2Vec在语料中构建种子词集同类词

原创 使用gensim.models.word2vec.LineSentence之前的语料预处理

空空如也

空空如也

原创图片类word报告生成器

原创利用Word2Vec在语料中构建种子词集同类词

原创使用gensim.models.word2vec.LineSentence之前的语料预处理