自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 图片类word报告生成器

由于最近需要收集同伴们的核酸检测报告,做成word文档提交,就写了一个程序。本代码推荐使用jupyter notebook打开。输入数据:图片文件,图片文件命名需为“姓名+其他字段”。输出要求格式:姓名+固定词(例如:李华核酸检测报告),后填对应图片。结果示例如下:需要用到的工具包pip install os #使用 os 工具包读取文件名称pip install python-docx # 使用python-docx制作word文档p

2022-05-02 15:15:53 2523

原创 利用Word2Vec在语料中构建种子词集同类词

nlp小白努力探索的第n天......今天记录和分享利用gensim.model.word2vec.Word2Vec在语料中构建种子词集同类词先说明任务情况:全量语料数据中包含:已打标语料,未打标语料。从已打标语料中提取出关键词,我们将这部分词汇成为种子词集。现需要从全量语料数据中找到种子词集的同类词。步骤:1)对语料库建立word2vec词向量模型;2)利用 gensim.model 联动的词汇相似度计算方法,以种子词集作为研究对象在语料库中找出同类词。数据展示:文件名:u

2022-04-06 17:28:44 3781 1

原创 使用gensim.models.word2vec.LineSentence之前的语料预处理

nlp小白摸爬滚打的叨叨叨记录在进行自然语言处理工作时,不可避免使用大型语料库。在这里记录并分享做自己实验的时候读函数文档,以及参考各路大神,终于明白LinSentence如何使用的历程。函数文档链接:models.word2vec – Word2vec embeddings — gensim(课题师兄说使用库的时候尽量看库文档)LinSentence 函数在使用之前需要对待处理的文本数据进行分词,并以空格分隔;函数在运行时,按行读取已经以空格分隔的文档。以下是实验代码导..

2022-04-06 10:41:57 5269 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除