MA的奋斗史
ICHhassPROGRAMM
这个作者很懒,什么都没留下…
展开
-
2021.11.21 以为不再用python分析语料库的我又开始了作死的全过程——用spacy给德语txt文档lemmatize并将结果写入csv及txt(二)
以为不再用python分析语料库的我又开始了作死的全过程——python/pycharm/pip安装spacy1 安装各类所需软件及lib包1.1功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格1.1.1SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入1 安装各类所需软件及lib包先安装的pytho原创 2021-11-21 12:38:21 · 1213 阅读 · 0 评论 -
2020.7.19 用spacy给德语txt文档lemmatize并将print结果写入csv
本文仅作为个人语料处理日志,若有错误请各位看官轻喷。欢迎交流o( ̄▽ ̄)ブ今天又是坐在电脑前和 python 从 dusk 肝到 dawn 的一天,主要解决的问题是把德语原文中的动词用spacy的lemmatizer还原到动词原形(infinitive)。主要有以下三个步骤:1. python读取txt,也就是原文中的所有动词2. lemmatization,对原文动词进行处理3. 将还原好的动词重新写入文档1. python读取txt,也就是原文中的所有动词首先import需要用到的包,并调用.原创 2020-07-20 01:39:41 · 656 阅读 · 0 评论 -
2020.7.17 继续肝第一个exel文件…用python的nltk模块给上百行的动词还原lemmatization
本文仅作为个人语料处理日志,若有错误请各位看官轻喷。欢迎交流o( ̄▽ ̄)ブ感觉在最初的动名词搭配筛选就仔细分析性数格很费时间。今天就只筛选动名词短语吧。今天纠结的点如下:这个作者使用很多状态被动态,ich war überzeugt, wir waren berührt… 还是也收在我的动名词搭配里吧;某些动词第二分词构成的短语在句中作为一个单独成份,不知道要不要归在内,“abgesehen davon”,可能以后还会出现“überzeugt davon/ unbewusst davon”,可.原创 2020-07-17 20:54:22 · 255 阅读 · 0 评论