2021.11.21 以为不再用python分析语料库的我又开始了作死的全过程——用spacy给德语txt文档lemmatize并将结果写入csv及txt（二）

最新推荐文章于 2024-03-05 15:03:43 发布

ICHhassPROGRAMM

最新推荐文章于 2024-03-05 15:03:43 发布

阅读量1.2k

点赞数

分类专栏： MA的奋斗史文章标签： python nlp 自然语言处理

本文链接：https://blog.csdn.net/ICHhassPROGRAMM/article/details/121439963

版权

本文介绍了如何利用Anaconda环境，通过conda安装spacy的德语模型，并使用该模型对德语文本进行lemmatize处理。同时提到了csv和re包在处理过程中的作用，完整代码来源于程序员男友的帮助。

摘要由CSDN通过智能技术生成

1 所需软件及packages

1.1 软件/程序

Anaconda （官网）
（里头的）spider
（里头的）prompt或win+R 👉 cmd

1.2 packages

spaCy：有各种语言nlp的分析包，官网查看安装方式；我选的conda安装 - German - efficiency，官网提供的代码为（在梯子加持下安装很顺利）：

conda install -c conda-forge spacy
python -m spacy download de_core_news_sm

csv（python自带）
re（py自带）

spacy用于分析德语文本（词汇量更大一版）的包，安装了快一个小时也没成功，不推荐了：

de_dep_news_trf

2 完整代码

import spacy
import csv
import re

#载入spacy的德语包
nlp = spacy.load('de_core_news_sm') 

#读取txt文件，文件需提前处理为utf8格式，否则有乱码
file = open(r'填文件路径', mode='r', encoding='utf-8', errors=

最低0.47元/天解锁文章

ICHhassPROGRAMM

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
2021.11.21 以为不再用python分析语料库的我又开始了作死的全过程——用spacy给德语txt文档lemmatize并将结果写入csv及txt（二）

以为不再用python分析语料库的我又开始了作死的全过程——python/pycharm/pip安装spacy1 安装各类所需软件及lib包1.1功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格1.1.1SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入1 安装各类所需软件及lib包先安装的pytho
复制链接

扫一扫

专栏目录