Python利用Stanford parser对文本进行词性分析并批量导出

m0_71245676

于 2022-05-22 19:39:54 发布

阅读量355

点赞数

分类专栏：笔记文章标签： python 开发语言

本文链接：https://blog.csdn.net/m0_71245676/article/details/124914809

版权

**
对excel文件中的英文文本内容进行词性分析
**

#导入库
import xlrd
import nltk
import numpy as np
import pandas as pd
import os
from nltk.parse.stanford import StanfordParser
#读入文件
List1 = {}
data = xlrd.open_workbook(u'D://123.xlsx', encoding_override='utf-8') #双斜杠//是必须的
table = data.sheets()[0] #选定表
nrows = table.nrows #获取行号
ncols = table.ncols #获取列号
print(nrows)
print(ncols)

#环境配置
java_path = "D:/Program Files/Java/jdk-17.0.1/bin/java.exe" #电脑上java的安装路径
os.environ['JAVAHOME'] = java_path
eng_parser = StanfordParser(r"D:\stanford-parser-full-2017-06-09\stanford-parser-full-2017-06-09\stanfordNLP\stanford-parser.jar",r"D:\stanford-parser-full-2017-06-09\stanford-parser-full-2017-06-09\stanfordNLP\stanford-parser-3.8.0-models.jar",r"D:\stanford-parser-full-2017-06-09\

最低0.47元/天解锁文章

m0_71245676

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
Python利用Stanford parser对文本进行词性分析并批量导出

**对excel文件中的英文文本内容进行词性分析**#导入库import xlrdimport nltkimport numpy as npimport pandas as pdimport osfrom nltk.parse.stanford import StanfordParser#读入文件List1 = {}data = xlrd.open_workbook(u'D://123.xlsx', encoding_override='utf-8') #双斜杠//是必须的ta.
复制链接

扫一扫