Python利用Stanford parser对文本进行词性分析并批量导出

**
对excel文件中的英文文本内容进行词性分析
**

#导入库
import xlrd
import nltk
import numpy as np
import pandas as pd
import os
from nltk.parse.stanford import StanfordParser
#读入文件
List1 = {}
data = xlrd.open_workbook(u'D://123.xlsx', encoding_override='utf-8')  #双斜杠//是必须的
table = data.sheets()[0]    #选定表
nrows = table.nrows         #获取行号
ncols = table.ncols          #获取列号
print(nrows)
print(ncols)

#环境配置
java_path = "D:/Program Files/Java/jdk-17.0.1/bin/java.exe"  #电脑上java的安装路径
os.environ['JAVAHOME'] = java_path
eng_parser = StanfordParser(r"D:\stanford-parser-full-2017-06-09\stanford-parser-full-2017-06-09\stanfordNLP\stanford-parser.jar",r"D:\stanford-parser-full-2017-06-09\stanford-parser-full-2017-06-09\stanfordNLP\stanford-parser-3.8.0-models.jar",r"D:\stanford-parser-full-2017-06-09\

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值