参考这篇讲的很清楚详细,
下面记录一些自己的二次处理。
批量读取Excel列数据进行ner并写入
import pandas as pd
import read_excel
df=read_excel.df1
#获取先提供列表便于切片用
juzi = read_excel.get_juzi(df)
s_str = juzi.apply(str)
#print(s_str)
from paddlenlp import Taskflow
ner = Taskflow("ner")
# 遍历新的 Series 中的每个字符串,并将其打印出来
my_list = []
for string in s_str:
print(ner([string]))
my_list.append(ner([string]))
# 创建一个DataFrame对象
df = pd.DataFrame({'My List': my_list})
# 将DataFrame对象写入Excel文件
df.to_excel('my_list.xlsx', index=False)
结果: