import pandas as pd
# 读取原始Excel表格,获取art_content列数据
df = pd.read_excel('path/to/your/excel/file.xlsx')
art_contents = df['art_content']
# 在原Excel表格创建新列conclusion
df['conclusion'] = ''
# 遍历art_content列的每个元素,找到"in conclusion"的段落并提取出来,添加到对应行的conclusion列
for i, art_content in enumerate(art_contents):
# 查找包含"in conclusion"的段落
conclusion_index = art_content.lower().find('in conclusion')
if conclusion_index != -1:
# 如果找到了,则提取该段落并添加到对应行的conclusion列
conclusion = art_content[conclusion_index:]
df.loc[i, 'conclusion'] = conclusion
# 保存修改后的Excel表格
df.to_excel('path/to/your/new/excel/file.xlsx', index=False)
find()
方法不区分大小写,因此在查找包含 "in conclusion"
的段落时,应该将目标字符串转换为小写或大写后再进行查找。
该代码是读取一个指定 Excel 文件中的 art_content
列,并在相同 Excel 文件中创建一个新列 conclusion
,然后遍历 art_content
的每个元素,在其中查找包含 "in conclusion"
字段的段落,并将该段落提取并添加到相应的 conclusion
列。如果未找到包含 "in conclusion"
的段落,则跳过该行。