我有一篇摘要。我用一些正则表达式获取此摘要,因为文本的结构始终相同。
摘要中有一个句子“NAME is classificated as….”,我必须用一个从文本中抓取的标题来代替它,标题由单词1和单词2组成,用逗号隔开。只要我这样做,它就可以正常工作(因此,我不会添加完整的代码,因为它非常大,我做不到,而且无论如何,问题不在我将提供的范围之外。
我需要根据word1添加unicode字符\u21191或\u2193,这与字典中的正值或负值相关。这必须在替换句子之前完成。
我的代码基本如下:import re
import io
file=open(Summaries_file,'a')#also tried open(Summaries_file,'a', encoding="UTF_16_LE") and file=io.open(Summaries_file,'a', encoding="UTF_16_LE")
code_dict["page"]="Word1\u2191"
page="page"
summary = "Data is: 111919919. Name is classified as an infered value".
print(summary)
#OUTPUT>"Data is: 111919919. Name is classified as an infered value".
title= "Word1, Word2"
#this is the part added to regular code>>>>
titlelist=title.split(",")
if titlelist[0]==code_dict[page]:
titlelist[0]=code_dict[page]+"\u2191"
title=str(titlelist)
print(titlelist[0])
#OUTPUT>"Word1↑"#It displays the arrow well
print(title) #ok, too.
#OUTPUT>"Word1↑, Word2"
#We go back to the end of the normal code
insert=re.compile("is classified as")
print(type(summary))
#
summary=str(insert.sub(title, summary))
print(summary)
#OUTPUT>"Data is: 111919919. Name Word1↑, Word2 an infered value".
print("passed")
file.write(title+'\n')
file.write(summary+'\n')
然后回溯(最近一次呼叫最后一次):
^{pr2}$
现在,我想不通了,我真的被困在这件事上了。
我不知道为什么它一开始写不成功,因为它显示了很好的符号,而且我在一些测试中明确地编码到了正确的系统,甚至用正确的编码打开了文件。在
我试了很多你可以在那里读到的东西:
实际上,原始代码更大,但我尝试了这种方法,它的工作方式相同,而且输入类型完全相同。在
不管怎样,问题不会像其他帖子一样出现在控制台上,因为问题是由未显示的write指令引起的,此外,字符在我的控制台上显示得很好…
我真的不知道发生了什么以及如何处理这个问题。
谢谢你的见解。在