我想从PyQt5 PlainTextEdit读取和写入unicode字符 .
它有一个非常奇怪的问题,经过一些尝试后才会出现,它是以下内容:
如果我输入字符串:
yóuxiāngdìzhǐ
进入PlainTextEdit并使用该方法(通过单击按钮):
userInput = self.rightTextEdit.toPlainText()
它给了我字符串:
yóuxingdìzhÐ
这显然搞砸了 . 但是,如果我只将第一个 ó 更改为 o ,它突然没有问题了:
input: youxiāngdìzhǐ
after method call: youxiāngdìzhǐ
所以我猜Qt5会在幕后尝试一些魔法并且无法猜测编码(为什么它会尝试猜测,要求开发人员选择编码会不会更好?) . 也许它只准备了一些字符,或者它认为 ó 是一个非常不寻常的字符,编码需要完全改变 .
由于Qt5不再具有任何QString方法,我怎么告诉PlainTextEdit,我希望将整个事物解释为unicode String?
我读到了这个问题:Set Qt default encoding to UTF-8,但标记为解决问题的答案仅解决了Qt4问题,而Qt5则不再使用这些方法 .
以下是我的源代码的重要部分:
from PyQt5.QtCore import *
from PyQt5.QtWidgets import *
...
class PinyinTransformerMainWindow(QMainWindow):
def createControls(self):
...
self.rightTextEdit = QPlainTextEdit('', self)
self.rightTransformButton = QPushButton('Transform (numbers)')
...
def addControlsEventHandlers(self):
self.leftTransformButton.clicked.connect(self.transformToPinyinWithTones)
self.rightTransformButton.clicked.connect(self.transformToPinyinWithNumbers)
def transformToPinyinWithNumbers(self):
userInput = self.rightTextEdit.toPlainText()
print("User input right:", userInput)
...
EDIT #1:
我写了这样的测试:
tonedText = "yóuxiāngdìzhǐ"
numberedText = "you2xiang1di4zhi3"
self.assertEquals(self.pinyin_tones_2_numbers_transformer.transform(tonedText), numberedText)
此测试使用转换方法,该方法与我在PyQt5 GUI中连接按钮单击的函数中使用的方法相同,并且运行时没有失败 . 这意味着错误必须在GUI中,我从PlainTextEdit获取String .
当我进入python控制台时:
>>> a = "yóuxiāngdìzhǐ".encode(encoding="utf-8")
>>> a
b'y\xc3\xb3uxi\xc4\x81ngd\xc3\xaczh\xc7\x90'
>>> a.decode()
'yóuxiāngdìzhǐ'
>>> a.decode(encoding="utf-8")
'yóuxiāngdìzhǐ'
所以这不是python3问题 . 但是,如果我在代码中执行此操作:
self.leftTextEdit.toPlainText().encode('utf-8').decode('utf-8')
我得到错误的字符串:
yóuxingdìzhÐ
EDIT #2:
我现在添加了另一个print(),如下所示:
print("Condition:", self.leftTextEdit.toPlainText().encode('utf-8').decode('utf-8') == "yóuxiāngdìzhǐ")
然后进入
yóuxiāngdìzhǐ
在PlainTextEdit中 . 这导致:
False
(!)因此,看起来在PlainTextEdit中对字符串的Qt5解释中存在错误 . 我能做些什么呢?
EDIT 3: Python版本:3.4 PyQt5版本:5.2.1使用的语言环境:('en_US','UTF-8')