s_utf8 = pd.Series([b"北京", b"北京市", b"北京地区"])
错误:
bytes can only contain ASCII literal characters
Python3则把系统默认编码设置为了 UTF-8
import sys
sys.getdefaultencoding()
'utf-8'
s1='北京'
s1.encode()
b'\xe5\x8c\x97\xe4\xba\xac'
带入原码
s_utf8 = pd.Series([b"\xe5\x8c\x97\xe4\xba\xac", b"\xe5\x8c\x97\xe4\xba\xac\xe5\xb8\x82", b"\xe5\x8c\x97\xe4\xba\xac\xe5\x9c\xb0\xe5\x8c\xba"])