【 在 adoal (阿豆) 的大作中提到: 】
: 标 题: Re: 请教:如何把csv里的 emoji 字符串正确写入 DB?
: 发信站: 水木社区 (Mon May 14 20:17:51 2018), 转信
: 【 在 xWvxYWYxvWx (xWvxYWYxvWxxWvxYWYxvWx) 的大作中提到: 】
: : 1. 是表情,而且看着像是是 utf-16 编码的 emoji. 这个是导出这张 csv 的脑残搞错了。但我没条件重新导。
: : 2. PostgreSQL, UTF-8 的,别的表都支持 emoji.
: : 3. 我想不关编码的事,'\ud83c\udf52' 是个普通的 str.
: 这个东西,到底是Python里的r'\ud83c\udf52'还是没有r的'\ud83c\udf52',
: 如果是后者,就可以直接像下面那样解出emoji了,如果是前者,可以这样:
: r'\ud83c\udf52'.encode('ascii').decode('unicode-escape')
: (Python 2里可以不用encode这一步,直接decode)
: 于是就得到了后者,于是继续
: : In [91]: '\uD83C\uDF52'.encode('utf-16', 'surrogatepass').decode('utf-16')
: : 这样能解出 emoji.
: --
: 自以为是的立法者犯下了一个大错,以为自己能定义整个软件开发过程。他们既不了解其
: 开始也不了解其结果。学术界试了一下,然后就知难而退了。商业界则对其毫无办法。大
: 型软件开发商们斥巨资来制造代码,明明想要扮演上帝的角色,却还装作自己是人类的公
: 仆。所有人都在盯着镜子里的自己。计算机却在一旁偷偷的笑。