python csv字符串写入_请教:如何把csv里的 emoji 字符串正确写入 DB?

博客讨论了如何处理CSV文件中以utf-16编码的emoji字符串,并在PostgreSQL UTF-8数据库中正确写入。作者提供了一种通过Python解码和转换的方法,包括使用'unicode-escape'和'utf-16'编码进行操作。
摘要由CSDN通过智能技术生成

【 在 adoal (阿豆) 的大作中提到: 】

: 标  题: Re: 请教:如何把csv里的 emoji 字符串正确写入 DB?

: 发信站: 水木社区 (Mon May 14 20:17:51 2018), 转信

: 【 在 xWvxYWYxvWx (xWvxYWYxvWxxWvxYWYxvWx) 的大作中提到: 】

: : 1. 是表情,而且看着像是是 utf-16 编码的 emoji. 这个是导出这张 csv 的脑残搞错了。但我没条件重新导。

: : 2. PostgreSQL, UTF-8 的,别的表都支持 emoji.

: : 3. 我想不关编码的事,'\ud83c\udf52' 是个普通的 str.

: 这个东西,到底是Python里的r'\ud83c\udf52'还是没有r的'\ud83c\udf52',

: 如果是后者,就可以直接像下面那样解出emoji了,如果是前者,可以这样:

:   r'\ud83c\udf52'.encode('ascii').decode('unicode-escape')

: (Python 2里可以不用encode这一步,直接decode)

: 于是就得到了后者,于是继续

: : In [91]: '\uD83C\uDF52'.encode('utf-16', 'surrogatepass').decode('utf-16')

: : 这样能解出 emoji.

: --

:  自以为是的立法者犯下了一个大错,以为自己能定义整个软件开发过程。他们既不了解其

:  开始也不了解其结果。学术界试了一下,然后就知难而退了。商业界则对其毫无办法。大

:  型软件开发商们斥巨资来制造代码,明明想要扮演上帝的角色,却还装作自己是人类的公

:  仆。所有人都在盯着镜子里的自己。计算机却在一旁偷偷的笑。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值