最近发现一个python库Unidecode,用来转换多国文字、字符完全无压力,非常强大。
使用方法:
>>> from unidecode import unidecode
>>> unidecode(u'ko\u017eu\u0161\u010dek')
'kozuscek'
>>> unidecode(u'30 \U0001d5c4\U0001d5c6/\U0001d5c1')
'30 km/h'
>>> unidecode(u"\u5317\u4EB0")
'Bei Jing '
应用场景:比如处理自动将文章的标题转换成拼音以生成url。