如果该unicode中是纯数字的话,直接将该unicode转为str(用
string.encode(
"utf-8"
)),然后在用int函数进行转换,int(string)
但今天脚本中unicode有空格字符串,所以在进行int(string)的时候会报错:
ValueError: invalid literal for int() with base 10: '\xef\xbb\xbf\xef\xbb\xbf32'
里面的字符串转换为数据失败报错
用
filter
(
str
.isdigit, string.encode(
"utf-8"
))将unicode中的非数字的部分去掉,注:该函数不会改变原来的字符串对象,所以你要用一个变量接受返回来的值
如: strData =
filter
(
str
.isdigit, string.encode(
"utf-8"
)) , 然后再进行int转换 : int(strData)即可