终于用到python了。
从后台splunk里面导出了几万条用户搜索记录(.csv格式),但全是百分号那种url码(GBK码),想把它转成中文看看都是什么。搜了一圈网上的工具,发现都只能一条一条转。好像可以用VB在excel里面写个程序但是好麻烦....而且也不懂。于是干脆看看python能不能帮忙。
举例:
把 这种字符串 "%E6%9C%8D%E5%8A%A1%E5%8C%BA" 转化成汉字
答案是 "服务区"
验证方法 将以下URL
http://www.baidu.com/s?wd=%E6%9C%8D%E5%8A%A1%E5%8C%BA
输入到地址栏回车,会显示出:
原始文件 03042015.csv,内容长相:
在powershell里面运行程序 forunicodeutf8.py
代码