将windows上文件的格式从UTF-16转为utf-8,如果不转可能会有问题
[root@Cloud-Server ~]# file /root/111111.txt
111111.txt: Little-endian UTF-16 Unicode text, with CRLF line terminators
[root@Cloud-Server ~]#
[root@Cloud-Server ~]# iconv -f utf-16 -t utf-8 /root/111111.txt > /root/222222.txt
[root@Cloud-Server ~]#
[root@Cloud-Server ~]# file /root/222222.txt
222222.txt: UTF-8 Unicode text, with CRLF line terminators
[root@Cloud-Server ~]#
原始txt 文件格式如下:
[root@LG-Cloud-Server ~]# more /root/222222.txt |head -10
102100014904:中国工商银行股份有限公司北京岳各庄支行
102100002003:中国工商银行股份有限公司北京白云路支行
102100000064:中国工商银行股份有限公司北京樱桃园支行
102100000185:中国工商银行股份有限公司北京菜市口支行
102100009795:中国工商银行股份有限公司北京中航油支行
102100001153:中国工商银行股份有限公司北京城关支行
102100001274:中国工商银行股份有限公司北京燕莎支行
102100002484:中国工商银行股份有限公司北京天宁寺支行
102100022099:中国工商银行股份有限公司北京酒仙桥支行
102100023737:中国工商银行股份有限公司北京科技园东区支行
[root@LG-Cloud-Server ~]#
使用python3 将txt转为csv文件
import csv
out = open('/root/222222.csv','w',newline='')
csv_writer = csv.writer(out,dialect='excel')
f = open("/root/222222.txt","r")
for line in f.readlines():
line=line.replace(':','\t')
list = line.split()
csv_writer.writerow(list)
注意:你的txt文件分隔符以什么分割的就在split()里面写成什么如 split(';');
如果需要换行在 strip('\n')
# 检查csv文件
# 读取csv文件的前10行
import csv
with open('/root/222222.csv') as csvfile:
reader = csv.reader(csvfile)
for i,row in enumerate(reader):
#print(row['BANKCODE'], row['BANKNAME'])
print(row)
if(i >= 9):
break
# 输出结果如下:
['102100014904', '中国工商银行股份有限公司北京岳各庄支行']
['102100002003', '中国工商银行股份有限公司北京白云路支行']
['102100000064', '中国工商银行股份有限公司北京樱桃园支行']
['102100000185', '中国工商银行股份有限公司北京菜市口支行']
['102100009795', '中国工商银行股份有限公司北京中航油支行']
['102100001153', '中国工商银行股份有限公司北京城关支行']
['102100001274', '中国工商银行股份有限公司北京燕莎支行']
['102100002484', '中国工商银行股份有限公司北京天宁寺支行']
['102100022099', '中国工商银行股份有限公司北京酒仙桥支行']
['102100023737', '中国工商银行股份有限公司北京科技园东区支行']
查看最终生成的csv文件的前10行数据如下:
[root@LG-Cloud-Server ~]# more /home/oracle/222222.csv |head -10
102100014904,中国工商银行股份有限公司北京岳各庄支行
102100002003,中国工商银行股份有限公司北京白云路支行
102100000064,中国工商银行股份有限公司北京樱桃园支行
102100000185,中国工商银行股份有限公司北京菜市口支行
102100009795,中国工商银行股份有限公司北京中航油支行
102100001153,中国工商银行股份有限公司北京城关支行
102100001274,中国工商银行股份有限公司北京燕莎支行
102100002484,中国工商银行股份有限公司北京天宁寺支行
102100022099,中国工商银行股份有限公司北京酒仙桥支行
102100023737,中国工商银行股份有限公司北京科技园东区支行
[root@LG-Cloud-Server ~]#