【python】关于文件的读写

原创已于 2023-01-17 13:27:20 修改 · 590 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#python #开发语言

于 2022-12-30 17:26:48 首次发布

Python 专栏收录该内容

16 篇文章

订阅专栏

本文详细介绍了Python中读写txt和csv文件的方法，包括使用open和pandas，以及csv模块的writerow和writerows函数。在处理多列数据时，通过创建列表并转换为二维结构来实现数据写入。同时，文章还探讨了使用csv.reader读取文件的内容，并提到了xlrd和xlwt库进行Excel文件读写的选项。在写入文件时，注意使用newline=''参数以避免额外的换行问题。此外，文章还区分了writerow和writerows的区别，前者用于写入单行，后者适用于二维列表的写入。

一、txt读写

用pandas open with open等都可以都取

针对open，如果没有指定的文件，puthon会自动创建文件，只读模式r除外。

写入多列：目前只知道这种方式写入txt,agelist,genderlist,provincelist都是list


for s,t,a in zip(agelist,genderlist,provincelist):
        print(s)
        fp.write(f'{s},{t},{a}\n')

关于writelines(iterable) ，这个写入需要带上\n，否则就是一坨数据；他好像不支持一行一行写入，一行写入数据还是得用writerow才行，下面会说writerow和writerows的区别

二、多列写入Excel或者csv

    for s,t,a in zip(agelist,genderlist,provincelist):
        print(s)
        writer = csv.writer(fp)
        print(s,t,a)
#         fp.write(f'name:{s},age:{t},address:{a}\n')
#        fp.write(f'{s},{t},{a}\n')
        writer.writerow(f'{s},{t},{a}\n')

这种写法不行，得出的结果居然是一空格一个字符，到底是为什么？但是写入的步骤应该没错

看了一下writerow的参数，发现必须要是iterable才行，我这里面放的是string所以写入的时候直接遍历了，我试着直接把这三个直接写入到一个list里面，发现也不行 u.append(f'{s},{t},{a}')

得出的列表还是string的;

我应该要把这几个列表变成多个小的列表，如果把这个变成dataframe那种格式也行，但是目前不会；

经请教老师，操作如下：就是要先建立一个空list，然后循环遍历，建立一个大的list，好在这里的数据都是一一对应的，比较号操作；

2023/1/17插更一个点

直接append一个列表就可以，不用建立这么多list，也是够傻的

import csv
list1 = [1,3,4,5,6]
list2 = []
for i in list1:
    t = i+1
    list2.append([i,t])
list2

还有注意局部变量和全局变量；

import pandas as pd
import datetime
import csv
 
def get_province(idnum):
    pro_num = int(idnum[0:2])
    province_dict = {
        11 : "北京",
        12 : "天津",
        13 : "河北",
        14 : "山西",
        15 : "内蒙古",
        21 : "辽宁",
        22 : "吉林",
        23 : "黑龙江",
        31 : "上海",
        32 : "江苏",
        33 : "浙江",
        34 : "安徽",
        35 : "福建",
        36 : "江西",
        37 : "山东",
        41 : "河南",
        42 : "湖北",
        43 : "湖南",
        44 : "广东",
        45 : "广西",
        46 : "海南",
        50 : "重庆",
        51 : "四川",
        52 : "贵州",
        53 : "云南",
        54 : "西藏",
        61 : "陕西",
        62 : "甘肃",
        63 : "青海",
        64 : "宁夏",
        65 : "新疆",
        71 : "台湾",
        81 : "香港",
        82 : "澳门"
        }
    if province_dict[pro_num] is not None:
        return province_dict[pro_num]
    else:
        return False
def get_age(idnum):
    birth_year = int(idnum[6:10])
    birth_month =int(idnum[10:12])
    birth_date = int(idnum[12:14])
    now = (datetime.datetime.now())
    year = now.year
    month = now.month
    day = now.day
 
    if year == birth_year:
        return 0
    else:
        if birth_month > month or (birth_month == month and birth_date > day):
            return year - birth_year - 1
        else:
            return year - birth_year
def get_gender(idnum):
    gender_num = int(idnum[16:17])
    if gender_num %10 != 0:
        return 1
    else:
        return 0
    
if __name__ == '__main__':
    df = pd.read_csv(r'D:\test\re_id32.txt',names = ['idnumber'])
    fp = open(r'D:\test\re_id32_final.txt','a',newline = '')
#     fp = open(r'D:\test\re_id21_final.csv','w',newline = '')
    df1 = df['idnumber']
    df1 = list(df1)
    agelist = []
    genderlist = []
    provincelist = []
    for i in df1:
        try:
            idnum = i
            age = str(get_age(idnum))
            agelist.append(age)
            gender = str(get_gender(idnum))
            genderlist.append(gender)
            province = str(get_province(idnum))
            provincelist.append(province)
        except Exception as e:
            print(e)
#     print(agelist,genderlist,provincelist)
    u = []
    for i in range(0,len(agelist)):
# 因为y是局部变量，所以下一次循环又是一个空list
        temp = []
        temp.append(agelist[i])
        temp.append(genderlist[i])
        temp.append(provincelist[i])
        u.append(temp)
        print(temp)
    for s in u:
        writer = csv.writer(fp)
        writer.writerow(s)
    print(u)
    fp.close()
    print("finished!")

这里u生成的数据是这种格式的

[['35', '1', '天津'], ['32', '0', '天津'], ['34', '0', '北京']]

然后temp生成的数据是如下格式的

['35', '1', '天津']
['32', '0', '天津']
['34', '0', '北京']
['43', '1', '河北']

这里还需要注意一个点，open打开文件的时候，要注意一个参数，如果不写newline = ''，后续生成的数据会跳行，因为writer.writerow()写入的时候会自动生成一个\n，所以我的理解是newline = ''在写入是要用，不然会产生空行;

下面这篇文章详细解释了这个问题，但是我感觉我记不住，有兴趣了再看，知道要用就成；

如果 csvfile 是文件对象，则打开它时应使用 newline=‘’。
其备注：如果没有指定 newline=‘’，则嵌入引号中的换行符将无法正确解析，并且在写入时，使用 \r\n 换行的平台会有多余的 \r 写入。由于 csv 模块会执行自己的（通用）换行符处理，因此指定 newline=‘’ 应该总是安全的。

http://t.csdn.cn/cYY2z

这里再提一下writerow和writerows的区别：

writer.writerow:把单个列表写成一行

writer.writerows(iterable)：会把每个列表里的元素，先遍历然后生成相应的列：如果是二维列表，会把每一个列表变成一行，所以如果是二维列表的写入，直接用writerows更简单，不用先遍历列表，然后writerow单行写入这样更麻烦

import csv
list1 = ['35', '1', '天津']
with open(r"D:\test\r_a1.txt",'w',newline = '') as f1:
     for i in list1:
        writer =csv.writer(f1)
        s1 =writer.writerows(i)
print('finished')

3
5
1
天
津



import csv
list1 = [['35', '1', '天津'],['35', '11', '天津1']]
with open(r"D:\test\a8.txt",'w',newline = '') as f1:
    writer =csv.writer(f1)
# 如果用writerows 写入直接writerows(list1)即可；这样方便太多了，之前没发现；
    writer.writerows(list1)   
print('finished')

# 结果如下
# 35,1,天津
# 35,11,天津1

三、用csvreader 读取也比较简单

注意这里返回的数据都是列表形式

import csv
with open(r"D:\test\re_id32_final.csv") as f1:
    reader = csv.reader(f1)
    for row in reader:
        print(row)


['35', '1', '天津']
['32', '0', '天津']
['34', '0', '北京']
['43', '1', '河北']

['names']
['陈曦竞思']
['陈细亻毛']