python 各种形式之间的文件转换

 读取excel,读取结果是dataframe形式。

excelFile = r'analyze_search_category.xlsx'
df = pd.DataFrame(pd.read_excel(excelFile))
print(df)

 详情:(21条消息) 在Python中使用Pandas.DataFrame对Excel操作笔记一 - 从Excel里面获取说需要的信息_fengqiaoxian的博客-CSDN博客_dataframe读取excel

读取txt

df_exposure = pd.read_csv('haah.txt', sep='\t', header=None)  
# df_exposure.columns = ['y%s'%i for i in range(1, df_exposure.shape[1]+1)]
df_exposure.columns=['qq','ss1','ss2','ss3','ss4','aa']

上述.txt文件在代码同一目录,所以不用写路径。

dataframe导出成excel,csv

#定义导出的路径,并定义好文件名
resultPath = 'D:\我的文件\桌面内容\使用python读取Excel的路径\表格3.xlsx'
#导出文件
df3.to_excel(resultPath,sheet_name = "汇总",index = False,na_rep = 0,inf_rep = 0)

 如何将python处理好的DataFrame格式数据导出为xlsx格式的Excel文件? - 知乎 (zhihu.com)

【Python】DataFrame输出为csv\txt\xlsx文件_J小白Y的博客-CSDN博客_python dataframe输出csv文件 出现中文乱码:

# df转化为csv格式
resultPath = 'D:\pycharmproject\search_category\search_category2_3.csv'
#导出文件
df_search.to_csv(resultPath,sep=',',index=False,header=False,encoding='utf_8_sig')
#index是否要索引,header是否要列名,True就是需要

 dic转为txt

#清空文件
file = open('search_category2_dic.txt', 'w').close()
#把字典转为文本search_category2_dic
file = open('search_category2_dic.txt', 'w',encoding='utf-8')
for k,v in datadict.items():
   file.write(str(k)+' '+str(v)+'\n')
file.close()

 将excel格式转化为字典格式:

(22条消息) Python pandas 将Dataframe转化为列表嵌套字典_不知道怎么写代码的麻瓜的博客-CSDN博客_python将dataframe转为字典

(24条消息) 自定义一种pandas转化为python字典类型的形式_卡卡卡骨的博客-CSDN博客_python pandas 转字典

list转为字符串

list1 = ["a", "b", "c", "d"]
print(",".join(list1))

结果:
a,b,c,d 

分批读取txt、csv

open_diff = open(' XX.txt','r',encoding='utf-8') # 源文本文件
diff_line = open_diff.readlines()
line_list = []
for line in diff_line:
    line_list.append(line)

count = len(line_list)
print('源文件数据行数:',count)
#切分diff        
diff_match_split = [line_list[i:i+50000] for i in range(0,len(line_list),50000)]# 每个文件的数据行数
for i,j in zip(range(0,int(count/50000+1)),range(0,int(count/50000+1))):  # 写入txt,计算需要写入的文件数
    with open('./dataText/data%s.txt'%j,'w+',encoding='utf-8') as temp:
        for line in diff_match_split[i]:
            temp.write(line)
print('拆分后文件个数:',i+1)

 多个csv读取成一个

import pandas as pd
import glob
# dataCsv/data0.csv
csv_list = glob.glob(r'dataCsv/*.csv')
len(csv_list)
for i in csv_list:
    fr = open(i,'rb').read()
    with open('search_title_all_click.csv','ab') as f:
        f.write(fr)

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值