python 的 pandas dataframe 读写 与 txt 读写

python pandas 读写文件:

读:

import pandas as pd
file_path = "abc.csv"
data = pd.read_csv(file_path) # data 是个dataframe,可以进行 dataframe 的操作(切割,分块,计算等等)

写:

data = pd.DataFrame(columns=("index", "Kernel", "Context", "Stream"))
serise = [i, kernel_name_new, context, stream]  # 每一个list的每一个元素是字符串
data.loc[i] = serise                            # 逐行写入
data.to_csv(path_or_buf="info.csv", index=False) # 写入csv文件

使用 pandas 很方便。主要是利用dataframe 的各种操作,但面对大型文件的读写是不方便的。上述方法处理一个1.2G的 csv 文件非常慢!

使用 python 内建 open() 方法读写文件。

读:

file_path = "abc.csv"
with open(file_path) as f:
    for i, line in enumerate(f.readlines()):
        # i 是行数
        # line 是每行的字符串,可以使用 line.strip().split(",") 按分隔符分割字符串
    f.close()

写:

file_handle = open('info.txt', 'w')
file_handle.write("index"+","+"Kernel"+“,"+"Context"+","+"Stream"+'\n') # 写列名
serise = str(i)+","+kernel_name_new+","+context+","+stream  # 每个元素都是字符串,使用逗号分割拼接成一个字符串
file_handle.write(serise+'\n') # 末尾使用换行分割每一行。
file_handle.close()

速度非常快!

  • 3
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 可以使用pandas库中的read_csv函数来读取txt文件,并将其转换为dataframe格式。具体操作如下: 1. 导入pandas库 ```python import pandas as pd ``` 2. 使用read_csv函数读取txt文件 ```python df = pd.read_csv('file.txt', sep='\t') ``` 其中,file.txt为要读取的txt文件名,sep='\t'表示使用制表符作为分隔符。 3. 查看读取的dataframe ```python print(df) ``` 这样就可以将txt文件读取为dataframe格式了。 ### 回答2: Python是一种高级编程语言,拥有许多功能强大的库和模块来处理不同的任务。pandasPython的一种数据分析库,用于读取、处理和分析各种类型的数据。在pandas中,DataFrame是一个二维表格,可以将Excel工作表或CSV文件等数据导入DataFrame。除此之外,pandas还支持通过Python中的读取文本文件的函数,如read_csv()和read_excel()等,将文本文件读取到DataFrame中。 在Python中使用pandas将文本文件读取到DataFrame中,可以按照以下步骤进行操作: 1. 导入pandas库及相关依赖 首先需要导入pandas库和相关依赖,这些依赖包括numpy和matplotlib等。使用如下代码导入: ```python import pandas as pd import numpy as np import matplotlib.pyplot as plt ``` 2. 读取文本文件 使用pandas库的read_csv()函数读取文本文件。read_csv()函数可以读取CSV(逗号分隔的值)文件,并将其保存为一个DataFrame对象。如果文件不是CSV文件,则可以使用其他读取函数,例如read_table()函数。 ```python df = pd.read_csv('file.txt', delimiter='\t') ``` 上述代码中,read_csv()函数读取名为“file.txt”的文本文件,并使用Tab键作为分隔符。读取成功后,将文件中的数据保存为一个DataFrame对象,并将其赋值给df变量。 3. 处理DataFrame 一旦将文本文件保存为DataFrame对象,就可以对其进行各种操作,例如过滤列或行,添加新列等。可以使用pandas库提供的方法轻松地对DataFrame进行各种操作。例如,假设文件中包含以下内容: ```txt Name Age Sex John 28 Male Linda 32 Female ``` 使用read_csv()函数读取后,可以使用df.head()函数查看数据的前几行,如下所示: ```python print(df.head()) ``` 输出结果为: ``` Name Age Sex 0 John 28 Male 1 Linda 32 Female ``` 可以看到,文件中的三列已被转换为DataFrame中的三个列,并包含了文件中的所有行。 以上就是使用Python读取txtDataFrame的简单过程。使用pandas库,可以轻松地读取不同类型的文本文件,并将其转换为DataFrame对象,然后对其进行各种处理和操作,以便更好地分析和使用数据。由于pandas库已成为Python数据科学领域中的重要工具,因此我们强烈建议您学习并使用pandas库,以便在Python中高效地处理和分析数据。 ### 回答3: Python是很强大的一种编程语言,使用Python可以很方便地读取、处理和分析数据。而在数据处理过程中,经常需要用到pandas这个Python库。那么,如何使用Pythontxt文件读取到pandasDataFrame中呢? 实现这个过程,可以通过以下步骤: 1. 通过pandas读取txt文件 首先,需要导入pandas库。在Python中,导入库可以使用import命令。在这个问题中,需要导入pandas库,使用的命令是import pandas as pd。然后,使用pandas库的read_table()函数来读取txt文件。该函数的基本语法格式如下: pd.read_table('file_path', sep='separator', header='header_name') 其中,'file_path'是文件的路径;'separator'是分隔符,默认为'\t';'header_name'是传入列表或整数来指定哪些行作为列名,如果没有列名就指定为None,添加的话,这个header就是第一行的行数。 2. 用DataFrame处理文本和数据 将数据加载到DataFrame之后,就可以对数据进行操作和处理了。pandas提供了大量的函数,用于处理DataFrame中的文本和数据。例如,可以使用groupby()函数对数据进行分组,使用sort_values()函数对数据进行排序,使用drop_duplicates()函数删除重复的数据行等等。 3. 将数据保存到txt文件 在对数据进行操作和处理完成后,可能需要将数据保存到txt文件中。可以使用to_csv()函数将DataFrame保存为csv文件。该函数的基本语法格式如下: DataFrame.to_csv('file_path', index=False, sep='separator') 其中,'file_path'是要保存的csv文件路径;'index=False'表示不保存行索引;'separator'是分隔符,默认为','。 综上所述,以上就是使用Pythontxt文件读取到pandasDataFrame中的步骤和方法啦!希望我的回答能够帮助到你,祝您编程愉快!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值