读取dat/txt文件 ---高程数据

最新推荐文章于 2023-10-20 10:54:45 发布

许大妍数据分析完了并且毕业了

最新推荐文章于 2023-10-20 10:54:45 发布

阅读量994

点赞数

本文链接：https://blog.csdn.net/qq_42615615/article/details/115798779

版权

本文介绍了两种读取DAT文件的方法，一种使用pandas的read_table函数进行复杂处理，另一种通过打开文件并逐行读取数据到DataFrame中。两种方法都详细展示了如何处理字符串数据并转换为数值型。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

之前读的数据一直都是正常的csv文件，今天读dat文件的时候，非常的不顺利，最后研究出了两种方法，特此记录：

方法一：pd.read_table()
该方法比较复杂，涉及太多循环，慎用

A=pd.read_table(r'E:\jupyter_test_data\地形高程(1).txt',header=None,engine='python')
B=[]
for array in np.array(A):
# 先删去前面的空格，再将空格取代，再按照逗号分隔字符串数据
# 这里的0，是将array里的字符串取出来
    D=np.array(array[0].strip().replace(' ','').split(','))
    D=D[0:-2] # 这个是我自己的数据需要 删除最后一个数
    D=[float(d) for d in D]  #转化为浮点数
    B.append(D)
result=np.array(pd.DataFrame(B))

一个小技巧 list可以先变成df格式，再转化为np.array,有效避免在转化为数组的时候，外围变成array,里层还是一个list.

另外，一定要注意转化为float的时候，不能有空格，也不能有‘’，这种空的字符串

方法二：

import pandas as pd
f=open(r'E:\jupyter_test_data\地形高程(1).txt',encoding='utf-8')
sentimentlist=[]
for line in f:
    s =line.strip().replace(' ','').split(',')
    sentimentlist.append(s)
f.close()
df_train=pd.DataFrame(sentimentlist)