大数据可视化问题总结1

python3.7读取定宽数据

import struct

# 读取定宽数据
def import_data(import_file):
    '''
    转换成定宽数据
    :param import_file: 输入文件路径url
    :return: 定宽数据列表
    '''
    # 定义要数据的期望显示格式
    mask = "9s14s5s"
    data = []
    with open(import_file, "r") as f:
        for line in f:
            # 将一行解析成一个元组
            fields = struct.unpack_from(mask, line.encode())
            # 清楚每个字段两侧的空白字符,并打包到一个列表中
            data.append(list([f.strip() for f in fields]))
    return data

print(import_data('./data/ch02-fixed-width-2M.data'))

报错:

Traceback (most recent call last):
  File "D:/PycharmProjects/class-code/ch02/ch02-export-07.py", line 24, in <module>
    print(import_data('./data/ch02-fixed-width-1M.data'))
  File "D:/PycharmProjects/class-code/ch02/ch02-export-07.py", line 19, in import_data
    fields = struct.unpack_from(mask, line)
TypeError: a bytes-like object is required, not 'str'

解决:
line.encode()
str通过encode()方法可以编码为指定的bytes;
反过来,如果我们从网络或磁盘上读取了字节流,那么读到的数据就是bytes。要把bytes变为str,就需要用decode()方法;

报错:

Traceback (most recent call last):
  File "D:/PycharmProjects/class-code/ch02/ch02-export-07.py", line 24, in <module>
    print(import_data('./data/ch02-fixed-width-1M.data'))
  File "D:/PycharmProjects/class-code/ch02/ch02-export-07.py", line 19, in import_data
    fields = struct.unpack_from(mask, line.encode())
struct.error: unpack_from requires a buffer of at least 28 bytes

解决:
文件数据量太大,改成10行数据运行成功
fields = struct.unpack_from(mask, line.encode())
使用struct不能读取大量数据,只能对小部分数据读取

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值