我有一个CSV file,在列和行对齐方面非常混乱。在第一个单元格中,所有列名都已声明,但它们不与下面的行对齐。所以当我在python using pandas中加载这个CSV时
我没有一个干净的数据帧
在下面的图片中,有一个例子说明了当列分开并与行匹配时,它应该是什么样子。在
一些细节:
几行原始CSV文件:Columns:
VMName;"Cluster";"time";"AvgValue";"MinValue";"MaxValue";"MetricId";"MemoryMB";"CpuMHz";"NumCpu"
Rows:
ITLT4301;1;"1-5-2018";976439;35059255;53842;6545371441;3235864;95200029;"MemActive";"4096";"0";"0"
代码:
^{pr2}$
在python中加载数据帧时的输出:VMName;"Cluster";"time";"AvgValue";"MinValue";"MaxValue";"MetricId";"MemoryMB";"CpuMHz";"NumCpu",,,
ITLT4301;1;"1-5-2018";976439,35059255 53842,6545371441 3235864,"95200029 MemActive"" 4096"" 0"" 0"""
期望输出:VMName Cluster time AvgValue MinValue MaxValue MetricId MemoryMB CpuMHz
ITLT4301 1 1-5-201 976439 35059255 53842 6545371441 95200029 MemActive
NumCpu
4096
希望这能使话题和问题稍微澄清一点。期望的输出是一个组织良好的数据帧,其中的列与基于分隔符“;”的行相匹配