pandas 列拆分多列

博客内容讲述了如何处理一个包含设备信息的数据文件,特别是如何使用pandas将数据的后半部分拆分为多个列。在读取大文件时,由于文件类型和数据混合,需要设置low_memory=False来避免DtypeWarning。博主确定了列名,并根据文件中的第三字段值来决定拆分的列数。数据中每组信息由逗号和竖线分隔,博主完成了数据预处理的基本步骤。
摘要由CSDN通过智能技术生成

现有数据为这

1,2,11,"MiWiFi-R4AC|百兆双频|小米|R4AC|小米,FW325R|百兆单频|迅捷|FW325R|迅捷,device_12|百兆单频|MERCURY|device_12|MERCURY,FIR302C|百兆单频|斐讯|FIR302C|斐讯,TL-WR886N|百兆单频|TPLINK|TL-WR886N|TPLINK,TL-WR890N|百兆单频|TPLINK|TL-WR890N|TPLINK,MW310R|百兆双频|水星|MW310R|水星,TL-WDR5620|百兆双频|TP-LINK|TL-WDR5620|TP-LINK,MW313R|百兆双频|水星|MW313R|水星,TL-WR842N|百兆单频|TPLINK|TL-WR842N|TPLINK,MiWiFi-R4CM|百兆单频|小米|小米4C|小米,MW325R|百兆单频|水星|MW325R|水星,MW155R|百兆双频|水星|MW155R|水星,MW150R|百兆双频|水星|MW150R|水星"
 

需要将后半部分,全部拆分成列。首先读取文件,由于文件比较大。

tempData=pd.read_csv(filName,low_memory=False,compression='gzip')

读取压缩文件,至于为什么加low_memory=False  后面了再说。

先确定文件列名称:

读取完之后 至于分多少列 文件中第三个字段是有多少组数据,

那么  截取三个字段的值

maxColumns=tenpData.iloc[0,2]

按照文件具体名称生成文件列名称

strChar=u"路由器"
strSourceColu
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值