现有数据为这
1,2,11,"MiWiFi-R4AC|百兆双频|小米|R4AC|小米,FW325R|百兆单频|迅捷|FW325R|迅捷,device_12|百兆单频|MERCURY|device_12|MERCURY,FIR302C|百兆单频|斐讯|FIR302C|斐讯,TL-WR886N|百兆单频|TPLINK|TL-WR886N|TPLINK,TL-WR890N|百兆单频|TPLINK|TL-WR890N|TPLINK,MW310R|百兆双频|水星|MW310R|水星,TL-WDR5620|百兆双频|TP-LINK|TL-WDR5620|TP-LINK,MW313R|百兆双频|水星|MW313R|水星,TL-WR842N|百兆单频|TPLINK|TL-WR842N|TPLINK,MiWiFi-R4CM|百兆单频|小米|小米4C|小米,MW325R|百兆单频|水星|MW325R|水星,MW155R|百兆双频|水星|MW155R|水星,MW150R|百兆双频|水星|MW150R|水星"
需要将后半部分,全部拆分成列。首先读取文件,由于文件比较大。
tempData=pd.read_csv(filName,low_memory=False,compression='gzip')
读取压缩文件,至于为什么加low_memory=False 后面了再说。
先确定文件列名称:
读取完之后 至于分多少列 文件中第三个字段是有多少组数据,
那么 截取三个字段的值
maxColumns=tenpData.iloc[0,2]
按照文件具体名称生成文件列名称
strChar=u"路由器"
strSourceColu