联系微信:wusheng9922
工作中经常遇到 DataFrame结构 一列 数据 存了多个字段,或者 想要去除 开头结尾 与业务无关的字符,形如:

以此为例 我们 提取出 Product ID后边的四位 数字 单独成一列,还是有很多细节 所以本文介绍一下。
1将表格df2内数据转换成字符串格式
df3=df2.astype(str)
此时已经转换新的表 已经赋值给df3
整体结构仍是DataFrame,每个字段内的数据都已经通过 astype(str)转换成了 字符串。
2提取产品列用str.split分列
df3.产品.str.split