Python pandas数据分列,分割符号&固定宽度

背景

数据分列在数据处理中很常见,数据分列一般指的都是字符串分割,这个功能在Excel里面很实用,处理数据非常方便,那么在pandas数据框中怎么使用呢,今天这篇文章就来详细介绍下

分列

模拟数据

以下面这9行数据作为案例来进行处理

模拟数据

读取数据

#加载库
import pandas as pd

#读取数据
data=pd.read_excel('data.xlsx')
读取数据

分割符号分列

主要运用了pandas里面列的str属性,str有很多的方法,感性的同学可以自动查找,这里不做过多介绍。分割字符用到的就是split方法重点:在分割前一定要把该列强制转换为字符型

#对指定列进行分割
split_data_1=data['分割字符'].astype('str').str.split('&',expand=True)

#修改分割后的字段名称
split_data_1.columns=['D_'+str(i) for i in split_data_1.columns]

#与原始数据进行合并
data_result=data.join(split_data_1)
分割符号

固定宽度分列

pandas里面没有固定分割的相应函数,这里巧妙的运用了辅助函数来进行处理,这里的固定宽度为1

#定义个辅助函数
def concat_split(x,width=1):
    result=''
    start=0
    while True:
        s=str(x)[start:start+width]
        
        if s:
            result =result + s + '&'
        else:
            break
        start=start+width
        
    return result[:-1]

#先利用辅助函数,再进行分割
split_data_2=data['固定宽度'].map(concat_split).str.split('&',expand=True)

#修改分割后的字段名称
split_data_2.columns=['W_'+str(i) for i in split_data_2.columns]

#与原始数据进行合并
data_result=data.join(split_data_2)
固定宽度

历史相关文章


以上是自己实践中遇到的一些问题,分享出来供大家参考学习,欢迎关注微信公众号:DataShare ,不定期分享干货

  • 5
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
你好!关于Python中的Pandas库进行数据处理,我可以为您提供一些基本的指导和示例。Pandas是一个强大的数据分析工具,它提供了灵活且高效的数据结构,以及用于处理和操作数据的函数。 首先,您需要确保已经安装了Pandas库。您可以使用以下命令在Python环境中安装Pandas: ``` pip install pandas ``` 一旦安装了Pandas,您可以使用以下代码导入库: ```python import pandas as pd ``` 接下来,您可以使用Pandas的DataFrame对象来处理数据。DataFrame是一个二维表格,类似于Excel中的数据表。您可以从多种来源创建DataFrame,如CSV文件、Excel文件、数据库等。 以下是一些常见的数据处理操作示例: 1. 读取数据: ```python df = pd.read_csv('data.csv') # 从CSV文件中读取数据 ``` 2. 查看数据: ```python print(df.head()) # 显示DataFrame的前几行 print(df.tail()) # 显示DataFrame的后几行 print(df.shape) # 显示DataFrame的行数和数 ``` 3. 数据清洗: ```python df.dropna() # 删除含有缺失值的行或 df.fillna(value) # 将缺失值填充为指定值 df.drop_duplicates() # 删除重复的行 ``` 4. 切片和索引: ```python df['名'] # 获取指定数据 df[['名1', '名2']] # 获取指定数据 df.iloc[行索引, 索引] # 使用索引获取特定位置的数据 df.loc[行标签, 标签] # 使用标签获取特定位置的数据 ``` 5. 数据过滤和排序: ```python df[df['名'] > 5] # 过滤满足条件的行 df.sort_values('名') # 按照指定数据进行排序 ``` 6. 数据聚合和统计: ```python df.groupby('名').mean() # 对数据按照指定进行分组并计算平均值 df.describe() # 显示数据的统计信息,如均值、标准差等 ``` 这只是Pandas库中一些常见的数据处理操作示例,您可以根据实际需求进行更多高级的数据处理操作。希望对您有所帮助!如果您还有其他问题,请随时提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数据人阿多

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值