python pandas 分割DataFrame中的字符串及元组(1)

现在能在网上找到很多很多的学习资源,有免费的也有收费的,当我拿到1套比较全的学习资源之前,我并没着急去看第1节,我而是去审视这套资源是否值得学习,有时候也会去问一些学长的意见,如果可以之后,我会对这套学习资源做1个学习计划,我的学习计划主要包括规划图和学习进度表。

分享给大家这份我薅到的免费视频资料,质量还不错,大家可以跟着学习

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

在这里插入图片描述


1.使用str.split()方法

=======================================================================================

可以使用pandas 内置的 str.split() 方法实现分割字符串类型的数据,并将分割结果写入DataFrame中,以表格形式呈现。

语法:

Series.str.split(pat=None, n=-1, expand=False)

其中,pat是字符串或正则表达式,

n是一个整数数字,默认为-1。为0或-1时即为最大次数的分割。其他数值因数值而定。

expand为布尔类型,表示分割后是否转换为DataFrame。默认为False表示不转换。

首先准备一组DataFrame数据:

import pandas as pd

pd.set_option(‘display.unicode.east_asian_width’, True)

address = ['重庆 重庆市 南岸区 ',

‘江苏省 苏州市 吴江区 吴江经济技术开发区亨通路’,

‘江苏省 苏州市 园区 苏州市工业园区唯亭镇阳澄湖大道维纳阳光花园’,

‘重庆 重庆市 南岸区 长生桥镇茶园新区长电路’,

‘安徽省 滁州市 明光市 三界镇中心街10001号’,

‘山东省 潍坊市 寿光市 圣城街道潍坊科技学院’,

‘吉林省 长春市 二道区 东盛街道彩虹风景’,

‘福建省 厦门市 湖里区 江头街道厦门市湖里区祥店福满园小区’,

‘山西省 吕梁市 离石区 滨河街道山西省吕梁市离石区后瓦师巷’,

‘河南省 濮阳市 华龙区 中原路街道中原路与107国道交叉口东’,

‘广东省 深圳市 宝安区 松岗街道松岗镇潭头第二工业区’,

‘河北省 石家庄市 辛集市 辛集镇辛集市新皮革城7期125楼’,

‘广东省 深圳市 宝安区 松岗街道松岗镇潭头第二工业区’,

‘贵州省 贵阳市 花溪区 党武镇师范大学师大超市’,

‘广东省 深圳市 福田区 沙头街道上沙龙秋村五十巷’,

‘福建省 福州市 闽侯县 上街镇福州闽侯上街国宾大道’,

‘湖北省 鄂州市 鄂城区 西山街道江碧路和馨居’,

‘上海 上海市 松江区’,

‘山东省 青岛市 市北区’,

‘山西省 晋中市 灵石县’,

‘浙江省 杭州市 余杭区’]

df = pd.DataFrame()

df[‘address’] = address

print(df)

原数据示例如下:

在这里插入图片描述

将address分割成不同的地理级别,结果生成一个DataFrame对象:

print(“=======================================================================”)

df1 = df[‘address’].str.split(’ ', expand=True)

print(df1)

结果如下:

在这里插入图片描述

最后将结果放入原DataFrame中。

df[‘省’] = series[0]

df[‘市’] = series[1]

df[‘区’] = series[2]

df = df[[‘省’, ‘市’, ‘区’]]

print(df)

在这里插入图片描述


2.使用join()与split()方法结合

============================================================================================

import pandas as pd

pd.set_option(‘display.unicode.east_asian_width’, True)

address = ['重庆 重庆市 南岸区 ',

‘江苏省 苏州市 吴江区 吴江经济技术开发区亨通路’,

‘江苏省 苏州市 园区 苏州市工业园区唯亭镇阳澄湖大道维纳阳光花园’,

‘重庆 重庆市 南岸区 长生桥镇茶园新区长电路’,

‘安徽省 滁州市 明光市 三界镇中心街10001号’,

‘山东省 潍坊市 寿光市 圣城街道潍坊科技学院’,

‘吉林省 长春市 二道区 东盛街道彩虹风景’,

‘福建省 厦门市 湖里区 江头街道厦门市湖里区祥店福满园小区’,

‘山西省 吕梁市 离石区 滨河街道山西省吕梁市离石区后瓦师巷’,

‘河南省 濮阳市 华龙区 中原路街道中原路与107国道交叉口东’,

‘广东省 深圳市 宝安区 松岗街道松岗镇潭头第二工业区’,

‘河北省 石家庄市 辛集市 辛集镇辛集市新皮革城7期125楼’,

‘广东省 深圳市 宝安区 松岗街道松岗镇潭头第二工业区’,

‘贵州省 贵阳市 花溪区 党武镇师范大学师大超市’,

‘广东省 深圳市 福田区 沙头街道上沙龙秋村五十巷’,

‘福建省 福州市 闽侯县 上街镇福州闽侯上街国宾大道’,

‘湖北省 鄂州市 鄂城区 西山街道江碧路和馨居’,

‘上海 上海市 松江区’,

‘山东省 青岛市 市北区’,

‘山西省 晋中市 灵石县’,

‘浙江省 杭州市 余杭区’]

df = pd.DataFrame()

df[‘address’] = address

df = df.join(df[‘address’].str.split(’ ', expand=True))

一、Python所有方向的学习路线

Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

二、学习软件

工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。

三、入门学习视频

我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 5
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值