用python进行数据分析:杂乱字符串的处理

本文介绍如何使用Python处理科大讯飞算法营销大赛中的杂乱字符串,特别是品牌和机型数据的清洗。通过合并、填充空值、统一格式,然后对数据进行分析和可视化,发现OPPO和VIVO用户广告点击率显著高于其他品牌。
摘要由CSDN通过智能技术生成

用python进行数据分析:杂乱字符串的处理

python:杂乱字符串的处理

数据集来自科大讯飞算法营销大赛,目的是探索各个维度与广告点击率的关系。

品牌和机型的数据清洗处理

1.让我们先来看一下原数据,清洗思路是合拼机型与品牌再做数据可视化分析。
在这里插入图片描述
2.来简单探索下原数据,可以看到机型与品牌都有一定的空值,同一品牌有不同的描述语句。
在这里插入图片描述
在这里插入图片描述
3.第一步选择合并两列数据,填充空值为0,并且全部大写处理,清楚空格,为后续处理做准备。
在这里插入图片描述
在这里插入图片描述
4.简单探索后,提取10个左右使用量最多的品牌,按如下语法去逐一清

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值