python数据分析与机器学习实战
文章平均质量分 91
机器学习(Machine Learning, ML)是一门多领域交叉学科,是人工智能的核心,其应用遍及人工智能的各个领域。.在机器学习过程中,需要使用大量数据,而数据分析是指用适当的方法对收集的大量数据进行分析,提取有用信息并形成结论,进而对数据加以详细研究和概括总结的过程。
忆&往浠℃
这个作者很懒,什么都没留下…
展开
-
用python进行分析电信行业的用户流失预测(四)---构建模型
文章目录1、建立训练数据集和测试数据集2、选择机器学习算法3、训练模型4、评估模型5、实施方案结论1、建立训练数据集和测试数据集# #我们需要将数据集拆分为训练集和测试集以进行验证。# #由于我们所拥有的数据集是不平衡的,所以最好使用分层交叉验证来确保训练集和测试集都包合每个类样本的保留人数。## #交叉验证是指在给定的建模样本中,拿出其中的大部分样本进行模型训练,生成模型,留小部分样本用刚建立的模型进行预测,# # 并求这小部分样本的预测误差,记录它们的平方加和。这个过程一直进行,直到所有的样原创 2020-08-01 23:00:24 · 4003 阅读 · 1 评论 -
用python进行分析电信行业的用户流失预测(三)---数据预处理
文章目录前言1.删除无用列2.对客户的职位、月费用和总费用进行去均值和方差缩放,对数据进行标准化3.使用箱线图查看数据是否存在异常值4.查看对象类型字段中存在的值5.使用Scikit-learn标签编码,将分类数据转换为整数编码前言在经过前面的博客后,相信你已经对于这个项目有了一定的认识。对于我在最开始提出的问题1.删除无用列由前面结果可知,CustomerID表示每个客户的随机字符,对后续建模不影响,我这里选择删除CustomerID列;gender 和 PhoneService 与流失率的相关性原创 2020-08-01 16:52:49 · 3168 阅读 · 0 评论 -
用python进行分析电信行业的用户流失预测(二)--数据可视化
文章目录前言四、数据可视化呈现1、查看流失客户占比2、性别、老年人、配偶、亲属对流客户流失率的影响3、提取特征4、构造相关性矩阵5、使用热地图显示相关系数6、使用one-hot编码7、电信用户是否流失与各变量之间的相关性8、网络安全服务、在线备份业务、设备保护业务、技术支持服务、网络电视、网络电影和无互联网服务对客户流失率的影响前言这篇文章紧跟用python进行分析的用户流失预测实操,以电信行业为例的后续内容,聚焦可视化操作。四、数据可视化呈现1、查看流失客户占比##数据可视化分析# #1,查看原创 2020-07-28 17:01:17 · 7242 阅读 · 6 评论 -
用python进行分析的用户流失预测实操,以电信行业为例
文章目录前言一、提出问题二、理解数据1、采集数据2,导入数据3,查看数据集信息三、数据清洗1、查找缺失值2、查看数据类型3、转换类型4、处理缺失值(如果采用的是低版本pandas,会出现缺失值的现象)5、数据归一化处理四、数据可视化呈现1、查看流失客户占比前言客户流失是所有与消费者挂钩行业都会关注的点,因为发展一个新客户是需要一定成本的,一旦客户流失,成本浪费不说,挽回一个客户的成本更大。所以,电信行业在竞争日益激烈当下,如何挽留更多用户成为一项关键业务指标。为了更好运营用户,这就要求要了解流失用户的原创 2020-07-28 16:17:26 · 4067 阅读 · 2 评论