- 博客(9)
- 收藏
- 关注
原创 数据分析师岗位 分析可视化
目录前言一、导入模块二、数据处理与分析1.读取数据2.查看数据表格描述3.处理重复值4.处理缺失值5.提取地区信息6.提取经验信息7.提取薪资信息三、Pyecharts数据可视化1.每个地区的招聘数量2.平均工资最高的地区3.经验学历需求图4.招聘公司所在领域前言本文基于某招聘平台的数据分析师岗位招聘信息,首先利用pandas对数据进行处理与分析,然后利用pyecharts对各地区的招聘数量、平均工资、经验学历需求和招聘...
2021-12-13 11:12:20 3810 5
原创 多分类模型尝试-员工是否离职预测
目录文章目录前言一、初始化二、了解数据集三、了解变量四、特征处理五、建模5.1 模型一:逻辑回归5.2模型二:KNN5.3 模型三:随机森林总结前言本项目的主要内容是对公司员工进行分类 预测其两年内是否会离职尝试模型:逻辑回归、KNN、随机森林变量含义:· Education:受教育水平 · JoiningYear:加入公司年份 · City:所在城市 · PaymentTier :薪资支付水平 · Age ...
2021-12-01 15:25:30 3478 9
原创 Tableau仪表盘搭建——外卖数据分析
目录文章目录一、项目背景二、图表制作(仪表盘搭建准备工作)1.经营情况总览2.经营情况详情3.每日营收数据4.每日流量数据5.新老客占比6.平台占比7.门店占比8.投放情况9.订单分布10.配送分布三、仪表盘搭建一、项目背景基于Tableau对外卖门店每日营业情况数据进行监控。通过建立经营情况总览、经营数据详情、每日营收数据、每日流量数据、新老客占比、平台占比、门店占比、投放情况、订单分布和配送分布等指标体系,对外卖门店每日营业情况进行可视.
2021-11-23 10:03:48 3229 20
原创 Tableau基础图表制作
目录文章目录一、Tableau介绍二、数据连接1.连接类型2.连接方式3.提取方式三、基础图表制作1.柱状图2.条形图3.【创建分级结构】实现数据钻取4.【添加筛选器】实现数据选取5.热力图6.气泡图7.饼图【快速计算表】8.树地图9.堆积图10.折线图11.面积图12.散点图13.地图一、Tableau介绍Tableau作为一款BI分析工具,不仅容易上手,美观直接,用它将大量数据拖放到数字“画布”上,..
2021-11-17 15:34:53 6067 3
原创 基于逻辑回归的天猫优惠券使用情况预测
文章目录前言一、数据预处理二、变量选择查看特征值与目标值之间的相关关系选取特征值进行one-hot编码后目标值与特征值的相关关系查看类别型变量的所有类别及类别分布概率情况对数值型变量绘制直方图 查看数据分布将未进行独热编码的特征删除三、建模(训练逻辑回归模型)四、模型评估查看预测结果混淆矩阵及可视化计算ROC曲线AUC值并可视化前言本文运用numpy,pandas库对相关数据进行处理,使用sklearn库基于机器学习中的逻辑回归方法
2021-11-08 19:01:09 1760 6
原创 王者荣耀赛事数据分析
目录文章目录前言一、导入数据二、KDA除以10三、赵云相关数据四、相关性五、热度前十英雄前言本文利用pandas对王者荣耀赛事数据处理,利用pyecharts分别制作雷达图、饼图、热力图和柱状图进行可视化的展示。一、导入数据import numpy as npimport pandas as pddf = pd.read_csv('/王者荣耀赛事数据/data.csv')df.head()二、KDA除以10from I...
2021-11-05 09:44:10 2549 7
原创 逻辑回归做分类预测-客户购买
目录文章目录前言一、初始化二、了解数据集三、了解变量四、特征处理五、 建模总结前言本文的主要内容是对银行客户进行分类 预测其是否会购买银行的定期存款产品。以下内容主要展现简单的数据分析、画图、分类变量编码、数据缩放和逻辑回归完整过程。变量含义:· ID:客户唯一标识· age:客户年龄· job:客户的职业· marital:婚姻状况· education:受教育水平· default:是否有违约记录· balance:每年账户的平均
2021-11-04 10:39:02 2304 5
原创 滴滴出行A/B测试&城市运营分析
目录文章目录前言数据说明一、A/B测试效果分析1 数据导入2 计算ROI(投资回报率)3 requests检验3.1 requests方差检验3.2 requests均值检验4 gmv检验4.1 gmv方差检验4.2 gmv均值检验5 ROI检验5.1 ROI方差检验5.2 ROI均值检验二、城市运营分析1 数据导入2 数据探索2.1 订单量最多的时间点2.2 订单量最多的日期2.3 各时段订单完成率2.4 单月每日..
2021-10-31 17:22:17 757
原创 Python制作可视化大屏(东京奥运会)
目录文章目录前言一、数据爬取二、数据预处理三、Pyecharts可视化3.1 2020东京奥运会各国金牌分布图3.2 2020东京奥运会奖牌榜详情3.3 2020东京奥运会中国各项目获奖详情四、数据大屏布局总结前言本文基于requests库爬取的奥运会相关数据,利用pandas库对数据进行处理之后,最后介绍了如何利用pyecharts库制作可视化大屏。一、数据爬取import requestsimport pandas a...
2021-10-27 14:33:23 2986 11
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人