分享一个不错的数据分析实战案例【全程附图】EXCEL_数据分析实例(1)

写在最后

在结束之际,我想重申的是,学习并非如攀登险峻高峰,而是如滴水穿石般的持久累积。尤其当我们步入工作岗位之后,持之以恒的学习变得愈发不易,如同在茫茫大海中独自划舟,稍有松懈便可能被巨浪吞噬。然而,对于我们程序员而言,学习是生存之本,是我们在激烈市场竞争中立于不败之地的关键。一旦停止学习,我们便如同逆水行舟,不进则退,终将被时代的洪流所淘汰。因此,不断汲取新知识,不仅是对自己的提升,更是对自己的一份珍贵投资。让我们不断磨砺自己,与时代共同进步,书写属于我们的辉煌篇章。

需要完整版PDF学习资源私我

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化资料的朋友,可以点击这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

项目简介

利用最近一次的营销活动的信息,分析什么对推销结果的影响最大,如何确定银行定期产品推销中最具价值的客户。

PS: 这是最初上传到UCI机器学习库的经典营销银行数据集,该数据集提供了有关金融机构营销活动的信息,但在本篇博客当中我们仅会用到EXCEL进行数据分析,使用机器学习进行分析我们留到之后再介绍。

1 数据理解

字段名理解
age年龄(数值)
job职业(分类:admin, bluecollar, entrepreneur, housemaid, management, retired, self-employed, services,student, technician, unemployed, unknown)
marital婚姻状况(分类:divorced, married, single, unknown)
education学历(分类:primary, secondary, tertiary and unknown)
default失信状况(分类:yes, no)
balance资产余额(数值)
housing房屋贷款(分类:yes, no, unknown)
loan个人贷款(分类:yes, no, unknown)
contact联系方式(分类:cellular, telephone)
day最后一次电话营销的日期(数值:月份中的哪一天)
month最后一次电话营销的月份(分类:jan, feb, mar, apr,…,nov, dev)
duration通话时长(数值:以秒为单位,0的话最终输出结果必然是0)
campaign联系次数(数值:此活动中联系该客户的次数)
pdays距上次联系完客户后的天数(数值:999代表未联系过该客户)
previous这次活动前与这位客户联系的次数(数值)
poutcome上次营销的结果(分类:yes, no, unknown)
deposit定期存款(分类:yes, no)客户是否已购买定期存款

2 数据清洗

此次数据除了部分未知数据(unknown),其它暂不需要清洗。

3 确定思路

首先这个balance,我不太确定具体指什么,目前推测应该是客户存放在银行的资金(负数应该代表欠了银行钱吧哈哈),总不可能是代表这个人的个人全部资产吧(银行得不到这方面的信息),所以暂时留着。

然后这个day和month,如果说有年份的话还能将其分为周一周二等,但是没有,数据集出处也没有明确标注是哪一年,所以如果用来分析的话可能也只能按月来分析,但按以往的经验和数据量的大小来看,应该用处不大。

至于duration的话,因为当duration为0时结果必然是失败的,说明这个数据的记录应该是银行人员在营销完记录下的,而现实中你无法在营销前就得到该数据,所以这个数据没有用。

那么接下来我们如何下手呢?
首先我们可以将数据分为两种类型:
1、客户的个人信息
2、营销人员与客户的联系信息
那么接下来我们可以按照这两种数据提出几个问题:
1、用户的个人信息是否对结果有着明显的影响(哪些属性影响大)?
2、营销人员的行为是否对结果有着明显的影响(哪些属性影响大)?

4 分析过程

4.1 年龄

此时我们探究年龄与结果是否有明显的影响。
首先我们可以查看以下数据集中的年龄统计分布情况:

在这里插入图片描述
可以发现共有11162名最小值为18,最大值为95,最小值为18。我们可以按照我们的认知,将客户分为几个不同年龄阶段。

在这里插入图片描述

分组的话主要是用到了VLOOKUP函数进行分组。
在这里插入图片描述
此时得到分组后,我们可以生成数据透视表来查看情况。

在这里插入图片描述
从图当中我们可以明显的看到在老年人群体中最终购买了定期存款的比例最大,为80.2%,而其他群体最终的结果并没有明显的差距。

4.2 失信状况default

在这里插入图片描述
有失信记录的在结果上没有什么差别,无失信记录的最终购买的比例低于没有购买的,但是数据量较小,不能作为参考。

4.3 个人资产balance

同年龄一样,balance是数值型,因而最好先将其分组。

在这里插入图片描述
这里我主要采用箱型图来查看balance数据的分布,以便后续进行分组。
可以看到的是数据主要是集中在0-2000之间,有少部分低于该区间,然后有部分大于该区间。

按下图进行分组:

在这里插入图片描述
结果如下:

在这里插入图片描述
这里主要可以发现的是负资产的客户最终购买的可能性较低,而资产较高的客户购买的可能性稍微大些。

4.4 housing&loan

接下来的房屋贷款和个人贷款,这个我打算放在一起进行分析。
具体如下:

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化资料的朋友,可以点击这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 29
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Excel数据分析与图表应用案例精粹_光盘 杨广于 清华大学出版社,2012 目录 第1章 公式与函数基本操作 1   1.1 Excel公式的基本操作 1   1.1.1 公式的输入与编辑 1   1.1.2 公式中的运算符 2   1.1.3 单元格的引用方式 3   1.1.4 名称的定义及应用 5   1.2 Excel函数的基本操作 7   1.2.1 函数的输入技巧 7   1.2.2 函数的种类 9   1.2.3 函数的参数类型 10   1.3 公式与函数应用技巧 11   1.3.1 复制公式 11   1.3.2 把公式转换为值 12   1.3.3 隐藏工作表中的公式 13   1.3.4 公式与函数运算中常见错误解析 15   第2章 数据筛选与排序 17   2.1 数据筛选 17   2.1.1 应用自动筛选 17   2.1.2 应用高级筛选 23   2.1.3 按单元格颜色进行筛选 25   2.2 数据排序 26   2.2.1 简单排序 26   2.2.2 对员工信息表进行笔划排序 27   2.2.3 按行排序 28   2.2.4 多列排序 29   2.2.5 自定义排序次序 30   2.2.6 按单元格颜色进行排序 32   第3章 图表基本操作 34   3.1 常用图表创建 34   3.1.1 创建柱形图 34   3.1.2 创建饼形图 36   3.1.3 创建条形图 38   3.1.4 创建折线图 41   3.2 其他图表的创建 43   3.2.1 创建股价图 43   3.2.2 创建圆环图 44   3.2.3 创建面积图 46   3.2.4 创建散点图 48   3.2.5 创建组合图 49   第4章 图表编辑与美化 53   4.1 编辑图表 53   4.1.1 变更图表类型 53   4.1.2 添加数据系列 54   4.1.3 数据标签代替图例 56   4.1.4 添加垂直线 57   4.1.5 设置对数刻度 58   4.1.6 调整分类轴标签 59   4.1.7 用文本框代替图例 60   4.1.8 在图表中显示数据表 61   4.1.9 设置数据轴的最小值和最大值 62   4.1.10 处理丢失数据 63   4.1.11 添加趋势线 65   4.1.12 更改数据系列的显示方式 67   4.2 美化图表 67   4.2.1 美化图表标题 67   4.2.2 美化数据系列 69   4.2.3 在图表中插入图片 72   第5章 企业日常费用统计与分析 74   5.1 建立日常费用记录表 74   5.2 利用筛选功能分类查看日常费用 76   5.2.1 查看指定部门的日常费用支出情况 76   5.2.2 查看指定类别的日常费用支出情况 77   5.2.3 查看支出金额最小的几项记录 78   5.2.4 查看特定费用类别中大于或等于指定金额的记录 79   5.3 利用汇总功能统计日常费用 79   5.3.1 统计各部门费用支出总额 80   5.3.2 统计各类别费用支出总额 81   5.4 利用数据透视表(图)统计日常费用 82   5.4.1 统计各部门费用支出金额 82   5.4.2 统计各类别费用支出金额 84   5.4.3 统计各部门各类别费用支出金额 85   5.4.4 比较各部门各类别1、2月的费用 87   第6章 企业日常费用预测与分析 89   6.1 使用线性拟合直线法预测 89   6.1.1 使用LINEST函数进行线性拟合 90   6.1.2 直接获取线性拟合方程的斜率和截距 94   6.1.3 使用线性拟合方程预测费用 96   6.1.4 使用TREND函数预测费用 98   6.2 使用指数回归拟合曲线法预测 101   6.2.1 使用LOGEST函数进行指数回归拟合 101   6.2.2 直接获取指数回归拟合方程的系数和常量 105   6.2.3 使用指数回归拟合方程预测费用 106   6.2.4 使用GROWTH函数预测费用 107   6.3 线性与指数预测结果比较分析 109   第7章 广告支出费用预测与分析 115   7.1 广告支出综合分析 115   7.1.1 创建广告支出费用统计表 115   7.1.2 创建各区域广告支出比例图 117   7.1.3 创建各月广告支出比例图 118   7.1.4 各区域费用支出趋势分析 119   7.2 广告支出费用与销售关系分析 120   7.2.1 使用散点图进行分析 120   7.2.2 使用“协方差”分析工具进行分析 123   7.3 2011年度广告支出与销量预测 126   7.3.1 指数预测销量 126   7.3.2 线性预测销量 129   第8章 产品采购数据处理与分析 132   8.1 建立采购数据统计表 132   8.2 利用汇总功能统计各品种采购数量与采购金额总额 136   8.3 利用函数分析采购数据 138   8.3.1 统计各品种采购数据总和及占总和比例 138   8.3.2 分析最低采购价格及对应的供应商 140   8.4 利用图表显示各品种采购金额在总和中所占比例 142   8.5 利用数据透视表分析采购数据 144   8.5.1 分析各品种产品的采购情况 144   8.5.2 分析各供应商的供应数据 146   第9章 产品销售数据处理与分析 147   9.1 建立销售数据统计表 147   9.2 利用分类汇总功能分析销售数据 151   9.2.1 统计各品种产品的销售数量与销售金额 151   9.2.2 统计各客户购买数量与购买金额 152   9.3 利用函数、图表分析销售数据 153   9.3.1 分析各品种产品销售情况 153   9.3.2 分析各销售人员的业绩 156   9.3.3 使用SUMPRODUCT函数精确分析 158   9.3.4 本期客户交易评估 161   9.4 利用数据透视表分析销售数据 164   9.4.1 分析客户采购情况 164   9.4.2 分析应收账款 166   第10章 产品库存数据处理与分析 169   10.1 建立库存数据统计表 169   10.2 利用函数、图表分析出入库数据 172   10.2.1 计算各品种产品的出入库数据 172   10.2.2 通过图表比较各品种产品的入库数据 174   10.3 利用函数实现按日查询出入库数据 175   10.4 利用函数查询各系列产品的出入库数据 181   10.5 出入库累计汇总 184   10.6 利用数据透视表分析出入库数据 187   10.6.1 统计各品种产品的出入库数据 188   10.6.2 统计各日期的出入库数据 190   第11章 企业人事数据管理与分析 191   11.1 员工档案数据管理 191   11.1.1 建立员工档案管理表 191   11.1.2 档案数据的查看与筛选 197   11.1.3 新建工作表用于查询员工档案 199   11.1.4 分析员工的学历层次 201   11.1.5 分析员工的年龄层次 204   11.2 员工考勤数据管理 206   11.2.1 创建员工考勤记录表 206   11.2.2 填制考勤表 209   11.2.3 统计各员工本月的请假天数、迟到次数及应扣款 210   11.2.4 分析各部门的请假情况 214   11.3 员工培训成绩管理 215   11.3.1 统计每位员工的总成绩、平均成绩并进行排名 215   11.3.2 分析各科目成绩 217   第12章 企业工资数据处理与分析 219   12.1 创建工资记录表 219   12.1.1 建立员工基本工资记录表 219   12.1.2 建立员工业绩提成、奖金、罚款记录表 221   12.1.3 建立员工加班工资统计表 223   12.1.4 建立员工考勤扣款统计表 226   12.2 创建工资统计表 226   12.3 创建工资单 231   12.3.1 建立第一位员工的工资单 231   12.3.2 快速生成每位员工的工资单 233   12.4 按部门汇总工资额 234   12.4.1 利用分类汇功能按部门汇总工资额 234   12.4.2 利用SUMIF函数按部门汇总工资额 236   12.5 利用数据透视表分析工资数据 237   12.5.1 按部门查询工资额 237   12.5.2 按部门统计应发工资总额 238   第13章 生产计划统计与分析 241   13.1 制订生产计划 241   13.1.1 各车型生产计划图表分析 241   13.1.2 各部门生产计划图表分析 243   13.2 实际产量完成比例分析 244   13.2.1 创建生产记录表格 244   13.2.2 按产品分析计划完成进度 246   13.2.3 按部门分析计划完成进度 250   13.3 生产计划完成情况预测 255   第14章 新产品价格分析 260   14.1 价格数据定位分析 260   14.1.1 计算价格的置信区间 260   14.1.2 价格排位分析 262   14.1.3 价格数据频率分析 263   14.2 样本描述性分析 267   14.2.1 性别描述性分析 267   14.2.2 年龄和月收入描述性分析 269   14.3 影响价格的因素分析 270   14.3.1 性别与价格相关性分析 270   14.3.2 年龄与价格相关性分析 273   14.3.3 月收入与价格相关性分析 274   14.4 使用直方图定位最适合价格 274   第15章 企业固定资产数据统计与分析 276   15.1 固定资产参数设置 276   15.2 固定资产清单 278   15.2.1 创建固定资产清单 278   15.2.2 计算固定资产折旧 281   15.3 制作固定资产卡片 287   15.4 使用图表法分析固定资产折旧 295   15.4.1 直线折旧法图表分析 295   15.4.2 余额递减折旧法图表分析 299   15.4.3 年限总和折旧法图表分析 300   第16章 产品生产方案规划求解 302   16.1 建立规划求解问题模型 302   16.2 生产成本最小化规划求解 305   16.2.1 成本最小化规划求解 306   16.2.2 成本最小化分析报告 309   16.3 利润最大化规划求解 311   16.3.1 利润最大化规划求解 311   16.3.2 利润最大化分析报告 314   16.4 创建并管理方案 315   16.4.1 将规划求解的结果保存为方案 315   16.4.2 合并方案 318   16.4.3 创建方案摘要和方案透视表 319   第17章 企业筹资与投资决策分析 321   17.1 筹资决策数据处理与分析 321   17.1.1 长期借款筹资决策分析 321   17.1.2 租赁筹资决策分析 330   17.1.3 两种筹资方案的比较分析 332   17.2 投资决策数据处理与分析 336   17.2.1 简单法投资决策数据处理与分析 336   17.2.2 贴现法投资决策数据处理与分析 338   第18章 市场调查数据处理与分析 344   18.1 建立调查问卷和调查结果接收表 344   18.1.1 建立调查问卷 344   18.1.2 建立记录调查结果的工作表 347   18.2 汇总统计调查结果 350   18.2.1 汇总所有调查结果 350   18.2.2 替换编码生成结果数据库 351   18.3 分析样本组成 353   18.3.1 分析性别组成 354   18.3.2 分析年龄组成 356   18.3.3 分析居住城市组成 358   18.4 分析品牌知名度 359   18.4.1 分析品牌知名度 360   18.4.2 分析地域-品牌知名度 361   18.5 分析品质认知度与地域的相关性 363   18.6 分析品牌忠诚度与性别的相关性 365   第19章 汽车保险数据分析 368   19.1 创建承保客户基本资料库 368   19.1.1 创建并输入客户基本信息 368   19.1.2 计算年龄、驾龄和车龄 370   19.1.3 客户年龄透视分析 372   19.2 保费收入统计分析 375   19.2.1 保费收入结构分析 375   19.2.2 各明细险种投保率分析 377   19.3 保费支出统计分析 380   19.3.1 创建赔款支出数据清单 380   19.3.2 赔款结构分析 382   19.3.3 按客户姓名汇总赔款 384   19.3.4 赔款金额与赔款频率分析 386   19.4 客户管理与等级划分 389   19.4.1 按客户计算赔付率 389   19.4.2 根据赔付率设置客户等级 390   19.4.3 客户级别透视分析 392   第20章 商业房地产数据分析 394   20.1 主要经济指标GDP分析 394   20.2 写字楼供应量分析 396   20.2.1 写字楼供应量分析 396   20.2.2 开发面积增长状况分析 399   20.2.3 各年度写字楼分布区域分析 401   20.2.4 分布区域综合分析 404   20.3 写字楼吸纳量分析 405   20.3.1 销售吸纳量分析 405   20.3.2 出租吸纳量分析 409   20.3.3 空置率分析 410   20.3.4 市场饱和度分析 410   20.4 销售价格与出租价格分析 411   20.4.1 按时间序列分析 411   20.4.2 按空间序列分析 413   第21章 股票数据分析 416   21.1 股票指数的中心趋势分析 416   21.1.1 计算股票指数的算术平均值 416   21.1.2 计算股票指数的几何平均值 417   21.1.3 计算调和平均数 418   21.1.4 计算众数 419   21.1.5 计算中位数 419   21.2 股票指数离散趋势分析 420   21.2.1 计算方差 420   21.2.2 计算标准差 421   21.2.3 计算四分位数 422   21.3 创建股价图进行分析 423   21.3.1 绘制K线图 423   21.3.2 使用K线图分析股票走势 426   21.4 两支股票对比分析 431
专利名称:一种基于新型AI芯片+BMC芯片架构的数据驱动故障诊断算法 专利申请人:(隐去) 技术领域:本专利涉及一种基于新型AI芯片+BMC芯片架构的数据驱动故障诊断算法,属于人工智能和计算机技术领域。 技术背景:随着计算机技术的不断发展,各种硬件设备的故障问题也越来越多。传统的硬件故障诊断方法需要大量的人力和物力,成本高、效率低。近年来,基于机器学习和深度学习的故障诊断方法得到了广泛的研究和应用,但是需要大量的计算资源和数据,因此需要高效的AI芯片和BMC芯片来支持。 发明内容:本发明提供了一种基于新型AI芯片+BMC芯片架构的数据驱动故障诊断算法。该专利的创新点在于,它能够在硬件层面上支持高效的数据驱动故障诊断算法,并解决了故障诊断算法所面临的数据安全性和隐私性问题。 具体实现方法如下: 1. 采集大量的机器数据,包括硬件状态、运行日志、性能指标等。 2. 利用AI芯片和BMC芯片进行数据处理和分析,运用机器学习和深度学习算法对数据进行建模和训练。 3. 利用BMC芯片上的区块链技术对数据进行加密和存储,确保数据的安全性和隐私性。 4. 利用AI芯片中的量子计算单元进行故障诊断算法的计算和优化,提高故障诊断算法的准确率和效率。 5. 利用BMC芯片进行远程监控和管理,实现对硬件的远程故障诊断和修复。 所述技术的优点在于: 1. 利用AI芯片和BMC芯片集成的设计,实现对硬件资源的更加高效的利用,从而提高故障诊断算法的计算效率。 2. AI芯片采用量子计算单元,能够实现更加高效的计算和优化算法,从而提高故障诊断算法的准确率。 3. BMC芯片采用区块链技术,能够保障数据的安全性和隐私性,从而提高故障诊断算法的可信度。 该技术的应用领域包括各种硬件设备的故障诊断和预防,具有广泛的市场前景。 附图说明: 图1:新型AI芯片+BMC芯片架构实现数据驱动故障诊断算法的原理框图。 图2:AI芯片和BMC芯片的集成设计示意图。 图3:BMC芯片采用区块链技术的示意图。 图4:利用AI芯片中的量子计算单元进行故障诊断算法的计算和优化的示意图。 以上说明仅为本专利实施例的说明,并不限制本专利的保护范围。任何在本专利保护范围内的技术方案和实施细节都应被视为本专利的保护范围。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值