数据分析入门(二)

常用数据分析方法

5.1数据分析作用与对应的分析方法

在这里插入图片描述

5.1对比分析法

定义
对比分析法是将两个或两个以上的数据进行比较,分析其中的差异,从而揭示这些事物所代表的的发展变化情况和规律性。
特点
非常直观的看出事物某方面的变化或差距,而且可以准确,量化的表示出变化的差距是多少。
在这里插入图片描述
对比经常被应用在如下各种场景:

  • 与目标对比 实际完成值与目标值进行对比,属于横比
  • 不同时期对比 选择不同时期的指标数值作为标准对比,属于纵比
        同比:历史同期数据进行比较,突出显示数据的短期趋势,会受到季节等因素的影响。
        环比:相邻两月进行比较,侧重反映长期的大趋势,也就规避了季节的因素。
  • 同级别对比 统计部门、单位、地区对比,属于横比
  • 行业内对比 对比找出自身发展方向,属于横比
  • 活动效果对比 比较营销活动前后效果对比,属于纵比

5.3分组分析法

定义
  分组分析法是根据数据分析对象的特征,按照一定的指标,把数据分析对象划分为不同的部分和类型来进行比较研究。
目的
  把总体中具有不同性质的对象区分开,把性质相同的对象合并在一起便于对比。分组分析一般都与对比分析结合使用。
步骤
  1.确定组数
  2.确定各组组距 组距=(最大值-最小值)/组数
  3.根据组距大小,对数据进行分析整理,划归到响应组内

5.4 结构分析法

定义
  结构分析法是指被分析研究总体内各部分与总体之间进行的分析方法。
公式
  结构相对指标(比例)= 总体某部分的数值 / 总体总量 * 100%
应用案例
   市场占有率 =(某商品销售量 / 该种商品市场销售总量)* 100%
  市场占有率是分析企业在行业中竞争状态的重要指标。市场占有率高,表明企业运营状况好,竞争能 力强,市场占据有利地位;反之,结果相反。

5.5平均分析法

定义
  平均法是运用计算平均数的方法来反映总体在一定时间、地点、条件下某一数量特征的一般水平的分析方法。
作用
  1.利用平均指标对比同类现象在不同地区、不同行业之间的差异程度,比用总量指标更具说服力。
  2.利用平均指标对比某些现象在不同历史时期的变化,更能说明其发展趋势和规律
公式
  算数平均数=总体各单位数值的总和/总体单位个数

5.6 交叉分析法

定义
  交叉分析法是同时将两个有一定联系的变量及其值交叉排列在一张表内,使个变量值成为不同变量的交叉结点,一般用二维交叉表分析法。
在这里插入图片描述

杜邦分析法

定义
   杜邦分析方法是将各种财务指标综合在一起来评价公司财务管理效果。通常用于公司财务方面的分析。
在这里插入图片描述

5.8漏斗图分析法

  漏斗分析是一套流程式数据分析,它能够科学反映用户行为状态以及从起点到终点各阶段用户转化率情况的重要分析模型。漏斗分析模型已经广泛应用于网站用户行为分析和APP用户行为分析的流量监控、产品目标转化等日常数据运营与数据分析的工作中。

  • 5.8.1 用户转化\流失率漏斗模型
      漏斗分析最常用的是转化率和流失率两个互补型指标。用一个简单的例子来说明,假如有100人访问 某电商网站,有30人点击注册,有10人注册成功。这个过程共有三步,第一步到第二步的转化率为 30%,流失率为70%,第二步到第三步转化率为33%,流失率67%;整个过程的转化率为10%,流失率 为90%。 该模型就是经典的漏斗分析模型。
  • 5.8.2 用户完成支付行为的漏斗模型
    在这里插入图片描述

6.数据分析常用指标

产品经理常用指标
在这里插入图片描述

6.1内容指标:

在这里插入图片描述

  1. 转换率 Take Rates (Conversions Rates)
    转换率=进行了相应的动作的访问量/总访问量 意义:衡量网站内容对访问者的吸引程度以及网站的宣传效果
  2. 回访者比率 Repeat Visitor Share
    回访者比率=回访者数/独立访问者数 意义:衡量网站内容对访问者的吸引程度和网站的实用性,你的网站是否有令人感兴趣的使 访问者再次回到你的网站。
  3. 积极回访者比率 Heavy User Share
    积极回访者比率 = 访问超过11页的用户 / 总访问数 意义: 衡量有多少访问者是对网站的内容高度感兴趣
  4. 忠实访问者比率 Committed Visitor Share
    访问时间在19分钟以上的用户数/总用户数 意义:和上一个指标的意义相同,只是使用停留的时间取代浏览页数,取决于网站的目标, 你可以使用两个中的一个或结合使用。
  5. 忠实访问者指数 Committed Visitor Index
    忠实访问者指数=大于19分钟的访问页数/大于19分钟的访问者数 意义:指的是每个长时间访问者的平均访问页数,这是一个重要的指标,它结合了页数和时 间。
  6. 忠实访问者量 Committed Visitor Volume
    忠实访问者量 =大于19分钟的访问页数/总的访问页数 意义:长时间的访问者所访问的页面占所有访问页面数的量
  7. 访问者参与指数 Visitor Engagement Index
    访问者参与指数=总访问数/独立访问者数 意义:这个指标是每个访问者的平均会(session),代表着部分访问者的多次访问的趋 势。
  8. 回弹率(所有页面)Reject Rate/Bounce Rate
    回弹率(所有页面)=单页面访问数/总访问数 意义:代表着访问者看到的仅有的一页的比率
  9. 回弹页(首页) Reject Rate/Bounce Rate
    回弹率(首页)=仅仅访问首页的访问数/所有从首页开始的访问数 意义:这个指标代表所有从首页开始的访问者中仅仅看了首页的访问者比率
  10. 浏览用户比率 Scanning Visitor Share
    浏览用户比率=少于1分钟的访问者数/总访问数 意义: 这个指标一定程度上衡量网页的吸引程度 说明:大部分的网站都希望访问者停留超过一分钟,如果这个指标的值太高,那么就应该考 虑一下网页的内容是否过于简单,网站的导航菜单是否需要改进。
  11. 浏览用户指数 Scanning Visitor Index
    浏览用户指数=少于1分钟的访问页面数/少于1分钟的访问者数 意义:一分钟内的访问者平均访问页数 说明:这个指数也接近于1,说明访问者对网站越没兴趣,他们仅仅是瞄一眼就离开了。这 也许是导航的问题,如果你对导航系统进行了显著的改进,应该可以看到这个指数在上升; 如果指数还是下降,应该是网站的目标市场及使用功能有问题,应该着手解决。 将浏览用户比率和浏览用户指数结合起来使用,可以看出用户是在浏览有用的信息还是厌烦 而离开
  12. 浏览用户量 Scanning Visitor Volume
    浏览用户量=少于1分钟的浏览页数/所有浏览页数 意义:在一分钟内完成的访问页面数的比率 说明:根据网站的目标的不同,这个指标的高低有不同的要求,大部分的网站希望这个指标 降低。如果是搞广告驱动的网站,这个指标太高对于长期的目标是不利的,因为这意味着尽 管你通过广告吸引了许多的访问者,产生很高的访问页数,但是访问者的质量却是不高的, 所能带来的收益也就会受到影响。

6.2 商业指标:

在这里插入图片描述
电商商业指标中的重要指标
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

标意义每笔订单给你带来的现金增加净值
用另一种形式来表现市场效率这是一个衡量市场效率的指标,代表着网站所带来的访问者和转化的访问者之间的差异
指标名称每笔产出Contribution per Order(CON)
订单获取率 Order Acquisition Ratio(OAR)订单获取差额Order Acquisition Gap (OAG)

在这里插入图片描述

6.3 其他指标:

在这里插入图片描述

7.数据分析报告

7.1数据分析报告简介

  • 7.1.1 什么是数据分析报告
      数据分析报告是根据数据分析原理和方法,运用数据来反应、研究和分析某项事物的现状、问题、原因、本质和规律,并得到结论,提出解决办法的一种分析应用文体。
    决策者依靠数据分析报告
      1.认识事物
      2.了解事物
      3.掌握信息
      4.搜索相关信息
  • 7.1.2数据分析报告的原则
      一份完整的数据分析报告,应当围绕目标确定范围,遵循一定的前提和原则,系统地反映存在的问题及原因,从而进一步找出解决问题的方法
    在这里插入图片描述
  1. 规范性:数据分析报告中所使用的名词术语一定要规范,标准统一,前后一致,要与业内公认的属于一致。
  2. 重要性:数据分析报告一定要体现数据分析的重点,在各项数据分析中,应该重点选取关键指标,科学专业地进行分析
  3. 谨慎性:数据分析报告的编制过程一定要谨慎,基础数据必须真实,完整,分析过程必须科学、合理、全面,分析结果可靠,内容要实事求是。
  4. 创新性:数据分析报告需要适时地引入科学技术,可以用实际结果来验证过改进它们。
  • 7.1.3 数据分析报告的作用
    在这里插入图片描述
  1. 展示分析结果:报告以某一种特定的形式将数据分析结果清晰地展示给决策者,使得他们能够迅速 理解、分析、研究问题的基本情况、结论与建议等内容。
  2. 验证分析质量::通过报告中对数据分析方法的描述、对数据结果的处理与分析等几个方面来检验数 据分析的质量,并且让决策者能够感受到整个数据分析过程是科学且严谨的。
  3. 提供决策参考:大部分的数据分析报告都是具有时效性的,因此所得到的结论与建议可以作为决策者在决策方面的一个重要参考依据。
  • 7.1.4数据分析报告的种类
    由于数据分析报告的对象、内容、时间、方法的情况不同,因而存在这不同形式的报告类型
    在这里插入图片描述
      专题分析报告:单一性、深入性
      综合分析报告:全面性、关联性
      日常数据通报:进度性、规范性、时效性

7.2 数据分析报告组成

  • 7.2.1数据分析报告结构
      数据分析报告确实有特定的结构,但是这种结构并非一成不变,不同的数据分析师、不同的老板、不同的客户、不同性质的数据分析,其最后的报告可能会有不同的结构。
      最经典的报告结构还是“总-分-总”结构,它主要包括:开篇、正文和结尾三大部分。
    在这里插入图片描述
  • 7.2.2 六大组成部分及特点
      1.标题页需要写明报告的题目,题目要精简干练,根据版面的要求在一两行内完成。
      好的标题不仅可以表现数据分析的主题,而且能够激发读者的阅读兴趣,因此需要重视标题的制作,以增强其艺术性的表现力。
      2.目录可以帮助读者快捷方便地找到所需的内容,因此,要在目录中列出报告主要章节的名称。
      3.前言
        分析背景
        分析目的
        分析思路
      4.正文是数据分析报告的核心部分,它将系统全面地表述数据分析的过程与结果。
        报告正文具有的特点:
        是报告最长的主体部分。
        包含所有数据分析事实和观点。
        通过数据图表和相关的文字结合分析。
        正文各部分具有逻辑关系。
      5.结论与建议
        结论是以数据分析结果为依据得出的分析结果,通常以综述性文字来说明。
        建议是根据数据分析结论对企业或业务等所面临的问题而提出的改进方法,建议主要关注在保持优势及改进劣势等方面。
      6.附录提供正文中设计而未予阐述的有关资料,有时也含有正文中提及的资料,从而向读者提供一条深入数据分析报告的途经。
      它主要包括报告中涉及的专业名词解释、计算方法、重要原始数据、地图等内容。
    • 7.2.3 注意事项
          结构合理,逻辑清晰
          实事求是,反映真相
          用词准确,避免含糊
          篇幅适宜,简洁有效
          结合业务,分析合理

7.3数据分析报告范例

目录里面需要列出主要章节名称,这样就能对整份报告的分析思路一目了然。
在这里插入图片描述
1、分析研究背景
2、分析目的(有时候研究背景和目的合二为一)
在这里插入图片描述
分析思路
这里清晰地展示了数据报告的分析结构,当然也方便读者就自己所关心的部分重点阅读在这里插入图片描述
正文 这一页主要介绍了公司产品的销量构成情况。
在这里插入图片描述
下面这一页通过百分比堆积柱形图回答了产业分析的第二个问题,清晰地表现出用户在每种产品上所占的比例。
在这里插入图片描述
价格分析,通过堆积柱形图显示出公司产品的月度平均收入走势,读者能够很快了解产品在2010年的销 售情况。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 1
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
爬虫(Web Crawler)是一种自动化程序,用于从互联网上收集信息。其主要功能是访问、提取据并存储,以便后续分析或展示。爬虫通常由搜索引擎、据挖掘工具、监测系统等应用于网络据抓取的场景。 爬虫的工作流程包括以下几个关键步骤: URL收集: 爬虫从一个或多个初始URL开始,递归或迭代地发现新的URL,构建一个URL队列。这些URL可以通过链接分析、站点地图、搜索引擎等方式获取。 请求网: 爬虫使用HTTP或其他协议向目标URL发起请求,获取网的HTML内容。这通常通过HTTP请求库实现,如Python中的Requests库。 解析内容: 爬虫对获取的HTML进行解析,提取有用的信息。常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标据,如文本、图片、链接等。 据存储: 爬虫将提取的据存储到据库、文件或其他存储介质中,以备后续分析或展示。常用的存储形式包括关系型据库、NoSQL据库、JSON文件等。 遵守规则: 为避免对网站造成过大负担或触发反爬虫机制,爬虫需要遵守网站的robots.txt协议,限制访问频率和深度,并模拟人类访问行为,如设置User-Agent。 反爬虫应对: 由于爬虫的存在,一些网站采取了反爬虫措施,如验证码、IP封锁等。爬虫工程师需要设计相应的策略来应对这些挑战。 爬虫在各个领域都有广泛的应用,包括搜索引擎索引、据挖掘、价格监测、新闻聚合等。然而,使用爬虫需要遵守法律和伦理规范,尊重网站的使用政策,并确保对被访问网站的服务器负责。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值