数据分析
文章平均质量分 84
陪学
公众号:陪学产品经理FM
知识星球:陪学和他的朋友们
产品经理交流群+vx:pexue007
展开
-
16种常用的数据分析方法-主成分分析
该表主要用于判断各变量之间的线性相关关系,从而决定变量的取舍,即如果某一个变量与同一分组中其他变量之间的关联性不强,我们就认为该变量与其他变量测量的内容不同,在主成分提取中不应该纳入该变量。从本研究的结果来看,在分别对应聘者工作积极性(Q3-Q8,Q12,Q13)、工作自主性 (Q2,Q14-19)、工作热情(Q20-25)和工作责任感(Q1,Q9-11)的测量中,每组变量之间的相关系数均大于0.3,说明各组变量之间具有线性相关关系,提示满足假设2。这是通过保留低阶主成分,忽略高阶主成分做到的。原创 2024-05-28 09:43:30 · 733 阅读 · 0 评论 -
16种常用的数据分析方法-因子分析
因子分析模型是原始变量为因子的线性组合,现在我们可以根据回归的方法将模型倒过来,用原始变量也就是参与分析的变量来表示因子。另外,比较重要的还有 KMO 和球形检验,通过KMO值,我们可以初步判断该数据集是否适合采用因子分析方法,kmo结果有时并不会出现,这主要与变量个数和样本量大小有关。因子分析要求最后得到的因子之间相互独立,没有相关性,而因子转换矩阵显示,两个因子相关性较低。这时,最简单直接的方案就是削减变量个数,确定主要变量,因子分析以最少的信息丢失为前提,将众多的原有变量综合成少数的综合指标。原创 2024-05-27 09:26:35 · 363 阅读 · 0 评论 -
16种常用的数据分析方法-时间序列分析
数据中的起始时间就是数据文件里面的单元格第一个时间,我的第一个是1997年8月,每行表示的是月度销售量,因此,需要从"定义日期"对话框的左侧"个案是"框中选择"年,月",在左侧输入‘1997’,月框中输入‘8’,表示第一个个案的起始月是1997年8月,4、 在“时间序列建模器”对话框中,切换至“保存”选项卡中,勾选“预测值”复选框,单击“导出模型条件”框中“XML文件”后面的“浏览”按钮,然后设置导出的模型文件和保存路径,然后单击“确定”按钮就可以了。拐点则是指时间序列从上升趋势突然变为下降趋势的点。原创 2024-05-24 09:42:55 · 807 阅读 · 0 评论 -
16种常用的数据分析方法-多重响应分析
在进行问卷调查时,经常会遇到一部分多选题,我们一般选择用二分法记录数据,因为各选项均是对同一个问题的回答,之间存在一定的相关,将各选项单独进行分析并不恰当。SPSS菜单操作为:分析——多重响应——频率,在弹框内可看见上一步建立的项集,勾选“在二分集内成列排除个案”,点击确定。=N/总计 =14/78=17.9%,即选择3G资费太高的消费者在所有响应中(所有1的次数)的比例;将“变量集" 移入”行“列表框内, 将”客户类型“移入”列框内,层选框可以不选,需要时再选。1.调查问卷数据录入。原创 2024-05-23 09:44:18 · 224 阅读 · 0 评论 -
四大误区:中台产品时设计你中招了几个?
建设数据中台是为了实现“数据业务化,业务数据化”,核心目标是构建可复用的数据资产中心、数据智能中心、数据管理中心和数据公共服务中心,赋能业务数据化和智能化,敏捷响应客户的个性化需求。从企业整体资源配置和效益最大化的角度来看,业务中台人员需要从流程上进行梳理,抽象和归纳,从而产生公共的业务流程和服务需求,同时可以产生海量可用的数据资产,这就是业务中台的核心价值。数据中台和业务中台是一对孪生兄弟,相辅相成,互相促进,各尽其职,携手支撑业务前台的敏捷需求,打造可复用的数据资产、数据能力和业务公共服务。原创 2024-05-11 09:29:10 · 242 阅读 · 0 评论 -
趋势分析是什么?市场趋势分析的经典方法,从数据中识别机会
还有,2013年12月份值得关注,这个月的销量不同于其它年份,反常的上升十分明显,其它年份都是下降的,而且2013年的7月的销量处于全年月销量的第二名,也值得继续分析。图中红色指出的,十分明显,2015年销量之所以很低,是因为2015年数据不完整,只有1、2月的销量记录,所以从年趋势图得出2015年销量下降这个结论,并不准确。另外,仔细观察2012到2014年,3年期间11月份的销量,在年度月销量中都处于顶峰,且连续3年都是上升趋势,尤其是2014年,有成倍爆发的趋势。剩下的,就是数据本身的准确性了。原创 2024-04-26 09:30:00 · 913 阅读 · 0 评论 -
需求优先级怎么排?需求分类怎么分?KANO模型实操讲解
落入这一象限的属性,称之为是期望属性,即表示产品提供此功能,用户满意度会提升,当不提供此功能,用户满意度就会降低,这是质量的竞争性属性,应尽力去满足用户的期望型需求。落入这一象限的属性,称之为是必备属性,即表示当产品提供此功能,用户满意度不会提升,当不提供此功能,用户满意度会大幅降低;落入这一象限的属性,称之为是魅力属性,即表示不提供此功能,用户满意度不会降低,但当提供此功能,用户满意度和忠诚度会有很大提升;用户意想不到的,如果不提供此需求,用户满意度不会降低,但当提供此需求,用户满意度会有很大提升;原创 2024-04-23 09:29:59 · 1184 阅读 · 0 评论 -
企业数智化产品如何设计?
企业数智化,是基于新一代数字与智能技术的各类云服务,通过网络协同、数据智能、连接资源、重组流程、赋能组织,处理交易,执行作业,融入数字经济,推进企业业务创新(研发、生产、营销、服务等)、管理变革(管理模式、组织与人才、管理决策等),从而转变生产经营与管理方式,实现更强竞争优势、更高经营绩效、更可持续发展的进步过程。数智化企业要以消费者运营为核心,需要构建一套实时感知、响应、服务客户的新架构体系,一套基于云计算、数据中台和移动端的开放解决方案,实现与供应商、代理商以及客户的数据集成。原创 2024-04-16 10:25:01 · 592 阅读 · 0 评论 -
一文说明白推荐引擎
推荐引擎是什么?综合利用用户的行为、属性,对象的属性、内容、分类,用户对内容或商品的喜好,以及用户之间的社交关系等等,挖掘用户的喜好和需求,主动向用户推荐其感兴趣或者需要的内容和商品。输出为用户推荐其感兴趣或者需要的对象数据源用户:行为、属性对象:属性、内容、分类用户、对象间:偏好用户间:社交关系、信任处理挖掘用户喜好推荐引擎工作原理图将推荐引擎看作.原创 2022-02-08 17:06:14 · 1208 阅读 · 0 评论 -
需求分析-类图建模
类图中一共包含了以下几种模型元素,分别是:类(Class)、接口(Interface)以及类之间的关系。类(Class)在面向对象(OO) 编程中,类是对现实世界中一组具有相同特征的物体的抽象。接口(Interface)接口是一种特殊的类,具有类的结构但不可被实例化,只可以被实现(继承)。在UML中,接口使用一个带有名称的小圆圈来进行表示。类图中关...原创 2022-01-19 17:03:59 · 490 阅读 · 0 评论 -
16种常用的数据分析方法-列联分析
列联分析通常用来分析两个分类变量之间或者一个分类变量与顺序变量之间是否存在关联,关联的紧密程度如何。对关联性问题的处理称为独立性检验(Test of Independence),通过交叉列联表和检验进行列联分析。交叉列联表分为二维表与三维表两种,二维表交叉表可进行卡方检验,三维交叉表,可作Mentel-Hanszel分层分析。列联表结构2*2 列联表*c列联表案例公司在4个不同的地区设有分公司,公司准备进行工...原创 2022-01-18 17:19:23 · 824 阅读 · 0 评论 -
产品经理书单:《大数据时代:生活、工作与思维的大变革》
1书籍基本介绍书籍名称中文:《大数据时代:生活、工作与思维的大变革》书籍名称原文:《Big Data:ARevolution That Will Transform How We Live, Work, and Think》作者:[英] 维克托•迈尔•舍恩伯格(ViktorMayer-Schönberger)中文译者:周涛发行:浙江人民出版社页数:261页出版:2012-12;..原创 2021-12-17 18:30:00 · 1818 阅读 · 0 评论 -
16种常用的数据分析方法-方差分析
方差分析(Analysis ofVariance,简称ANOVA),又称“变异数分析”,又叫F检验。是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。方差波动来源由于各种因素的影响,研究所得的数据呈现波动状,而方差分析的基本原理认为不同处理组的均数间的差别基本来源有两个:一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。 实验条件,即不同的处理造成的差异,称为组间差异。 用变量在各组的均值与总均值之偏差平方和的总和表示.原创 2021-12-10 18:30:00 · 2857 阅读 · 0 评论 -
数据策略产品设计:北极星指标
北极星,又称北辰,从地球上看去,在天空的北极星位置好像总是高挂在正北方不动。而在数据增长产品设计中,北极星指标(North Star Metric),也叫第一关键指标 (One Metric That Matters), 是在产品的当前阶段与业务/战略相关的绝对核心指标。它帮助团队评估产品的成熟度及平台化用户规模,验证产品是否达到PMF阶段,在团队内统一当前产品迭代的核心目标认知。例如:相比“北极星指标”,很多时候,我们更喜欢“虚荣指标”或“半.原创 2021-12-01 17:36:59 · 1682 阅读 · 0 评论 -
16种常用的数据分析方法-聚类分析
聚类(Clustering)就是一种寻找数据之间内在结构的技术。聚类把全体数据实例组织成一些相似组,而这些相似组被称作簇。处于相同簇中的数据实例彼此相同,处于不同簇中的实例彼此不同。聚类分析定义聚类分析是根据在数据中发现的描述对象及其关系的信息,将数据对象分组。目的是,组内的对象相互之间是相似的(相关的),而不同组中的对象是不同的(不相关的)。组内相似性越大,组间差距越大,说明聚类效果越好。聚类效果的好坏依赖于两个因素:1...原创 2021-11-25 18:30:00 · 9596 阅读 · 0 评论 -
这可能是你能找到最全面的数据预处理介绍
本文主要介绍数据详细处理流程处理的原因,对于处理方法的原理简略。想深入了解原理可以根据这份框架深入研究思索,将框架和细节一起把握。数据是机器学习的原料,在把数据投入机器学习模型前,我们需要对数据进行加工。正确预处理数据对模型输出结果有非常大的影响。可以说,数据预处理是机器学习落地最麻烦但最具有挑战的环节。数据可能存在问题在实际业务处理中,数据通常是脏数据。所谓的脏,指数据可能存在以下几种问题(主要问题): 数据缺失(Incomp..原创 2021-11-15 17:54:47 · 1532 阅读 · 0 评论 -
16种常用的数据分析方法-主成分分析
主成分分析(英语:Principal components analysis,PCA)是一种分析、简化数据集的技术。通过降维技术把多个变量化为少数几个主成分(综合变量)的统计分析方法。这些主成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的某种线性组合。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。主成分分析由卡尔•皮尔逊于1901年发明,用..原创 2021-11-03 18:30:00 · 3702 阅读 · 4 评论 -
【精华】数据产品经理必懂的基本知识
数据产品设计典型流程数据产品设计的流程包括3部分:01数据获取做数据产品首先要有数据,数据来源有两个:l从别人得拿:质量好得一般要花钱,免费的一般会有使用限制。,数据质量也可能存在问题,乱码、缺字段等。l自己抓:自己的系统可以埋点,别人的数据看看能不能通过爬虫抓取(爬虫帮你圆大数据的梦),也有很多基于爬虫的数据分析产品,用户分析、舆情分析、物价分析、量化投资等。数据获取和清洗环节PM的工作:1.针对业务需求进行解读转化成不同...原创 2021-10-29 18:30:00 · 1254 阅读 · 0 评论 -
16种常用的数据分析方法-时间序列分析
时间序列(time series)是系统中某一变量的观测值按时间顺序(时间间隔相同)排列成一个数值序列,展示研究对象在一定时期内的变动过程,从中寻找和分析事物的变化特征、发展趋势和规律。它是系统中某一变量受其它各种因素影响的总结果。研究时间序列主要目的可以进行预测,根据已有的时间序列数据预测未来的变化。时间序列预测关键:确定已有的时间序列的变化模式,并假定这种模式会延续到未来。时间序列的基本特点假设事物发展趋势会延伸到未来预测所依据的数据具有...原创 2021-10-25 17:01:31 · 16864 阅读 · 0 评论 -
[经典]数据产品需求文档怎么写?
何为数据产品?从广义上讲,一切以数据作为驱动或者核心的都叫数据产品(例如数据报表平台、DMP、搜索与精准化产品、风控产品等等),从狭义上讲,就是公司的内部数据平台。今天和大家讨论的,主要是关于公司的内部数据平台的搭建。公司的内部数据平台,主要作用是提供给公司内部所有部门人员使用,使公司内部的所有业务能够通过数据来驱动和决策。简单点讲就是通过数据平台来驱动公司内部的数据化运营。 如何设计一款好用的数据产品?数据产品经理本身就是一个合格的数据分析师,所以数据产品经...原创 2021-10-18 17:46:53 · 511 阅读 · 0 评论 -
16种常用的数据分析方法-因子分析
因子分析法是指从研究指标相关矩阵内部的依赖关系出发,把一些信息重叠、具有错综复杂关系的变量归结为少数几个不相关的综合因子的一种多元统计分析方法。是一种旨在寻找隐藏在多变量数据中、无法直接观察到却影响或支配可测变量的潜在因子、并估计潜在因子对可测变量的影响程度以及潜在因子之间的相关性的一种多元统计分析方法基本思想根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量不相关或相关性较低,每组变量代表一个基本结构一即公共因子。为什么...原创 2021-10-14 17:04:31 · 4578 阅读 · 0 评论