- 博客(21)
- 资源 (1)
- 收藏
- 关注
原创 谁说菜鸟不会数据分析(入门篇)----- 学习笔记6(数据分析报告)
1、数据分析报告:三大作用四项基本原则定义 是根据数据分析原理和方法,运用数据来反映、研究和分析某项事物的现状、问题、原因、本质和规律,并得出结论,提出解决办法的一种分析应用文体。 这种文体是决策者认识事物、了解事物、掌握信息、搜集相关信息的主要工具之一,数据分析报告通过随事物数据全方位的科学分析来评估其环境及发展情况,为决策者提供科学、严谨的依据,降低风险。 ...
2018-09-26 22:16:33 1314
原创 谁说菜鸟不会数据分析(入门篇)----- 学习笔记5(数据展现:图表)
1、图表作用:表达形象化、突出重点、体现专业化2、图标类型:3、通过关系选择图表4、图表制作5步法5、图表:图所不能说的话突出单元格显示:绝对值 项目选取:相对值 数据条:量纲不同 图标集:企业运营指标发展态势监控 迷你图:塞到每一个单元格6、图表换装-由经济适用图表转换而来平均线图(对比)-不带标记的折线图 双坐标图(两个系列及以上,量纲不同或数据...
2018-09-25 23:01:41 1759
原创 谁说菜鸟不会数据分析(入门篇)----- 学习笔记4(数据分析方法)
1、数据分析方法数据分析作用与对应的分析方法 数据分析作用 基本方法 数据分析方法 现状分析 对比 对比分析、平均分析、总和评价分析 原因分析 细分 分组分析、结构分析、交叉分析、杜邦分析 漏斗图分析、矩阵关联分析、聚类分析 预测分析 预测 回归分析、时间序列、决策树、神经网络 ...
2018-09-25 18:38:36 2895
原创 谁说菜鸟不会数据分析(入门篇)----- 学习笔记3(数据准备、处理)
1、数据准备:一维表的列标签是字段,二维表的列标签是数据数据表的设计要求 数据表由标题行和数据部分组成 第一行是标的列标题(字段名),列标题不能重复 第二行是数据部分,数据部分的每一行数据称为一个记录,并且数据部分不允许出现空白行和空白列 数据表中不能有合并单元格存在 数据表与其他数据之间应该留出至少一个空白行和一个空白列 数据表需要以一维...
2018-09-24 21:13:11 960
原创 谁说菜鸟不会数据分析(入门篇)----- 学习笔记2(结构为王:确定分析思路 4P 5W2H )
1、数据分析方法论确定分析思路需要以营销、管理等理论为指导,把这些跟数据分析相关的营销、管理等理论统称为数据分析方法论。 数据分析方法论主要用来指导数据分析师进行一次完整的数据分析,更多的是指数据分析思路,如从哪方面开展数据分析?各方面包含什么内容和指标。 数据分析方法论主要是从宏观角度指导如何进行数据分析,一个数据分析的前期规划,指导着后期数据分析工作的开展。数据分析法则是指具体的分析方...
2018-09-24 15:02:10 1759
原创 谁说菜鸟不会数据分析(工具篇)----- 学习笔记3(数据展现和日报月报自动化)
1、数据可视化的意义交互性:用户能够方便地通过交互界面实现数据的管理、计算与预测 多维性:可从数据的多个属性或变量对数据进行切片、钻取、旋转等,以此剖析数据,从而能多角度、多方面分析数据 可视性:数据可用图像、二维图形、三维图形和动画等方式来展现,并可对其模式和相互关系进行可视化分析。2、工具google fusion tables many eyes nodexl3、水晶易表...
2018-09-23 16:42:36 943
原创 谁说菜鸟不会数据分析(工具篇)----- 学习笔记2(数据分析:excel:power pivot)
1、数据分析方法:(1)呈现现状的描述性统计(power pivot :pp ),通过对比与细分进行现状及原因分析。可制作数据透视表,通过求和、求均值以及数据组成了解其构成,还可通过不同时间维度的对比,查找数据变化原因,最后制作相关图表对现状进行呈现及描述。(2)展望未来的预测性分析,分析现有数据间的相关性,探寻数据之间存在的联系,并进一步建立相关回归模型(分析工具库)的方式对未来进行预测...
2018-09-22 20:09:44 1069
原创 谁说菜鸟不会数据分析(工具篇)----- 学习笔记1(Access SQL基本用法)
1、数据库(database)数据库是按照数据结构来组织、存储和管理数据的仓库。利用数据库中的各种对象,记录、处理和分析各种数据。常用数据库:oracle,SQL Server,MySQL,Access等关系型数据库NoSQL技术的分布式数据库:Hbase,MongoDB,Redis等(1)Access数据库 优点:操作界面友好,易操作;查询处理可直接生成相应的SQL...
2018-09-21 22:18:25 3902
原创 谁说菜鸟不会数据分析(入门篇)----- 学习笔记1(数据分析基本概念)
1、何谓数据分析数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这里的数据也称观测值,是通过实验、测量、观察、调查等方式获取的结果,常常以数量的形式展现出来。数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总...
2018-09-20 21:02:18 2482
原创 多维数据模型
一、从关系表和电子表格到数据立方体数据仓库和数据仓库技术基于多维数据模型。这个模型把数据看成是数据立方体形式。多维数据模型围绕中心主题组织,该主题用事实表表示。事实是数值度量的。数据立方体允许以多维数据建模和观察,它由维和事实定义。维是关于一个组织想要记录的视角或观点,每个维都有一个表与之相关联,称为维表。事实表包括事实的名称或度量,一个n维的数据立方体叫做基本方体。给定一个维的集...
2018-09-18 15:04:33 16306
原创 时间序列分析和预测(含实例及代码)
导论研究时间序列主要目的:进行预测,根据已有的时间序列数据预测未来的变化。时间序列预测关键:确定已有的时间序列的变化模式,并假定这种模式会延续到未来。时间序列预测法的基本特点 假设事物发展趋势会延伸到未来 预测所依据的数据具有不规则性 不考虑事物发展之间的因果关系 时间序列数据用于描述现象随时间发展变化的特征。时间序列分析就其发展历史阶段和所使...
2018-09-17 21:37:34 224128 44
转载 MATLAB——基本调试方法(Debug)
转自:http://www.cnblogs.com/xingshansi/articles/6477185.html 前言 之前经常用MATLAB,却不小心停留在了舒适区,连基本的调试方法都没有掌握。本文主要是对MATLAB程序调试中的一般方法进行总结,也是自己学习的记录。全文大致分为三个段落: 1)代码内调试; 2)断点调试方法; 3)指令...
2018-09-12 20:38:16 51767
原创 科学试验及其误差控制
一、科学研究的基本过程和方法1、基本过程科学研究的目的在于探求新的知识、理论、方法、技术和产品。基本过程包括3个环节:a、根据本人的观察了解或前人的观察(文献)对所研究的命题形成一种认识或假说b、根据假说所涉及的内容安排相斥性试验或抽样调查c、根据试验或调查所获的资料进行推理,肯定或否定或修改假说,从而形成结论,或开始新一轮的试验以验证修改完善后的假说,如此循环发展,使所获得的...
2018-09-10 16:58:38 2911
原创 次数分布和平均数、变异数间断性变数资料的整理
通过科学试验的观察、测定和记载,可得到大量的数据资料,这些资料必须按照一定的程序进行整理和分析,才能透过数据表现看到蕴藏在数据中的客观规律。资料整理和分析时试验工作的重要组成部分。一、总体及其样本具有共同性质的个体所组成的集团,称为总体(population)。总体根据事物的属性人为规定。总体所包含的个体数目可能是无穷多个,这种总体称为无限总体(infinite population)...
2018-09-09 22:12:41 3697
原创 理论分布和抽样分布------(四)抽样分布
统计学的一个主要任务就是研究总体和样本之间的关系。这种关系可以从两个方向进行:(1)从总体到样本的方向,目的是要研究从总体中抽出的所有可能样本统计量的分布及其与原总体的关系,即抽样分布(2)从样本到总体的方向,从总体中随机抽取样本,并用样本对总体作出推论,即统计推断问题。抽样分布(sampling distribution)是统计推断的基础。一、统计数的抽样及其分布参数从总体中...
2018-09-08 11:43:30 7363 4
原创 理论分布和抽样分布------(三)连续型随机变量的概率分布(正态分布)
正态分布(normal distribution),是连续性变数的理论分布。日常生活中许多数量指标总是正常范围内有差异。偏离正常,表现过高或过低的情况总是比较少,且越不正常的可能性越少,这就是所谓的常态或“正态”,可以用正态分布的理论及由正态分布衍生出来的方法来研究。一般作物产量和许多经济性状的数据均表现属正态分布。在适当条件下,可用来做二项分布及其它间断性或连续性变数分布的近似分布,就能...
2018-09-07 13:49:18 1960
原创 理论分布和抽样分布------(二)离散型随机变量的概率分布(二项分布和泊松分布)
一、二项总体及二项式分布试验或调查中最常见的一类随机变数是整个总体的各组或单位可以根据某种性状的出现与否而分为两组。如:小麦种子发芽和不发芽,大豆种子叶色为黄色和青色。这类变数均属间断性随机变数,其总体中包含两项,即:非此即彼的两项,它们构成的总体称为二项总体(binary population)。为便于研究,通常将二项总体中的“此”事件以变量“1”表示,概率p,“彼”,以“0”表示,具概...
2018-09-06 16:33:42 4254
转载 Pearson,Kendall和Spearman三种相关分析方法的异同
在SPSS软件相关分析中,pearson(皮尔逊), kendall(肯德尔)和spearman(斯伯曼/斯皮尔曼)三种相关分析方法有什么异同两个连续变量间呈线性相关时,使用Pearson积差相关系数,不满足积差相关分析的适用条件时,使用Spearman秩相关系数来描述.Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,...
2018-09-06 10:24:26 31344 2
原创 理论分布和抽样分布------(一)事件、概率和随机变量(离散、连续)
抽样分布:从间断性变数总体的理论分布(二项分布和泊松分布)和连续性变数总体的理论分布中抽出的样本统计数的分布,即抽样分布。一、事件和事件发生的概率事件:在自然界中一种事物,常存在几种可能出现的情况,每一种可能出现的情况称为事件事件的概率:每一件事出现的可能性,称为该事件的概率(probability)。随机事件:某特定事件只是可能发生的几种事件中的一种,这种事件称为随机事件(ran...
2018-09-05 17:29:43 2431
原创 曲线回归------(二)多项式回归
一、多项式回归方程(1)多项式回归方程式当两个变数间的曲线关系很难确定时,可用多项式逼近 ,称多项式回归(polynomial regression)。最简单的多项式是二次多项式,方程为:三次多项式方程为: 具有两个弯曲和一个拐点多项式方程的一般形式:特点:具有k-1个弯曲(k-1个极值)和k-2个拐点的曲线多项式回归方程通常只能用于描述试验范围内Y依X的变化关系...
2018-09-04 21:45:54 11922
原创 曲线回归------(一)曲线的类型与特点及方程的配置
两个变数之间的关系不一定是简单的线性关系,可能是多种多样的曲线关系。X在某一区间上,X和Y的关系有可能用线性描述,但X可能取值的区间而言 ,可能是非线性。两个变数呈现曲线关系的回归称曲线回归(curvilinear regression)或非线性回归(non-linear regression)。以最小二乘法分析曲线关系资料在数量变化上的特征和规律,称为曲线回归分析或非线性回归分析。...
2018-09-03 11:47:04 17849 2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人