数据分析的理论与实践

原创 2015年07月08日 11:00:40

学习重在与理论在实践中的运用,数据分析更为如此。而我们所知的数据分析包括很多的理论知识,简单的有统计学中的参数与非参,复杂的有机器学习中的神经网络和支持向量机。在学习的过程中我们不可能在一开始就把这些理论全部弄清楚,需要理论与实践反反复复的去磨,才能把这些融汇贯通。

比如说学习一些统计学理论,我们从刚开始的数据分类开始学,一章一章的学到多元线性回归,这算基础统计学的理论学习完成了。但是我们真的会进行简单的数据分析吗?恐怕不可能吧?给你一个调查问卷,你能分析出它们变量的类型吗?如何确定它们是否是随机的?如何确定该连续性变量是正态分布?如何去除缺失值和异常值?这些都是我们在理论书上我们无法学习到的,只能通过实践去解决。

对于实践,我个人认为用你最熟悉的统计软件去实现统计理论较好,如果没有最熟悉的,可以用最简单的统计软件。原因是你不需要花很多时间去学习软件的操作,我就是通过SPSS去学习的,SPSS够简单,熟悉EXCEL的人对SPSS没有排斥。

在实践的过程中,你会发现有很多地方你毫无思路,说明你的理论知识有欠缺,比如在你想构建一个多元线性回归的模型,但你毫无头绪,不知道从何开始,这时候你就得去翻翻理论书,书上一般都会把多元线性回归的步骤和注意事项明确的写出来,你只要多去看看,多去想想就能理解了。

其实,在学习过程中,最忌只沉浸在理论或实践中,闭门造车了。只学数据分析的理论,你不可能去学会真正的分析;而只知道去操作,不去学数据分析理论,你根本无法提高自己的高度。

总结一下,学习的过程:理论的大概了解——最简单的软件去实现——出现问题,回看理论书籍——去实现。结果是:你统计理论掌握了,这个软件也掌握了,然后你用你掌握的统计理论知识,去学习新的统计软件就简单了。

版权声明:本文为博主原创文章,未经博主允许不得转载。

大数据时代 | 数据分析方法及理论详解

越来越多的应用涉及到数据,这些数据的属性,包括数量,速度,多样性等等都是呈现了数据不断增长的复杂性,所以,数据的分析方法在大数据领域就显得尤为重要,可以说是决定最终信息是否有价值的决定性因素。基于此,...
  • chenjunji123456
  • chenjunji123456
  • 2016年05月19日 10:55
  • 732

大数据技术与抽样数据分析的不同之处

大数据和以往的信息产出方式相比具有三个明显的特征—数据量大、非结构性和实时性,它创造了一个无限可能的世界。企业正在以史无前例的方式建立和应用大数据解决方案,这些方案不仅能够帮助他们实现收益的最大化,更...
  • chinaoccs
  • chinaoccs
  • 2014年08月13日 09:52
  • 651

阿里2015暑期实习生数据分析笔试题 部分

昨天有幸参加阿里数据分析实习生的笔试题。在群里发现好多人的题目多不一样,应该是从题库随机发放的。 总共15题,客观题和主观题两部分,答题时间60min 1、以下算法对缺失值敏感的模型包括: A、L...
  • u012905439
  • u012905439
  • 2015年04月01日 09:28
  • 1333

数据分析与数据仓库建模

第一部分     数据分析师现在已经成为了一个热门的职位,高薪的吸引力让很多先要从事这方面工作的人趋之若鹜,各种数据培训课程的开设,但是重点都是在怎么学习算法、怎么进行数据处理,怎么保证通过数据模型...
  • u010159842
  • u010159842
  • 2015年07月30日 22:42
  • 1945

数据分析理论(导航页)

版本号:20171103 1、直接点击蓝色文章名称即可阅读。 2、持续更新,重复获取请前往【理论基础】-【数据分析基础】。 数据分析理论导航页收录已经发布的工作生活用到的数据分析...
  • D07Qs2KxkH0KkSxEx
  • D07Qs2KxkH0KkSxEx
  • 2017年11月03日 00:00
  • 63

数据科学中R VS Python:获胜者是...

数据科学中R VS Python:获胜者是…在”最佳”数据科学工具的比赛中,R和Python都有自己的优缺点.对二者的选择取决于使用背景,学习花费和其他常用工具的需要 Martijn Theuwiss...
  • Er8cJiang
  • Er8cJiang
  • 2016年04月05日 16:41
  • 2008

大数据与人工智能

转自:http://www.360doc.com/content/15/0424/09/20625606_465608494.shtml 技术不足导致移动互联网难以催生出更多的新应用和商业模式...
  • xuxiatian
  • xuxiatian
  • 2016年11月10日 09:38
  • 14535

数据分析理论(导航页)

版本号:201712021、直接点击蓝色文章名称即可阅读。2、持续更新,重复获取请前往【理论基础】-【数据分析基础】。数据分析理论导航页收录已经发布的工作生活用到的数据分析思路及理论方法。例如数据分析...
  • D07Qs2KxkH0KkSxEx
  • D07Qs2KxkH0KkSxEx
  • 2017年12月02日 00:00
  • 29

《自然语言计算机形式分析的理论与方法》读书笔记(2)

第二章 语言计算研究的先驱 介绍了马尔可夫链、信息熵、范畴语法自然语言模型,并对提出者们进行了简介...
  • hermanncain
  • hermanncain
  • 2017年07月03日 21:47
  • 536

Python数据分析与挖掘实战代码纠错 代码3-3

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦: Markdown和扩展Markdown简洁的语法 代码块高亮 图片链接和...
  • qhy950207
  • qhy950207
  • 2017年11月14日 22:41
  • 135
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:数据分析的理论与实践
举报原因:
原因补充:

(最多只允许输入30个字)