最近同时在上cousera的另一门课程,希望三年后能成为一名出色的数据分析师,曾想过往大数据挖掘那方面试下的,不过慢慢地想法改变了下,只抱着单纯的学习数据处理技能来学习,或许也不错吧
第一节。series motivation
第一节嘛,主要还是讲下学习的理由,以及什么叫做data scientist。确实看过之后让我的观念有所改变,并不是只有像anderew NG 这样的牛人才能搞数据分析,也不是隔壁的华工机器学习那帮人才能搞,高端有高端玩法,只要把跟自己工作相关的数据处理好,依靠数据作决策,就应该有碗饭吃了吧
不说闲话,先放一个维恩图,不错的框架,努力的方向呀(编程能力,数学及统计学知识,实务能力),有意思的是只有编程和实务能力,看来是成不了数据分析师的哦
第二节 数据科学家的工具箱
R,Github.当然我觉得有价值的应该是下面这张图吧,感觉全程像是做菜
1.3 getting help
首先是一些r的帮助
1.4 finding answer
以下是各方面牛人的关键特征,也可以说是长处,要学会啊(有点感觉week1是在进行德育训练,不像是技能训练呢)
参照第一图
不得不说外国人还是敬业,这都总结,呵呵
1.5 r语言总览(五笔为jtyq)之所以第三笔是y,是要加一点
1.6 getting and cleaning data overview
这是我觉得很重要的一环
1.7exploratory analysis overview
探索式分析内容,这些都是基本步吧
分析图的原则
探索式绘图
plotting systems in R -base -lattice(晶格式) -ggplot2(另一种绘图包)
hierarchical分层 聚类 k-means聚类
维降约
1.8 reproducible research overview(重复性研究概论)
重复性研究内容:
一个数据分析的结构
组织一个数据分析
markdown
LaTeX
R Markdown
基于证据的数据分析
RPubs
数据分析的步骤见1.2最后一张图
1.9统计推断概述statistical inference overview
1.10回归模型概述regression models overview
1.11实用机器学习概述
主要是marchine learning in R
1.12 数据产品创建概述
R包是一个很好的展示自己的机会,若有实力,可以做一个,于是找工作什么的应该就不难了吧
注意R allows object oriented programming这句话是错的,要记住