优达学城java_优达学城数据分析师纳米学位——P4项目知识点整理及代码分析

#P4项目知识点整理

##P4项目概述

##R语言知识点汇总

##数据分析实例解析

#P4项目概述

使用R+EDA(exploratory data analysis探索性数据分析)(探索式数据分析是在应用正式的、严格的统计分析之前,对数据的特征和关系进行数字和图表的测试) 来探索一个变量或多个变量之间的关系,以及在一个选定的数据集中探索分布,异常值和反常现象。

#R语言知识点汇总

1.R语言概述

R语言是一款强大,免费,扩展性高的开源编程语言,用于统计计算,同时运用了command-line scripting, you can store a series of complex data-analysis steps in R.

Re-use your data analysis work

make it easier for others to validate research results and check your work for errors

The language is actually fairly simple, but it is unconventional

2.数据处理:

###ggplot2 - Multiple Plots in One graph using gridExtra

区分 facet_wrap facet_grid 命令将数据分面在不同的数据表中显示,gridExtra可以在同一张表格中显示不同的数据

294e6d1ab46873900afcf0983124dff5.png

759db7cd38721f5568f5eae3b759b1f0.png

###生成有序变量 factor variables

3.数据转换 (data transformation)

log transformation

1.用于Monetary amounts--incomes, customer value, account, purchase sizes

basic data work

2.用于多个数量级的数据

3.用于倍增特征的数据 例如涨价 2% 需要根据原价调整,范围可能是2,可能是200,可能是20000

signedlog 10 =function(x) {

ifelse(abs(x)<=1, 0, sign(x)*log10(abs(x))) }

extracting key statistics out of a data set

explore a data set with basic graphics

reshape data to make it easier to analyze

4400+的数据包,18000+的领英小组

R的语言 is different from that of many other languages

##数据分析实例解析

Netflix Prize

The Netflix Prize was an open competition for the best collaborative filtering algorithm to predict user ratings for films, based on previous ratings without any other information about the users or films.

训练数据集

RMSE(root mean squared error) measure of the differences between values (sample and population values) predicted by a model or an estimator and the values actually observed

bdd7ad439bc2be60af39ccecea415bb9.png

qualifying set表示包含了 user, movie, date of grade 三个变量的数据集, 其中quiz set用来做预测算法的检验工作

提高推荐算法准确率

Foodborne Chicago finds dodgy restaurants with tweets, and R

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值