数据科学与大数据分析项目练习-1熟悉并使用R语言进行数据分析

熟悉并使用R语言进行数据分析

使用Rstudio读取yearly_sales.csv并进行练习。
yearly_sales.csv包含一万条数据,包含4个column:customer id, sales total, number of orders 和 gender.
在这里插入图片描述

练习1

# 设置路径
setwd("c:/Users/T7/Desktop/123")

# 读取数据
sales <- read.csv("./yearly_sales.csv")
# 检查导入的数据集
head(sales)
summary(sales)
# plot num_of_orders vs. sales图片
plot(sales$num_of_orders,sales$sales_total,
     main="Number of Orders vs. Sales")

# 进行统计分析(拟合线性回归模型)
results <- lm(sales$sales_total ~ sales$num_of_orders)
results
summary(results)

# 对拟合的模型进行一些诊断
# 绘制残差直方图
hist(results$residuals, breaks = 800)

得到的图片一
在这里插入图片描述
图片二
在这里插入图片描述

练习2

数据的输入和输出

setwd("c:/Users/T7/Desktop/123")
sales <- read.csv("./yearly_sales.csv")

# 为每个订单的平均销售额添加一个列
sales$per_order <- sales$sales_total/sales$num_of_orders

# 以制表符分隔,不带行名的方式导出数据
write.table(sales,"sales_modified.txt", sep="\t",row.names=FALSE)

# 导出直方图到jpeg
jpeg(file="c:/Users/T7/Desktop/123/sales_hist.jpeg") # 创建一个新的jpeg文件

hist(sales$num_of_orders)# 导出直方图到jpeg

dev.off() # 关闭图形设备

在R中查看修改后的数据
在这里插入图片描述
在设置中路径中可以看到查看导出的数据。
在这里插入图片描述
sakes_hist.jepg
在这里插入图片描述

参考书目

  1. Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data, EMC Education Services, John Wiley & Sons, 27 Jan. 2015
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值