数学建模之大数据统计

EverydayOneCat

卡其脱离太!

知识点

1.大数据的MATLAB导入导出

1.1调用xlsread函数读取数据

常用格式:

  • num = xlsread(filename, sheet, range)
    • sheet可省略,默认是’Sheet1’
    • range是左上角到右下角
    • 切记在全国大学生数学建模赛中不要用绝对路径
  • num = xlsread(filename, -1)
    • 这个是打开excel表让你自己选择区域,也很常用

将数据A.xlsx放入默认路径下,读取文件A.xlsx第1个工作表中单元格A2:H4中的数据

num=xlsread('A.xlsx', 'A2:H4')

1.2把数据写入Excel文件

  • xlswrite(filename, M, sheet, range)
    • M是需要插入的数据名称
    • 如果没有该文件,会自动创建一个

把矩阵x写入文件B.xls(放在默认路径下)的第2个工作表中的单元格区域D6:I10,并返回操作信息

[s,t] = xlswrite(‘B.xls', x, Sheet2, 'D6:I10‘)

定义一个元胞数组,将它写入Excel文件B.xls的自命名工作表的指定区域;把元胞数组x写入文件D盘的B.xls的指定工作表(Sheet1)中的单元格区域A3:F5

x = {1,60101,6010101,'陈亮',63,'';2,60101,6010102,'李旭',73,'';3,60101,...
6010103,'刘鹏飞',0,'缺考'} % 定义一个元胞数组,这种有中文的用大括号
x =
[1] [60101] [6010101] '陈亮' [63] ''
[2] [60101] [6010102] '李旭' [73] ''
[3] [60101] [6010103] '刘鹏飞' [ 0] '缺考'
xlswrite('D:\B.xls',x,'Sheet1','A3:F5')

2.大数据的清洗

2.1缺失值处理:插值

在实际中,常常要处理由实验或测量所得到的一些离散数据。插值与拟合方法就是要通过这些数据去确定某一类已知函数的参数或寻求某个近似函数,使所得到的近似函数与已知数据有较高的拟合精度。此类问题为插值问题。

MATLAB 实现:实现分段线性插值不需要编制函数程序,它自身提供了内部的功能函数:
interp1 (一维插值) intep2 (二维) interp3 (三维) intern (n维)

image-20200727140428703

例:从1点12点的11小时内,每隔1小时测量一次温度,测得的温度的数值依次为:5,8,9,15,25,29,31,30,22,25,27,24.试估计每隔1/10小时的温度值。

hours=1:12;
temps=[5 8 9 15 25 29 31 30 22 25 27 24];
h=1:0.1:12;
t=interp1(hours,temps,h,'spline');
plot(hours,temps,'+',h,t,hours,temps,'r:')
xlabel('Hour'),ylabel('Degrees Celsius')
image-20200727141037113

+++

<
  • 10
    点赞
  • 52
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值