为了预测某篇文章的阅读数量,忽略是否发布新文章这个不可控因素,使用阅读量为y,当前日期-文章发布日期为x,一共12组数据为测试集,预测之后3天的阅读量,但结果与预测的结果没有很大的差别,但拟合数据和实际数据相差甚远,存在疑问。文件名:CSDNread.m
12天内实际阅读量以及部分代码:
%阅读量
Y=[54,66,15,119,127,70,88,117,126,100,78,78]';
%日期:2022.09.19-2022.09.25
x=[1,2,3,4,5,6,7,8,9,10,11,12]';
X=[ones(12,1),x];
[b,bint,r,rint,stats]=regress(Y,X)
t=1:12;
figure(1);
y_fitting=X(t,:)*b;
plot(t,y_fitting,'r-', t,Y(t,:),'b-', t,abs(y_fitting-Y(t,:)),'k-');
legend('红--拟合值','蓝--实际值','黑--误差值');
所求的相关系数为0.13844,拟合方程为:y=64+3.4615x
残差图为:
后三天的预测数据量与实际阅读量以表格的形式展示:
预测阅读量 | 实际阅读量 |
50 | 56 |
53 | 50 |
57 | 47 |