【回归】就是用属性的历史数据预测未来的趋势。回归首先假设一些已知类型的函数可以拟合目标数据,然后利用某种误差分析确定一个与目标数据拟合程度最好的函数。回归模式的函数定义与分类模型相似,主要差别在于分类模型采取离散预测值(例如类标号),而回归模式采取采取的预测值。
回归算法在解决实际问题时经常会把数据拆分为两个数据集:训练数据集、测试数据集。通过数据挖掘算法对训练数据集进行建模,寻找X和Y之间的数学模型,然后通过测试数据集来验证该数学模型的准确率,如果误差能够达控制到一定精度,则认为该模型很好的反映了X和Y的关系,可以用来进行预测和分析。
典型案例(电力负荷预测)
电力负荷预测是电力系统运行调度、生产规划、电力市场竞价决策的重要组成部分。做好电力负荷预测管理工作可以有效降低电网公司运行成本并提高电力设备运行效率,其预测精度不仅影响到电网安全可靠供电、而且直接影响到电网经营企业的生产经营及经济效益。 某市2010年8月1日至8月31号最大负荷数据数据,预测后3天的日最大负荷。