使用Python和支持向量回归
在本文中,我将向您展示如何使用称为支持向量回归(SVR)的机器学习算法创建自己的股票预测Python程序。在这个程序中,我将使用Facebook(FB)股票数据,并根据数据预测某天的开盘价。
支持向量回归(SVR)是一种支持向量机,也是一种用于分析数据进行回归分析的监督学习算法。1996年,由Christopher J. C. Burges、Vladimir N. Vapnik、Harris Drucker、Alexander J. Smola和Linda Kaufman提出了该版本的SVM回归模型。SVR生成的模型只依赖于训练数据的一个子集,因为用于构建模型的成本函数忽略了任何接近模型预测的训练数据。
支持向量机优点:
- 它在高维空间中效果明显。
- 如果有清晰的间隔界限,工作效果会很好。
- 少数支持向量决定了最终结果,这不但可以帮助我们抓住关键样本,“剔”除大量冗余样本。
支持向量回归缺点:
- 当我们有大量数据集时,它表现不佳。
- 如果数据集有噪声(大量额外的无意义信息),性能就会很低。
内核类型:
- 线性
- 多项式
- 高斯核函数( 径向基函数 rbf )
- Sigmoid
开始编程:
在编写单行代码之前,我们最好是在代码前添加注释来描述我们需要做的事情。通过这种方式,可以回顾代码并确切知道它的作用。我们使用支持向量回归(SVR)模型来预测某一天FB股票的价格。
导入我们需要的库
import pandas as pd
import numpy as np
from sklearn.svm import SVR
import matplotlib.pyplot as plt
接下来,我将把从http://finance.yahoo.com获得的Facebook(FB)股票数据加载到一个名为'df'的数据框缩写变量中。然后输出前几行的数据。
注意