托马斯·贝叶斯(Thomas Bayes)是一位伟大的英国数学家,也是一位长老会牧师,后人普遍猜测贝叶斯提出贝叶斯公式的目的是为了从理论上对上帝是否存在进行证明。但贝叶斯的思路大大改变了概率论的发展,成为重要的一个分支。
贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。
贝叶斯公式就一行:
P(Y∣X)=P(X∣Y)P(Y)P(X)
而它是由以下的联合改了公式推导出来的
P(Y,X)=P(Y∣X)P(X)=P(X∣Y)P(Y)
其中 P(Y)叫做先验概率, P(Y∣X)叫做后验概率, P(Y,X)叫做联合概率
贝叶斯方法把计算“具有某特征的条件下属于某类”的概率转换成需要计算“属于某类的条件下具有某特征”的概率,而朴素贝叶斯(Navie Bayes)是什么意思?朴素到哪了?
加上条件独立假设的贝叶斯方法就是朴素贝叶斯方法(Navie Bayes)。navie这个词一般理解就是幼稚、朴素的意思。也就是说我们这个方法还是比较幼稚的,何解呢?朴素贝叶斯失去了词语之间的顺序信息,比如,在条件独立假设的情况下,“我喜欢女神”与“女神喜欢我”被它认作一个意思了,这尼玛能一样么?
不管如何,尝试用贝叶斯分类做一下股票预测。
数据方面,通过Tushare接口,获取2018第一季度的A股财务数据,选取下列十七个特征,包括市盈率、收入、现金流等基本财务指标。
'pe','outstanding','rev','profi