实验室项目中要把数据按正态分布分成几类,但是有不知道有几类,估计不超过三类。然后就用了BIC准则选择类个数,效果出奇的好 哈哈哈哈
GMM初值对结果会有很大影响,按数据min,max均分正态的均值,然后用整体数据的方差作为初始方差 完美的解决了这个问题。可能是我们数据本身的原因。
研一学的总算用上一点 好开心
const static int MAX_ITERATOR = 1000;
const static double END_THR = 0.0001;
const static double SIM_THR = 0.2;
const static double PI = 3.14159265;
const static double EE = 2.71828;
struct Gaussian{
double mean, dalta;
double weight;
Gaussian(double m=0, double v=0, double w=1.0): mean(m), dalta(v), weight(w){
}
double getProbability(double x) const {
return weight * std::pow(EE, -std::pow(x-mean, 2.0) / (2*dalta*dalta)) / ( std::pow(2*PI, 0.5) * dalta );
}
private:
friend std::ostream& operator<<(std::ostream& os, const Gaussian & x);
};
std::ostream& operator<<(std::ostream& os, const Gaussian & x) {
os <&l