一、机器学习
从预测值的类型上看,连续变量预测的定量输出称为回归;离散变量预测的定性输出称为分类
生成模式和判别模式的区别:
生成模式: 由数据学得联合概率分布,求出条件概率分布P(Y|X)的预测模型;
常见的生成模型有:朴素贝叶斯、隐马尔可夫模型、高斯混合模型、文档主题生成模型(LDA)、限制玻尔兹曼机
判别模式: 由数据学得决策函数或条件概率分布作为预测模型
常见的判别模型有:K近邻、SVM、决策树、感知机、线性判别分析(LDA)、线性回归、传统的神经网络、逻辑斯蒂回归(LR)、boosting、条件随机场(CRF)
感知机:
是二分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别
具体方法:感知机对应于输入空间(特征空间)中将实例划分为正负两类的分离超平面,输入判别模型。
优化方法:随机梯度下降
K-means:
是一种典型的无监督学习算法,主要用于将相似的样本自动归到一个类别中