朴素贝叶斯的推导和应用
文本数据的处理流程
使用TF-IDF得到文本特征
朴素贝叶斯的假设
一个特征出现的概率,与其他特征(条件)独立(特征独立性);其实是:对于给定分类的条件下,特征独立
每个特征同等重要(特征均衡性)
以文本分类为例
样本:1000封邮件,每个邮件被标记为垃圾邮件或者非垃圾邮件
分类目标:给定第1001封邮件,确定它是垃圾邮件还是非垃圾邮件
方法:朴素贝叶斯
朴素贝叶斯的推导和应用
文本数据的处理流程
使用TF-IDF得到文本特征
朴素贝叶斯的假设
一个特征出现的概率,与其他特征(条件)独立(特征独立性);其实是:对于给定分类的条件下,特征独立
每个特征同等重要(特征均衡性)
以文本分类为例
样本:1000封邮件,每个邮件被标记为垃圾邮件或者非垃圾邮件
分类目标:给定第1001封邮件,确定它是垃圾邮件还是非垃圾邮件
方法:朴素贝叶斯