在机器学习中,朴素贝叶斯分类器是一个基于贝叶斯定理的比较简单的概率分类器,其中 naive(朴素)是指的对于模型中各个 feature(特征) 有强独立性的假设,并未将 feature 间的相关性纳入考虑中。 朴素贝叶斯分类器一个比较著名的应用是用于对垃圾邮件分类,通常用文字特征来识别垃圾邮件,是文本分类中比较常用的一种方法。朴素贝叶斯分类通过选择token(通常是邮件中的单词)来得到垃圾邮件和非垃圾邮件间的关联,再通过贝叶斯定理来计算概率从而对邮件进行分类。
贝叶斯公式
P(A|B) = P(B|A)*P(A)/P(B)
什么是贝叶斯推断
贝叶斯推断是一种统计学方法,用来估计统计量的某种特质.
朴素贝叶斯定理
设D是训练样本和相关联的类标的集合,其中训练样本属性集为:math:A_\text{c} = (\pi/4) d^2
.