根据已知的样本结果信息,反推最有可能导致该结果的模型参数。
什么是极大似然估计
一句话,一个参数估计方法,就是确定了模型(比如正态分布),但是参数未知(正态分布的均值和方差未知),有了数据,我需要计算均值μ和方差θ。为了求极大似然估计,我们先要了解似然函数
似然(likelihood)函数
考虑函数P(x|θ),这个函数有两个输入,x表示具体样本,θ表示模型参数,那么
- 当θ已知,该函数退化为概率函数,即样本x出现的概率
- 当x已知,该函数退化为似然函数,即对于不同模型参数,出现x这个样本的概率
最大似然估计就是第二个问题,已知x,求θ,使P(x|θ)最大
极大似然估计的特点
极大似然估计的例子
假设一个袋子里有黑球和白球,现在往出放回地摸球,一共摸了十次,有7次黑球3次白球,问黑球所占比例最有可能是多少?如果我们将这个事件视为二项分布,且假设黑球出现的概率为θ,那么现在模型已知(二项分布)、样本已知(10次里7次黑球),求模型参数(θ的值)。假设样本x0=1,1,1,0,1,1,0,1,0,1。那么似然函数可以写为:
f(x0|θ)=θ3(1−θ)θ2(1−θ)θ(1−θ)θ=θ7(1−θ)3=f(θ)上面的f(θ)就是我们的似然函数,最大似然估计就是求这个函数的最大值,即df(θ)dθ=0。