本文将分享一些搜集来的马尔可夫链应用场景供读者参考,希望能带来一些启发.
马尔可夫链回顾
目前,我们总计接触了两个马尔可夫链的问题背景,一个是老鼠版Maze Runner问题,一个是Page Rank算法. 下面先回顾下马尔可夫链模型的相关概念.
我们用
把研究对象经过
如果研究对象每一次的状态转移,只与转移前所处的状态有关,与之前的转移无关
[1],即我们用
称为转移矩阵.
于是我们会得到状态向量满足如下递推关系,
不难推得,
场景一: 天气预报
如果我们把天气状况简单分为晴、多云、雨天三个状态,通过对某一地区历史气象数据统计发现 [2],
- 如果当天是晴天,则第二天是晴天的概率[3]为
,是阴天的概率为 ,是雨天的概率为 . - 如果当天是多云,则第二天是晴天的概率为
,是阴天的概率为 ,是雨天的概率为 . - 如果当天是雨天,则第二天是晴天的概率为
,是阴天的概率为 ,是雨天的概率为 .
如果周一是晴天,那么如何预测周五的天气情况.
几乎所有关于马尔可夫链的教材都会有这样的习题或者例题,但实际应用中往往比这个要复杂得多. 而且第二天的天气真的只与当天天气有关,与前一天无关吗?
当然我们可以改为考虑前两天的天气,只要把连续两天的天气作为一个状态即可,即会有
场景二: 病情(艾滋病)预测
艾滋病毒感染者病情发展有这样几个阶段(状态):
- 无临床症状(HIV asymptomatic)
- 有临床病状(HIV symptomatic)
- 获得性免疫缺陷综合征(AIDS)
- 死亡(death)
某地区艾滋病感染者一年后由一个状态转移到另一个状态的概率如上图所示 [4]. 如果目前该地区感染者处于各状态的比例如下:
- 85% asymptomatic
- 10% symptomatic
- 5% AIDS
- 0% death
那么一年后,该地区感染者处于各状态的比例如何?
如果仅仅计算某个感染者的概率,显然病情发展与该患者获得的治疗有着密切关系. 但如果研究某个地区的艾滋病患者,那么在无外界因素干预如国家加大艾滋病治疗投入或艾滋病特效药研发成功等,马尔可夫链模型是个不错的预测模型.
场景三: 分子扩散模型
如果将两个充满不同气体的容器相互联通当中仅用薄膜分隔(允许分子在两容器间穿梭),那么经过一段时间后,两个容器中的混合气体成分如何?
1907年物理学家 _Tatiana_ 和 _Paul Ehrenfest_ 为了解释热力学第二定律而提出了一个分子扩散模型 [5]. 下面我们用尽可能简单的语言来描述下这个模型.
我们把两个容器编号为A和B,两个容器内分子总数设为
举个具体的例子,假设总共有
如果用
当然还有进阶版 _Bernoulli-Laplace_ 模型,考虑两种不同的分子,每次在两个容器中各等可能地取一个分子进行一次交换. 事实上,我在网上还发现不少用这个模型来研究洗牌的.
场景四: 体育比赛
每局网球比赛中,选手必须得分4次且比对手多两次得分才能获胜. 当两名选手得分一样且大于等于三次时,称作“平(dauce)”. 假设选手A和选手B在某局比赛达到了“平”,此时选手A再得分一次称作“A占先(advantage A)”,反之选手B再得分一次称作“B占先(advantage B)”. 假设比赛进行到了“A占先”,此时选手A再得分一次即获胜,反之选手B再得分一次则返回“平” [6].
也就是当比赛进行到“平”后,有这样五个状态:
- 平
- A占先
- B占先
- A胜
- B胜
假设比赛进行到平后,每个球选手A得分的概率都为
这也是一道很常见的马尔可夫链教材里的习题,其他的一些运动项目如排球、乒乓也有类似的计分规则. 我们关心的是,在这个赛制下得分率
结语
关于马尔科夫链能找到的公开课、课件、论文数不胜数,本文当然无法穷尽所有的应用场景,事实上马尔可夫链在目前相当热门的机器学习领域(如自然语言处理、语音手写识别等)也有着广泛的应用,因为往往涉及到升级版“隐马尔可夫链”就没有收录. 有兴趣的读者可以自行搜索了解更多马尔科夫链的应用.
- 这是适用马尔可夫链模型的重要条件. ⬅
- 这里的数据纯属瞎掰,感兴趣的读者可以免费使用中国气象数据网的API获得相关数据. 中国气象数据网API ⬅
- 这里的概率指的是统计得出频率,只要样本足够多在实际应用中,我们都称作概率. ⬅
- 图片及数据取自Paul Harper教授发布在Youtube上的公开课. ⬅
- 埃伦费斯特模型,详见维基百科 ⬅
- 网球比赛计分规则,详见维基百科 ⬅