“在0-2节中有提到,“贝叶斯统计在某种程度上是不可靠的”。究其原因,是由于贝叶斯统计中所涉及的概率是“主观的”。”
“然而,所谓的“主观性”和“思想性”,才正是贝叶斯统计学的本质和它具有便利性的根本原因所在。”
“也就是说,虽然并不能断定这位顾客就是“来买东西的人”,但这一结果的可能性提高到了以前的两倍,这便是“贝叶斯更新”。”
“换言之,通过贝叶斯统计得到的概率并非客观的数值,而是依存于人的心理的主观数值。在从这个意义上讲,贝叶斯统计具备了一定的“思想”。也正是因此,注重客观性的科学界为贝叶斯统计打上了“假冒伪劣”的烙印,并导致它一度消亡。”
“贝叶斯推理可以总结为:通过观察行动(信息),将先验概率通过贝叶斯更新,转换为后验概率。”
“需要了解的重点是,理解“如果从客观的数据来考虑的话,反而会容易陷入误解之中”的问题。”
“这统计学中有一个专有名词,叫作“抛弃假设A”。”
“也就是说,可以主观设定先验概率,进行推算。”
“通过对于“大概”一词的解释,我们能够明显地看出标准统计学(内曼-皮尔逊统计学)与贝叶斯统计学之间的立场差异。”
“代表性的证明方法有“自然演绎”,它属于演绎系统之一。”
“(先验概率)→(条件概率)→(通过观察获取信息)→(后验概率)”
“在这种情况下,想要判断该夫妇究竟属于哪一个类别,是完全没有任何统计数据来支持的,因此依然采用上一讲中的“理由不充分原理”。”
“关于自然演绎的定义,可以参照拙作《数学推理改变世界》NHK出版,2012年)”
“用概率设定类别,设定其先验概率(因为无法获得数据,而采用了理由不充分原理将其设定为对等)。先验概率是“概率的概率”。”
“在标准统计学的推导中,“大概是B”这一结论,是基于“虽然可能出错,但还是确定结论为B”的考虑而确定的。”
“而在贝叶斯推理中,“大概是B”这一结论,是基于“可能为A,也可能为B,而B的可能性更大一些”的考虑而确定的。”
“像这样,可以解释为“人的内心描绘的数值”的概率称为“主观概率”。主观概率在学校教育中并不涉及,因此,很多人会认为主观概率是不可信的。但在统计学和经济学中,“主观概率”始终占有一席之地。(”
“逻辑性推理(自然演绎)是由逻辑学演绎法经过严密推导得出的结论。”
“使余下几种情况的概率数值,在保持比例关系的前提下,满足“相加之和为1”,恢复标准化条件。”
“理由在于,贝叶斯推理在某种意义上来讲是一种“宽松”的推断。所谓的“宽松”是指:设定不可思议的先验概率,并且其数值可以是主观性的。”
“至于为何概率会如此之低,原因在于,患癌症的可能性本来就极其微小,健康人群中所占的比例远高于患癌症的人,健康人被误诊为阳性的可能性也很大,这一部分数值不能忽视。”
“然而,贝叶斯推理的魅力正在于:即使没有事前的客观数据,也能进行推算。”
“简单来说,“极大似然原理”的含义就是:世界上正在事件,之所以发生,是因为它发生的概率大。”
“还有一个必须留意的问题是:贝叶斯推理之所以能在不考虑显著水平的情况下做出判定,是因为设定了先验概率这一“奇怪的”概念。”
“如果A帘后面藏有汽车的话,那么主持人打开B帘和C帘的概率各为1/2。”
“因此,在这种先验概率的基础上被推断出来的后验概率,通常有其任意性,而责任则归于在统计学者的判断。”
“显著水平α,通常用来表示“极少被观察到的现象”的概率。当然,可以把它设定其为一个很小的数值,通常会设定为5%(0.05)或1%(0.01)。”
“也就是说,贝叶斯推理不会直接认为“概率是×”,而是采取“相信概率应该是×”“总之,先设定概率为×吧”这样的态度。”
“求出“该壶为A壶”的后验概率和“该壶为B壶”后验概率,得出“应该是B壶”的结论。”
“以上过程可以粗略总结为,“只有A是正确的情况下,才会发生低概率α事件。如果实际观察到了的话,则判断A本来就是错误的,于是抛弃掉A;如果观察不到,因为没有抛弃A的理由,所以予以保留”。”
“检测假设在显著水平α概率下,有一定的错误风险。”
“如前所述,先验概率基本上是一种“主观的”概念。”
“用比喻性的说法来解释:假设检验的风险存在于结论之外,而贝叶斯推理的风险则存在于结论的后验概率本身之中。”
“假设检验的顺序第一步:提出想要验证的假设A。假设A又名“解消假设”。第二步:若假设A不成立,再提出一个假设B。假设B又名“对立假设”。第三步:若假设A成立,再设定一个只有在小概率α的情况下能观察到的现象X。第四步:确认是否观察到了现象X。第五步:若能观察到现象X的情况下,则判断解消假设A是错误的,此时便可以抛弃解消假设A,而选择对立假设B。第六步:若未能观察到现象X,则不能否决解消假设A,那么选择解消假设A即可。”
“通过上述具体事例,大家应该已经理解了“观察次数越多,推算结果就越接近实际”的观点。”
“先确定“发生的事情”,然后决定与之对应的数值分配,这被称为“概率模型”。”
“概率是指,用一个“大于0且小于1的数值”来对应“发生的事情”的数学概念。”
“原因在于,它是异于独立性而存在的。”
“这样便出现了“把通过信息①得出的后验概率设为先验概率,然后通过信息②,再求出后验概率”和“通过同时利用信息①和信息②求出的后验概率”是一致的奇妙结果。”
“序贯理性可以看作学习功能的一种。”
““通过同时利用两条信息求出的后验概率”和“把通过信息①得出的后验概率设为先验概率,然后通过信息②,再求出后验概率”是完全一致的,在贝叶斯推理中,该结论一般情况下都是能够成立的。这一特性在专业领域被称为“序贯理性”,如图表12-6所示。”
“总而言之,条件概率是指:把得到的消息再次设定为整体,并排除掉没有可能性的各个事件之后,重新计算出的比率。”
“换言之,用&来连接的类别和信息所构成的可能性的概率为:将“类别的先验概率”和“在【这个类别】的基础上,能够得到这条信息的条件概率”相乘的结果。”
“记号p(|)的含义是:间隔符号的右侧表示获得的信息。”
“条件概率是指,在获得信息之后,基本事件减少的情况下,赋予的比例关系。2.在获得“事件B”这一信息后,事件A的条件概率p(A|B)可定义为:p(A|B)=p(A和B的重叠部分)÷p(B)3.在贝叶斯推理中,使用条件概率公式②时有两种方法。4.第1种使用方法:求出类别&信息的概率。即,p(类别&信息)=p(类别)×p(信息|类别)5.第2种使用方法:求出后验概率。已知数据信息,通过上面的方法来计算p(类别&信息)的比例关系,并使之满足标准化条件。”
“基本事件是指,不能再进行分解的基本性事件。”
“&事件的概率法则p(类别&信息)=p(类别)×p(信息|类别)”
“事件是若干个基本事件的集合。”
“概率模型由基本事件、事件、概率构成。”
“根据上述两个变更,需要计算的概率p(E|F),即:获得“发生事件F”这一信息之后,E的条件概率,也就是:把F看做一个整体来考虑时,“E和F的重叠部分”占F的比例。”
“当获得事件B这一信息之后,事件A的条件概率p(A|B),可定义为:p(A|B)=p(A和B的重叠部分)÷p(B)”