ˆ)是多少呢?,要听他连续说多少次“我爱你”才能相信

cos2x 3
——怎样判断一枚硬币是不是公平的? 抛硬币是生活中最常被拿来举例子的Bernoulli(贝努力)试验。
这也是一个最简单的概率事件,只有两个选项,正面或者反面(假设不存在立着的情况)。
这个例子也可以推广到很多二分变量(binaryvariables)的取值概率问题。
支持或者反对,使用或者不用等等。
一枚硬币如果是公平的话,每次抛硬币得到正反面的机会各等于二分之
一。
现在我们假定说抛硬币得到正面的概率是p,得到反面的概率是q=(1-p)。
现在我们有一枚硬币,抛了100次,得到了55次正面。
那么,我们知道,在这100次里面,我们得到正面的概率是55/100=.55。
但我们都抛了100次了,知道了p=.55,又怎么样呢? 我们想知道的是,下次以及每次抛这个硬币,得到正面的概率p的估计值p-hat(pˆ)是多 少。
这么想的话,上面所说的p=.55是指我们抛了的100次我们知道的抛硬币得到正面的概率是.55,也就是我们的样本(sample)里的p=.55。
我们想知道的是通过我们的样本推测到总 体(population)的抛这枚硬币得正面的估计值p-hat(pˆ)是多少呢? 从样本统计量p推算总体估计值p-hat(pˆ)就要考虑置信区间(ConfidenceInterval)。
下面 这枚公式就能推算,从我们这个抛了100次的样本,估计抛这枚硬币得正面的概率是: ⎛⎜⎜p−Zα/2⎝ p(1n−p),p+Zα/2 p(1−p)⎞ n ⎟⎟⎠ (公式一) 这里的n就是我们抛的次数,也就是样本量(samplesize)。
这里的Zα/2是一个统计量,根据 不同的置信度(ConfidenceLevel,如90%,95%,99%等)有不同的固定的取值。
这个Zα/2是 另外一个故事了。
有兴趣的同学可以去维基百科看“ConfidenceInterval(置信区间)”这个词条/wiki/Confidence_interval。
当然了,这个取值还隐藏了另外一个关于正态分布的假设,那也是另一个故事了。
如果我们采用95%的置信度,对应的Zα/2就等于1.96。
我们这100次硬币来估算这枚硬币 被抛得正面的概率就是一个区间(.452,.648)。
也就是说,如果我们再抛100次硬币,我们有95%的机会得到正面的次数在45次到65次之间。
好吧好吧。
我承认我有些罗嗦了。
上面这些其实不是我想说的重点。
我想说的重点是,我们要连续抛多少次正面,在95%的置信度上,才有根据不否定硬币是不公平的(有点绕,嘿嘿)?下面就是一个假设检验的问题了。
假设检验的一般就得提出一个零假设(NullHypothesis,H0)和一个备择假设(AlternativeHypothesis,H1)。
我们这里的零假设就是硬币是公平的,也就是每次抛硬币得到正面的概率是1/2。
H0:p-hat=.5我们这里的备择假设就是硬币是不公平的,也就是每次抛硬币得到正面的概率不是1/2。
H1:p-hat<>.5我们说的每次抛多少次正面才够的意思是,我们已经确定了p1=
1,我们想知道的是n的最小值。
我们的问题可以等价地转换成我们估算的p-hat1和假定硬币公平的p-hat2之间的差,怎么就等于
0。
这里,H0可以等价地转换为p-hat1-p-hat2=
0。
H1可以等价地转换为p-hat1-p-hat2<>
0。
怎么算两个比例之差p1-p2的区间估计呢?我们要用到下面这个公式: (p1−p2)±Zα/2 p1(1−p1)+p2(1−p2) n1 n2 (公式二) 这里,我们的p1=1,p2=.5是知道的,在95%的置信度条件下Zα/2=1.96,代入公式
二,就可 以得到区间是: 1±0.98=02n1 我们的零假设也就转换成: 0必须落在1±0.98这个区间内。
也就是:2n1 1−0.98≤0≤1+0.98 2n1 2n1 通过计算,也就说是n<=3.92的时候,零假设才可能成立。
只要n>3.92的时候,我们就可 以拒绝零假设,然后在置信度95%的条件下,认为这枚倒霉的硬币是不公平的。
哈哈哈哈。
最后,再让我来说一下sowhat的问题。
如果我们假定你的男人跟你说“我爱你”和说“我不爱你”是等概率事件,机会各一半一半。
那么,如果你的男人连续四次跟你说“我爱你”。
你选择相信他这句话。
你应该有95%的把握。
哈哈。
可是,你会觉得你男人说“我爱你”和说“我不爱你”不是等概率事件。
好吧。
那你觉得概率多大你才满意?p=.999999999?
好 吧,你还说,置信度95%不够,要99%才差不多。
我告诉你,在99%的置信度条件下Zα/2=2.56。
这样的话,你能算出,你男人要连续说多少次“我爱你”,你才能相信他(说“我爱你”不是偶然的)了吧???

标签: #压缩文件 #市区 #航空公司 #代码 #压缩文件 #python #文件