1)对三个不同类型的学校进行对体育锻炼计划的调查,每个学校调查了40个人。经过统计检验后,得出F(2,117)=?? P<.05。你如何向一个没有学过统计的人解释这个结果?并计算size effect并讨论之。
请问 size effect对应的汉语是什么?
2)一个地区的人们原来对足球比赛支持或者不支持。在看过一场足球比赛之后,有些人发生了变化。如下图所示:
支持 不支持
看比赛前 10 30
看比赛后 25 15
看完比赛后人们的态度有没有发生变化?用适当的统计方法检验。
应该是用卡方检验,是吧?
3)一个有着错误想法的博士研究生认为他的实验结果如果显著就会获得更多的发表机会。他想用自己制作的量表来区分正常人和有过犯罪记录的人。他现在手中有一份50人的样本,均值为38分。他还可以获得为数为100的有过犯罪记录的大学生的样本,该样本的总体平均值为35;或者为数为25人的有过犯罪记录的高中生,该样本的总体均值为30。这个博士研究生应该采用哪一个样本?(光有结论,没有计算不得分)
这题我有点困惑,需要用到方差同质性检验吗?
三道统计题解答:
1. 对三个不同类型的学校进行对体育锻炼计划的调查,每个学校调查了40个人。经过统计检验后,得出F(2,117)=?? P<.05。你如何向一个没有学过统计的人解释这个结果?并计算size effect并讨论之。
请问 size effect对应的汉语是什么?
我认为应该是effect size,而不是size effect。中文翻译是“统计效应大小”
方差分析的effect size = sqrt(F/n)F统计值即F(2,117)=??的值,n为样本量的大小
看计算出的effect size有多大而决定如何下结论(0.10 小的效应,0.25中等效应,0.40高的效应)
使用effect size的必要性在于:有时候统计检验的显著性差异是由于样本量过小造成的,当使用大的样本量时,可能就不显著了,所以统计显著性检验之后可,要看看effect size有多大。如果effect size很小,即使显著性检验达到了统计上的显著性差异,仍然要对这个显著性差异的结论持谨慎的态度,即要结合effect size对f值的结果进行解释。向没学过统计的人解释,就是不使用统计术语,将最后的结果阐述一遍。
2. 一个地区的人们原来对足球比赛支持或者不支持。在看过一场足球比赛之后,有些人发生了变化。如下图所示:
支持 不支持
看比赛前 10 30
看比赛后 25 15
看完比赛后人们的态度有没有发生变化?用适当的统计方法检验。
应该是用卡方检验,是吧?
解:Ho:看完比赛后人们的态度没有发生变化
df=(R-1)(C-1)= (2-1)(2-1)=1, α=.05, х2的临界值为(查表得临界值)
fe=(row total)*(column total)/ N
支持 不支持
看比赛前 10 (fe= 17。5) 30(fe=22。5)
看比赛后 25 (fe=17。5) 15(fe=22。5)
χ 2= ∑[(f0-f e)2/ f e]
=(10-17.5)2/17.5+(25-17.5)2/17.5+(30-22.5)2/22.5+(15-22.5)2/22.5
比较上式得数和х2的临界值,决定是否拒绝Ho
3.一个有着错误想法的博士研究生认为他的实验结果如果显著就会获得更多的发表机会。他想用自己制作的量表来区分正常人和有过犯罪记录的人。他现在手中有一份50人的样本,均值为38分。他还可以获得为数为100的有过犯罪记录的大学生的样本,该样本的总体平均值为35;或者为数为25人的有过犯罪记录的高中生,该样本的总体均值为30。这个博士研究生应该采用哪一个样本?(光有结论,没有计算不得分)这题我有点困惑,需要用到方差同质性检验吗?
解:使用独立指标t检验,之前理应进行方差同质性检验。(F-max= S22/ S12),但由于本题三个样本的容量都比较大,基本可以认为题中三个总体方差同质。况且题中没有已知各自的s大小,也不能比较三个总体方差是否质。则,假设三个总体的方差都已s表示。
第1步:陈述假设;确定显著性水平
H0 :μ1=μ2 H1 :μ1 ≠ μ2 α=0.05
第2步 确定检验是双尾还是单尾(无方向的假设)双尾检验
第3步:确定检验的自由度
df:=n1 + n2- 2 即148或73
第4步:查表求临界t分数
α=0.05,双尾检验,tcrit = ??? 由于样本量很大,使用犯罪大学生或使用犯罪高中生时,tcrit基本上差不多的。
第5步:计算样本的实际t分数
(关键:估计平均数差异分布的标准误)
计算各样本和方SS的和样本均值:
X1 = 38 X2=35 或30 SS1= SS2=ss
计算联合方差:sp2= SS1 + SS2 =2ss/148或2ss/73
df1+df2
计算估计标准误 sX1-X2 = sqrt(sp2/n1 + sp2/n2)
=sqrt{2ss/148(1/50+1/100)}或sqrt{2ss/73(1/50+1/25)}
计算实际t分数 tobs = {(X1 – X2)-(μ1 - μ2)} /sX1-X2
=3/ sqrt{2ss/148(1/50+1/100)}或8/ sqrt{2ss/73(1/50+1/25)}
=149/sqrtss或197/sqrtss
由于tcrit基本差不多,则使用犯罪高中生时比较容易得到显著性差异的结果,故该博士生如果认为他的实验结果如果显著就会获得更多的发表机会,就应该选择犯罪高中生的样本。
实际上,如果不要求计算步骤的话,画个图就可以看得出来的。
根据标准误和平均值即可得到三个样本并排排列的图,从直观上可看出,犯罪高中生和已有样本曲线重叠的可能性更小,故两个样本更可能得到显著性差异的结果。