行为科学统计第七版考研复习(3)

本站小编 免费考研网/2020-01-16



与最常见的变异性测量有紧密联系(如平均数和方差等)

缺点:极易受极端值影响而位移,而不能较好代表整个分布。

2 中数

1)极端数值和偏态分布

中枢不易受极端值影响。——即使极端值再变大,中数也不会因此改变。

2)未确定数值

比如有一个被试从未完成实验,只好1小时后停止实验,其时间则无法确定。

★注意:对于未确定数值

第一,不能不要这个数值。因为使用样本的目的是把握总体,这个数据告诉我们有一部分总体不能解决问题。

第二,不能记录为60分钟。要记录的是完成所需时间,个体从未完成任务,则无法记录。

——综上所述,存在未确定数值则无法计算平均值。

我们选择中数。

3)尾端开放式分布

指 一个分布的类别 没有上限和下限。例如孩子的个数量表中,存在类别“5或更多”。

这样就无法计算ΣX,更无法计算平均数。

4)顺序量表

★注意:由于平均数是 根据距离 来定义集中趋势,而中数是用方向定义的——一半分数大于中数,一半小于中数——

因此不能用平均数,而用中数来报告顺序量表的平均数。

3 众数

1)称名量表

因为称名量表不能测量数量,因此不能计算平均值和中数。

2)离散变量

3)描述形状

在一个频数分布图中,众数表示了高峰的位置。

☆集中趋势和分布形状

1 对称分布

一个对称的单峰分布:平均数、中数、众数重合于中点。

一个对称的双峰分布:平均数和中数处于中点,众数位于两侧。

2 偏态分布

正偏态分布:从左到右为 众数,中数,平均数

负偏态分布:从左到右为 平均数,中数,众数

第四章 变异性

4.1

变异性: 提供了 对一个分布中的数据 分散程度或聚集程度 的数量测量。

测量变异性的目的:获得分数在分布中的离散型的客观测量

一个好的变异性的目的:

1 描述了分布。(表示了数据是否聚集在一起 或分布在较大区域内。)

通常变异性是根据距离定义的。

2 测量了单个或一组数据能否很好地代表整个分布。

3 提供了在使用一个样本代表总体时 预期误差值的信息

4.2 全距和四分位距

全距  Xmax的上实限(URL)和Xmin的下实限(LRL)的差值。

四分位距  被分布的中间50%所覆盖的距离。等于Q3-Q1。

——其中Q1Q3为第一四分位数和第三四分位数,指分布最低的25%和分布最高的25%与其余值分隔开的界限(是一个界限)。

——一般会把它转换为半四分位距,它测量了从分布中心到50%的分布边界的距离。

由于它始于分布中央的50%,因此不易受极端值影响。

☆但它不能考虑单个数据间的真实距离,不能给出数据如何分散或聚集的全景。

4.3总体的标准差和方差

标准差 离差的平方和除以总体大小(或样本的自由度)的算数平方根。

★标准差的目的:对分数到平均数的标准距离的测量。

☆标准差推导过程里的中间量

1)离差

是每个数与平均数之间的距离。并且有正负。

★数据的离差总和为零。

——这也是标准差计算需要将离差平方的原因

——引入离差的平方,使得对变异性的测量基于距离的平方之上。

结果:给每个数据增减一个常量,标准差不变。

给每个数据增减一个倍数,标准差依同样倍数增减。

2)方差

是离差平方和除以总体大小(或样本自由度)的商。

☆对标准差的解析

1)估计

对于一个分布,标准差的范围在(a,b)区间。其中a,b分别为距平均数最近和最远的数据与平均数的距离。大约在(a+b)/2处。

2)图示

标准差线大约为从平均数到最极端值的一半

3)计算公式

标准差和方差在概念上,对于总体和样本完全相同。

★对于总体:(符号有SS平方和,μ平均数,N总体大小,σ标准差和σ2方差)

定义公式 SS=∑.  (X-μ)(X-μ)

计算公式 SS=∑(X方)-(∑X)方/N

方差和标准差略。

★对于样本:(符号有SS平方和,M平均数,n总体大小,s标准差和s2方差)

SS与总体相同,方差和标准差是除以n-1。

——为什么除以n-1:

存在如下事实:样本的变化总是小于总体的变化。(对此的感性认识可通过对总体选择样本很难达到总体的变异性程度来感受)

因此存在一个样本方差小于总体方差的偏误。

为调整此偏误,使用了n-1来使样本方差变大。

——也因此,样本方差s2又叫 估计的总体方差,样本标准差s又叫 估计的总体标准差。

4)标准差与描述性统计

(已重复)标准差的目的是对分数到平均数的标准距离的测量。

此外,它描述了分布中的数据如何变化或如何散布。

——通过测量到平均数的距离描述变异性。

除描述整个分布外,在解释单个数据方面:

——通过单个数据和平均数的距离,与标准差之间的差值大小,来确定该值是否极端。

☆样本变异性和自由度

自由度用df表示,它决定样本中独立的和可以自由改变的数值的个数。

样本的自由度是n-1。

不明白为什么“样本平均数限制了样本变异性”测量样本变异性时要先确定平均数,从而最终决定了第n个数不自由。

☆关于有偏和无偏统计量

无偏统计量 指从很多不同样本中得到样本统计量的平均数 等于相应的总体参数值,则此样本统计量是无偏的。

有偏统计量 一个样本统计量的平均数总是低估或高估相应的总体参数。

☆关于方差和推论统计

在 一组样本数据内 存在的方差通常被归类为误差方差。

——它用于指出样本方差代表了 在数值之间存在不明原因和不受控制的差异。

☆影响变异性的因素

1 极端值

全距由分布的两个极端值决定(不是两端,在图里当然是两端,在数字列举则按原话)。

标准差和方差则是被极端值影响。

——因为它们的测量基础为离差的平方和,极端值会造成不成比例的影响。

四分位距受极端值的影响最小。

2 样本大小

全距与样本大小直接相关。

标准差、方差、四分位距则相对不受样本大小影响。

——研究者不应该通过操纵样本大小影响变异性。

3 取样的稳定性

对同一个总体,当使用s和s方测量变异性时,样本倾向于有相似的变异性。

标准差和方差被称为在抽取样本时是稳定的。

4 开放性分布

指分布没有任何特定最大值或最小值的界限。

此时不能计算全距、标准差和方差。

只能计算四分位距。


相关话题/统计

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19
  • 暨南大学经济学院应用统计复试经验贴
    今年进复试的有38人,录取24人。面试分为三组,两组是上午,另外一组是下午,每个人面试时间大概是20分钟。我所在的组的面试流程大致如下: 1、 中文自我介绍:进去以后桌上会贴着一张纸,上面要求你先进行自我介绍、本科是否发过什么论文、再介绍一下你最近看过的与统计相关的书。 2、 英文自我介绍:中文介绍完之后,坐 ...
    本站小编 免费考研网 2020-01-15
  • 2020东北大学432统计学真题完整回忆含解析
    2020东北大学432统计学真题完整回忆含解析
    ...
    本站小编 免费考研网 2020-01-14
  • 对外经济贸易大学432统计学复试经验分享
    初试结束一段时间啦,大家考完都干什么了呢~ 不管结果如何,能坚持下来已经很棒啦,但是别忘了考研路途还没有结束,还有复试这一关呀! 先介绍一下我自己的情况,我本科专业是经济统计学,初试分数不是很高,379,一度以为分数线是380。。出了分也是郁闷了很久才打起精神来准备复试,最后加上复试成绩名次前进了十名,所以 ...
    本站小编 免费考研网 2020-01-14
  • 统计学贾俊平考研知识点总结
    第一章导论 一、比较描述统计和推断统计: 数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。 (1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显 ...
    本站小编 免费考研网 2020-01-13
  • 2019深圳大学经院应用统计真题回忆
    作者: 大禾小鱼 时间: 2019-12-23 19:21 标题: 2019深大经院应用统计真题回忆 为感谢上一年在此看到有师姐发出的回忆真题,继续延续相互分享的优良传统,在此发出本人记得的回忆真题 简答题: 一,为什么计算离散系数 二,中心极限定理(大量观察数据的依据) 三,两类错误 四,最小二乘法估计的优良性质 计算: ...
    本站小编 免费考研网 2020-01-12
  • 2020清华大学432应用统计真题解答
    2020清华大学432应用统计真题解答
    作者: 路小佳的花生米 时间: 2019-12-23 20:58 标题: 432应用统计真题解答 求助同学之后写的,今年没怎么准备来试试水, 明年加油╰_╯ 最后一题最后一问不确定,解答仅供参考交流 作者: 干锅菜花 时间: 2019-12-24 00:18 第一题第二问不对,应该分0-1、1-2、2-3三个区间,图上这个分布函数都能 ...
    本站小编 免费考研网 2020-01-12
  • 2020中国人民大学统计学805真题回顾
    本站小编 免费考研网 2020-01-12
  • 2020清华大学应用统计432回忆版考研试题
    本站小编 免费考研网 2020-01-12
  • 江西财经大学2020年统计学432真题回忆版
    简答题(10分一个,共40分) 1.抽样推断 2.离中趋势(离散程度)的统计指标 3.中心极限定理 4.环比发展速度和定基发展速度 计算题(共70分) 1.平均数,标准差,离散系数(10分) 2.回归方程(10分) 3.指数(20分) 4.假设检验(15分) 5.参数估计(15分) 论述题(20分一个,一共40分) 1.统计误差 2.综合指 ...
    本站小编 免费考研网 2020-01-08
  • 2020年北京理工大学应用统计回忆版考研真题
    作者: 七分好女孩 时间: 2020-1-2 15:13 标题: 2020年北京理工大学应用统计回忆版 考完第一天,和室友嗨了一天!昨天的失落的情绪慢慢淡去,人毕竟要向前看。 昨天铃响的那一刹那,专业课结束了,我意识到自己完了,眼泪在眼眶打转,庆幸的是我忍住了。当时只有一个想法,死就死彻底吧,回到宿舍坐在地上,看了下 ...
    本站小编 考研帮 2020-01-04
  • 19暨南大学经院应用统计的复试经验
    作者: Jackie199619 时间: 2019-12-30 12:40 标题: 19暨大经院应用统计的复试经验 要考上暨大经院的应统专业,初试的500分和复试的200分是同样比重的,也就是说初试高出2.5分,复试只用1分就能追回来了,所以复试可能更需要比初试精心准备。 说说复试的经验吧,复试包括面试和笔试 面试与去年18年相比,发生了比较大 ...
    本站小编 免费考研网 2020-01-02
  • 2011北京航空航天大学考博2011概率论与数理统计真题
    本站小编 免费考研网 2020-01-01
  • 2020年西南财经大学应用统计025200真题回忆
    作者: Puppet丶 时间: 2019-12-25 15:25 标题: 2020年西南财经大学应用统计025200真题回忆 一、因素分析+时点序列平均 二、1. 等比例抽样,平均值的区间估计,总的区间估计 2. 重复抽样,比例的最小抽样数目(比例给了经验值和标准差) 三、组中值,判断分布形状(平均值,中位数,众数) 四、多重线性回归(2元) ...
    本站小编 免费考研网 2020-01-01
  • 2020华中农业大学432统计学真题回忆
    作者: RachelZhong224 时间: 2019-12-25 15:34 标题: 2020华中农业大学432真题回忆 一、选择题(50分) 共25题 知识点较历年重复度较高,比较简单,主要有条件概率,区间估计,假设检验,切比雪夫不等式,卡方分布与指数分布的关系,分布性质等。 二、简答题(30分) 共6题 1、中心极限定理与大数定律的关系 2、总 ...
    本站小编 免费考研网 2020-01-01
  • 2020年暨南大学432应用统计题目回忆版
    作者: 喜吖 时间: 2019-12-25 15:42 标题: 2020年暨南大学432题目回忆版 一. 1.什么是统计整理,它分为哪几个步骤进行110分 2.相关分析和回归分析分为哪些步骤10分 3.(1)问卷星调查问卷与传统调查相比有哪些优缺点4分 (2)会有哪些误差,具体说明误差的危害6分 二.2000名学生,不重复抽样,抽了40个人,每个月话费 ...
    本站小编 免费考研网 2020-01-01