行为科学统计第七版考研复习(2)
本站小编 免费考研网/2020-01-16
等比量表中数字的比例可以反映量上的比例。
★关于判断是等距还是等比(自推):
1 等距量表的零点没有意义,等比量表的零点则代表了一个“没有测量”的变量(我把测量视为名词,大约代表“值”)。所以等距的零点才能随便换,且只为衡量测量值的差值。
——SAT就是一个等距量表,因为零值是为衡量测量值之差而存在。
——每个人的感冒次数则是等比量表,因为零值有意义且不能变动。
因此:2 等距量表的重点在于测量之间的差值,等比量表则是比例。
例如SAT测试就是等距量表,重点在于测量间的差值而非比例。
(并不排除等比量表中测量间差值的意义,但由于等比本也是等距,因此舍弃比例并无意义。)
1.5 统计符号
分数 指研究中对因变量的观察后得到的每个被试的值。
——原始分数 指研究中最初得到的、没有改变过的一组数据。
特定变量的值用X表示。
(★注意:X又叫一个量表,可视为是一类数据之意。在p48图2.14上三行有明确的表达)
第二章 频数分布
2.1概述
☆原始数据通常不会显示任何明显的模式。研究者依靠描述性统计来总结和组织他们的结果,使得当真的存在某些模式时,它们更易被发现。
描述性统计的任务:简化结构并整理组织数据。
☆最常用过程是将数据放入一个频数分布。
频数分布 是一种组织好的关于位于测量量表每个类别上的个体数目的数据表。
★频数分布显示了个体得分在测量量表上的分布情况
——频数分布可以是表或图,但均有如下两个相同因素:
1 组成最初测量量表的类别
2 频数的记录(每个类别中的个体数目)
2.2频数分布表
频数分布表的特点:
1 表中的第一列,列出了所有可能的值,即使此类别的频数为0。
★对于顺序、等距、等比量表,类别被按从高到低的顺序排列。
对于称名量表,类别可以按任意顺序排列。
2 第二列记录每个数值的频数。
3 第一列的值(如X)指的是测量量表,并非真实数据。比如X=5但此类别的个体并不存在。
4 频数可以用于求出分布中的数据个数。将频数相加可以得到个体个数的总和。
☆除了频数分布的两个基本列之外,还有其他描述数据分布的测量。
最常用的是比例和百分率。
比例 用p表示。p=f/N。
百分率 %=p(100)=f/N(100)
由于比例p描述了频数(f)和数据数目(N)的关系,故比例又可称为相对频数。
——比例通常表示为小数。
☆当一个数据组涵盖范围过大时,为了不必列出所有数据,可以使用如下办法:
分组频数分布表 将数据分成区间组,然后将区间列在表中,用区间代替每个数据。
★这里的组(即区间),叫组距。
它有四个规则:
1)应该具有大约10个组距。只是大约。
2)每个区间的宽度应为相对简单的数字。特别的,5和10可以简化计算。
3)每个组距的最小数值应为宽度的倍数。如以10为区间宽度,则这些区间应从20,30等开始。
4)所有区间应有相同宽度。它们应当无间断无重复涵盖 所有数值,使任意特定数值恰好只属于一个区间。
——在分组频率分布表中,频数是对组距的描述,即这个组距的频数为f=xxx。
并且,当分数被放入一个分组表后,会失去关于特定分数值的信息。通常组距越宽失去的信息越多。
☆当测量一个连续变量时,得到的测量对应的是线上的区间,而不是单个的点。
例如一个连续变量的X=8的频数f=3,其实是代表有3个数在7.5~8.5之间。
同样的,频数分布表中也存在实限概念。
表面界限 比如40~49的组距中,40和49为区间的表面界限。
——但是这个区间的实限则是40的下实限和49的上实限,
即:这个组距的实限是39.5和49.5。
并且组距的两实限间的距离,就是区间的宽度。
每两个组距会在实限处交汇,因此量表中没有中断。
★注意,回答“该组距的值域”时,需要回答出表面界限和实限。
★★分布表中最后一个区间是最小的区间。因为“在顺序、等距、等比量表中,类别被按顺序排列通常是由高到低”。
2.3频数分布图
☆对于用称名量表或顺序量表测量的数据,用柱形图。
☆对于用等距或等比量表测量的数据,有两种图。
1 直方图
首先将数字(测量类别)沿X轴列出,然后画出位于每个X值上的一个矩形,使得:
a. 矩形的高度对应每个类别的频数
b. 矩形的宽度为每个类别的实限。
另外,修正的直方图中,频数用方块代替,故不再需要显示频数的Y轴。
★总结(自推):
注意p39图2.2的组距画法。
第一个矩形宽架设在0.5至1.5之间,★把刻度标在中点上。即恰好代表了组距1。
对于图2.3,75~78组和81~84组之间没有空隙,是为了看齐分组频数分布表的“无缝”。
它说明78~81组之间没有数据——这是组距的宽度决定的现象。
2 折线图
首先将数字(测量类别)沿着X轴列出,然后
1)每个坐标的中心上方有一个点,它的垂直位置对应这一类别的频数。
2)点和点之间的连续线段将这一系列点连在一起
3)最后,在分数全距(看坐标系内,别看轴)的两端各画一条直线与X轴相交(其实是零点和X最大值那点,看图)
对于一个分组分布,可以将每个点直接画在组距的中点处(中点为区间两实限的平均值)。
☆对于总体分布的频数分布图
由于其个体数过大,这种图有两个特点:
1 相对频数
在图中(可视为柱形图)只有分组(X轴)和相对频数(Y轴),没有显示绝对数目。
2 平滑曲线
当一个总体由 等比量表 的数字分数构成时,常用平滑曲线代替直方图或折线图的阶梯或锯齿状。
平滑曲线并非是将一系列点(真实频数)连在一起,而是展示从一个分数到另一个分数的相对变化。
2.4频数分布的形状
☆完整描述任意分布,★有三种特性:形状、集中趋势和变异性
集中趋势 指分布中心的位置
变异性 指数据是分散在广大区域还是集中在一起
★形状 理论上分布的形状被定义为一个方程。
而大部分分布的形状是:
1 对称分布
可以通过中心画一条垂直线使分布的一侧为另一侧的镜像
2 偏态分布
分数倾向于堆积在量表的一端并向另一端逐渐变细
另:尾 指分数逐渐向分布一段变细的部位
a)正偏态分布:尾在右侧的偏态分布(即尾指向X轴正方向)
b)负偏态分布:尾在左侧的偏态分布(即尾指向X轴负方向)
2.5 百分位数、百分等级和内插法
☆频数分布除了描述整组数据,也可以用来描述整组数据中的个体位置。
原始分数 个体分数或X值。
——原始分数本身不能提供个体位置。
其中一个变化是 将原始分数转化为百分位数。
★注意:可见,百分位数就是原始分数的一个变化。
1 一个特定分数的等级(百分等级)
指在分布中低于或等于该特定分数的个体的百分率。——等级一定是一个百分率。
——例如,全班有60%的人分数在43以下,那么分数X=43具有百分等级60%。
2 百分位数
当一个分数被它的百分等级确定后,这个分数就叫百分位数。——它依然是一个原始分数。
如上例,X=43可以被称为第60个百分位数。
☆在频数分布表中,为了确定百分位数或百分等级:
累积频数(cf) 计算量表中位于或低于每个类别的个体数目。
——因为它们表示了沿着量表向上时积累的个体个数。
(累积频数显示了处于或低于每个分数的个体个数。)
累积百分率(c%) 将累积频数转化成百分率
——因为它们显示了沿着量表向上时的累积的个体百分率。
★注意,频数分布表中的X值仍是区间,并非一个个点。
所以,当X=2的cf=2,c%=10%时,指的是:
在达到区间X=2的上限前积累了2个,且占10%。
内插法
具体步骤略
★注意:内插法的基本假定是,一个区间从一端到另一端的变化是正常的线性变化。
2.6茎叶图
略
第三章 集中趋势
★集中趋势 是一个统计测量,它确定了 能够代表分布中心的 一个数值。
——集中趋势的目的 找到最典型或最能代表整个组 的单个数值
(即 确认每一个分布的“中心”或“最具代表性的数值”。)
(集中趋势描述了一个大型总体的典型特征,使得大量数据更容易被理解。)
三种测量集中趋势的方法:
1 平均数
也叫算数平均数,是将分布中的所有数据相加并'除以数据的个数得到的。
一个总体的平均数用μ表示,一个样本的平均数用M表示。
(通常,使用希腊字母代表总体的特性,用英文字母代表一个样本的特性。)
☆我们经常需要将两组数据组合,并找出合并组的整体平均数。
整体平均数并非原先两个样本的平均数中心。由于两个样本大小不同,其中一个对整体组做出了更大贡献。因此,决定整体平均数时占了更大权数。
因此,整体平均数也叫加权平均数。
加权平均数 等于 数据总和/数据个数。
2 中数
中数 是恰好将一个分布一分为二的数值。
——这个值也相当于第50个百分位数
(中数不存在特殊符号和记号,对于样本和总体来说,中数的定义和计算相同。)
(在图形中,中数恰好将图形的面积分成两部分。)
3 众数
众数 是具有最大频率的 分数或类别
——众数可以用于确认任何测量量表的典型值或平均值,包括称名量表。
——众数是一个分数或一个类别。但绝不是频数。
——一个分布只有一个平均数,一个中数。但它可能有一个众数、多个众数,或没有众数。
具有两个众数的分布被称为双峰分布,具有多于两个众数的分布为多峰分布。
有时,具有数个等高点的分布叫无众数。
(通常双峰分布说明在同一个总体或样本里,存在两个不同的、有区别的个体组。)
——通常,众数是具有绝对最高频数的数值。但有时也表示具有相对高频数的值。
此时这个分布有两个不同的峰值,每一个值都是这个分布的众数。
☆较高的叫主要众数,较矮的叫次要众数。
☆选择一种最适合的集中趋势测量
1 平均数
优点:用到了分布中的每个数值,通常具有很好的代表性。
相关话题/统计
暨南大学经济学院应用统计复试经验贴
今年进复试的有38人,录取24人。面试分为三组,两组是上午,另外一组是下午,每个人面试时间大概是20分钟。我所在的组的面试流程大致如下: 1、 中文自我介绍:进去以后桌上会贴着一张纸,上面要求你先进行自我介绍、本科是否发过什么论文、再介绍一下你最近看过的与统计相关的书。 2、 英文自我介绍:中文介绍完之后,坐 ...考研复试经验 本站小编 免费考研网 2020-01-152020东北大学432统计学真题完整回忆含解析
...专业课考研资料 本站小编 免费考研网 2020-01-14对外经济贸易大学432统计学复试经验分享
初试结束一段时间啦,大家考完都干什么了呢~ 不管结果如何,能坚持下来已经很棒啦,但是别忘了考研路途还没有结束,还有复试这一关呀! 先介绍一下我自己的情况,我本科专业是经济统计学,初试分数不是很高,379,一度以为分数线是380。。出了分也是郁闷了很久才打起精神来准备复试,最后加上复试成绩名次前进了十名,所以 ...考研复试经验 本站小编 免费考研网 2020-01-14统计学贾俊平考研知识点总结
第一章导论 一、比较描述统计和推断统计: 数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。 (1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显 ...专业课考研资料 本站小编 免费考研网 2020-01-132019深圳大学经院应用统计真题回忆
作者: 大禾小鱼 时间: 2019-12-23 19:21 标题: 2019深大经院应用统计真题回忆 为感谢上一年在此看到有师姐发出的回忆真题,继续延续相互分享的优良传统,在此发出本人记得的回忆真题 简答题: 一,为什么计算离散系数 二,中心极限定理(大量观察数据的依据) 三,两类错误 四,最小二乘法估计的优良性质 计算: ...专业课考研资料 本站小编 免费考研网 2020-01-122020清华大学432应用统计真题解答
作者: 路小佳的花生米 时间: 2019-12-23 20:58 标题: 432应用统计真题解答 求助同学之后写的,今年没怎么准备来试试水, 明年加油╰_╯ 最后一题最后一问不确定,解答仅供参考交流 作者: 干锅菜花 时间: 2019-12-24 00:18 第一题第二问不对,应该分0-1、1-2、2-3三个区间,图上这个分布函数都能 ...专业课考研资料 本站小编 免费考研网 2020-01-122020中国人民大学统计学805真题回顾
专业课考研资料 本站小编 免费考研网 2020-01-122020清华大学应用统计432回忆版考研试题
专业课考研资料 本站小编 免费考研网 2020-01-12江西财经大学2020年统计学432真题回忆版
简答题(10分一个,共40分) 1.抽样推断 2.离中趋势(离散程度)的统计指标 3.中心极限定理 4.环比发展速度和定基发展速度 计算题(共70分) 1.平均数,标准差,离散系数(10分) 2.回归方程(10分) 3.指数(20分) 4.假设检验(15分) 5.参数估计(15分) 论述题(20分一个,一共40分) 1.统计误差 2.综合指 ...专业课考研资料 本站小编 免费考研网 2020-01-082020年北京理工大学应用统计回忆版考研真题
作者: 七分好女孩 时间: 2020-1-2 15:13 标题: 2020年北京理工大学应用统计回忆版 考完第一天,和室友嗨了一天!昨天的失落的情绪慢慢淡去,人毕竟要向前看。 昨天铃响的那一刹那,专业课结束了,我意识到自己完了,眼泪在眼眶打转,庆幸的是我忍住了。当时只有一个想法,死就死彻底吧,回到宿舍坐在地上,看了下 ...专业课考研资料 本站小编 考研帮 2020-01-0419暨南大学经院应用统计的复试经验
作者: Jackie199619 时间: 2019-12-30 12:40 标题: 19暨大经院应用统计的复试经验 要考上暨大经院的应统专业,初试的500分和复试的200分是同样比重的,也就是说初试高出2.5分,复试只用1分就能追回来了,所以复试可能更需要比初试精心准备。 说说复试的经验吧,复试包括面试和笔试 面试与去年18年相比,发生了比较大 ...专业课考研经验 本站小编 免费考研网 2020-01-022011北京航空航天大学考博2011概率论与数理统计真题
考博 本站小编 免费考研网 2020-01-012020年西南财经大学应用统计025200真题回忆
作者: Puppet丶 时间: 2019-12-25 15:25 标题: 2020年西南财经大学应用统计025200真题回忆 一、因素分析+时点序列平均 二、1. 等比例抽样,平均值的区间估计,总的区间估计 2. 重复抽样,比例的最小抽样数目(比例给了经验值和标准差) 三、组中值,判断分布形状(平均值,中位数,众数) 四、多重线性回归(2元) ...专业课考研资料 本站小编 免费考研网 2020-01-012020华中农业大学432统计学真题回忆
作者: RachelZhong224 时间: 2019-12-25 15:34 标题: 2020华中农业大学432真题回忆 一、选择题(50分) 共25题 知识点较历年重复度较高,比较简单,主要有条件概率,区间估计,假设检验,切比雪夫不等式,卡方分布与指数分布的关系,分布性质等。 二、简答题(30分) 共6题 1、中心极限定理与大数定律的关系 2、总 ...专业课考研资料 本站小编 免费考研网 2020-01-012020年暨南大学432应用统计题目回忆版
作者: 喜吖 时间: 2019-12-25 15:42 标题: 2020年暨南大学432题目回忆版 一. 1.什么是统计整理,它分为哪几个步骤进行110分 2.相关分析和回归分析分为哪些步骤10分 3.(1)问卷星调查问卷与传统调查相比有哪些优缺点4分 (2)会有哪些误差,具体说明误差的危害6分 二.2000名学生,不重复抽样,抽了40个人,每个月话费 ...专业课考研资料 本站小编 免费考研网 2020-01-01