符号说明:★重点 ☆引导语 —派生概念 ——或() 派生分析语句
第Ⅰ部分 简介与描述性统计
★首先提出了
1 平均数(集中趋势)
2 对变异性的测量(描述了数据是怎样分布在平均数附近的)
第一章 统计学入门
1.1统计
1.2总体与样本
☆统计的作用:
1 整理和总结信息,使研究者看出在研究中发生了什么,并和其他研究者交流结果。
2 统计帮助研究者回答了引出研究的普遍问题,它根据获得的结果来确定结论是什么。
☆研究开始于一个 关于总体的 普遍问题。
——为回答这个问题,研究者研究了一个样本
——将结果从样本推广到整个总体。
统计 是指,整理、总结并解释信息的一系列数学过程。
总体 在一个特定研究中所有感兴趣个体的集合。(是研究者希望研究的整个组。)
—参数 用来描述总体的特性。
通常是一个数字值。参数可以从单个测量中得到,或从对总体的一组测量中推导。
样本 从一个总体中选择出来的个体的集合,通常在研究中被期望代表总体。
—统计量 用来描述样本的特性。
通常是一个数字值。统计量可以从单个测量中得到,或从对样本的一组测量中推导出来。
(通常,每个总体参数都与一个样本统计量相对应。)
数据 从个体中得到的测量或观察(其中测量、观察均为名词。)
它通常被称为一个分数或原始分数。
☆统计分为两类:
1 描述性统计
是用于总结、组织并简化数据的统计过程。
它是一种技术,把原始数据组织总结成更易处理的形式。
(通常被组织成表或图,或用计算平均数的方法总结一组数据。)
2 推论性统计
是先研究样本,然后将结果推广到 样本来自的总体 的技术。
(通常使用样本统计量 作为推论总体参数的基础。)
★(它通常回答这个问题:到底是1还是2?其中1是样本中的结果差异只是取样误差。2 是样板间的教学差异是由于样本性质(如书中例子中:教学方法)造成的。
☆样本只提供了关于总体的有限信息。即使样本可以代表它们来自的总体,但我们不期望一个样本可以给出关于整个总体的精确描述。
☆通常,在样本统计量 和 总体参数间 存在一些差异,叫取样误差。
取样误差 存在于样本统计量 和总体参数 间的差异或误差的数量。
——每个样本都包含具有不同性质的不同个体。由于样本由不同人组成,样本统计量也从一个样本变化到另一个。并且没有一个样本统计量 和 总体参数 完全一致。
取样误差的基本理念:
样本统计量通常与其相应的总体参数不同,并且根据样本的不同而变化。
1.3数据结构、研究方法与统计
变量 是一种 针对不同个体具有不同值的 特性或条件。
常量 是一种 不会变化,且对每个个体都相同的 特性或条件。
相关法 观察两个变量并确定它们之间是否存在关系。
(2X2表格数据中,对于每个个体,研究者都有两个测量,且所有的测量都是个数。这种表示个数的数据的变量之间的关系,可以用卡方检验。)
☆对两组或多组测量来说,会存在其中一个变量被用来定义组别。
(例如早餐成绩问题,变量1吃不吃早餐被用来定义组,变量2学习成绩被用来得到每个组的数据)
★并且,如果测量过程产生数字值,那么统计评估会包括计算每组的平均数,并比较它们。
如果测量过程仅仅将个体归入非数字的类别中,那么统计评估常包括计算每个组的比例。
(例如,产生数字值的儿童早餐与成绩问题,学习成绩被用来计算平均值。而城乡居民的政策接受研究中,数字值被用来计算比例。)
实验法 操纵一个变量并观察或测量另一个变量。并且为了建立两个变量间的因果关系,实验需要控制所有其他变量,使它们不会影响结论。
★实验法的两个特性:
1 操纵:研究者操纵一个变量,将它的值从一个水平变化到另一水平。然后观察或测量第二个变量,来确定这种操纵是否导致了变化的产生。
2 控制:研究者必须控制研究情况,使其他无用的变量不能影响需要研究的变量关系。
★通常研究者需要考虑的两种变量:
1 被试变量
一些特性会 随个体的不同 而变化,如年龄性别和智力。只要实验是比较两组个体的差异,就必须保证两组的被试变量完全相同。
2 环境变量
★通常使用三种技术控制其他变量:
1 随机分派
目的是,使每个被试有相同的机会被分派到每个处理条件中,
以使被试的特性在两组中均匀分布。
2 匹配
通过匹配来保证参与组或环境的同质性。(如测量所有被试IQ后,将被试匹配地分派到两组中,使两组有基本相等的IQ)
3 将变量控制成常量
例如,只使用10岁儿童做被试。
☆实验法的术语
自变量 被研究者操纵的变量。(在行为研究中,自变量通常由被试参与的两个或多个处理条件组成。) 自变量由 在观察因变量之前就操纵好的前条件组成。
因变量 即被观察的变量,用于评估处理 效应。(或:被观察并用来评估可能存在操纵效应的变量)在心理学研究中,因变量通常是经过测量后从每个被试中得到的数据。
★注意,在实验法,事实上只测量了一个变量。(因为是操纵一个观察另一个)
它和相关法有本质区别——后者两个变量均被测量,数据由每个个体的两个不同分数组成。
☆控制条件与实验条件
通常,实验将 没有接受任何处理的被试的分数,与接受处理的被试分数进行比较。
这是通过 证明处理条件造成的分数与不处理造成的分数的不同,而说明存在处理效应。
这种研究中,出现了:
1 控制条件
指个体不接受实验处理。——或者不接受处理,或者接受中性或安慰剂性处理。
控制条件的目的是提供与实验条件相比较的基准。
2实验条件
指个体接受实验处理。
★注意:自变量通常由至少两个值组成。(因为至少应有两个值才能称为变量)
有的实验,自变量是简单的数值。
由实验组和控制组组成的实验,自变量应该是处理与非处理。
☆非实验和准实验法
准自变量 是指在非实验中那些决定了组别的变量。
——在非实验中仅仅对两个组进行比较,但这两组却不是通过操纵自变量所得到——通常是由被试变量或时间变量(如处理前与处理后)决定。
p17的两个例子,均是无法操纵变量1(可视为准自变量,准在它为改变因变量而生,却无法被操纵),这种变量1叫做准自变量。
——分割线开始——
★★★对于例子2的“研究者无法操纵时间”,这里有两个问题:
1 为什么它这样说,“无法操纵时间,但是用它来划分两组数据”
这里面其实强调了两个因果关系,即:
a)如果这是一个实验,那么自变量一定为研究者所操纵。
b)如果一个变量是一个实验里的自变量,那么“分组”这个过程一定是由操纵自变量造成的。(因为自变量通常由被试参与的处理条件组成,而处理条件决定了分组。)
所以才有这种暗含因果关系的用词——“但是用它”。
2 为什么这是个非实验?
因为这个实验的分组是源于时间变量——治疗前治疗后是两个时间点,而它并没有得到研究者的操纵。
如果是对时间操纵后才导致这种分组,才能说时间是实验的自变量,而这个实验才能是实验。
★★★注:切莫纠结于,为什么说它没有操纵时间?这种思维是在假定了时间是此实验的自变量导致的,而时间仅仅是导致分组的原因,只能称为准自变量。
——分割线结束——
1.4 变量与测量
☆有些变量仅仅是假设出来的概念(即构念)从而无法直接观察,对它们的研究需要测量。
构念 是内部属性或特性,它不能被直接观察到,但可以描述并解释行为。
操作定义 是一个测量过程。它测量了外部行为,并 使用测量结果作为定义 和对假设的构念的测量。
——操作定义有两个部分1 描述了一系列测量构念的操作;2 用测量结果定义了构念。
☆根据变量值的类型,分为两种变量:
1 离散变量
由不同的、不可分割的类别组成。在两个相邻类别之间不存在其他值。
它们通常限于整数。
2 连续变量
在任意两个观察到的值之间都存在无限多个可能的值。一个连续变量可以被分割成无限个小数部分。
——连续变量的两个因素
1)两个不同个体很少会得到完全一样的测量。若有,可以合理怀疑测量过程过于粗糙,或变量可能不是真的连续的。
2)测量连续变量时,每个测量类别实际上都是一个区间,需要用边界来定义。
一个数值其实是一个区间,而非量表上一个点。
☆在量表上对其设定边界,有以下概念:
实限 指一条连续数据线上数值组成的区间的界限。将两个相邻数值分开的实限恰好位于两个数值的中点。
——每个数值都有两个实限:上实限和下实限。
☆收集数据需要测量观察。
而测量包括将事物分类(定性测量)和使用数字描述事物大小(定量测量)。
介绍四种测量量表:
1 称名量表
由一系列具有不同名称的类别组成。
称名量表的测量将观察的对象分类并贴标签,但不对观察做任何定量的区分。
(称名量表的类别不是量化值,但它可以用数字代表,并依然不能代表任何量化差异。如房间100和房间109这条信息无法得出任何量化结论。)
2 顺序量表
由一组 按顺序排列的类别 组成。顺序量表的测量将观察对象按大小排序。
例如,类别可以是大中小,但不能是1cm2cm3cm。
——类别组成了序列这个事实意味着在类别间存在方向性。可以用顺序量表的测量,来确定两个个体是否不同并确定差异的方向,但无法确定两个个体间的差异大小。
☆等距量表和等比量表
它们都由一系列排序的类别组成,并且这些类别组成了一系列相同大小的区间。
——大小相同的区间,代表可以利用此量表来确定两个测量间的差异的大小和方向。
它们的区别在于零点的性质。
3 等距量表
由排序的类别组成,这些类别都是完全相同大小的区间。
——等距量表具有随意的零点,并且零值不代表被测量的变量不存在。
在等距量表中,量表数字间的差异等价于量的差异,但大小的比例没有意义。
4 等比量表
是一种等距量表。它有一个绝对零值,代表没有测量的变量。
——等比量表绝对的、非任意的零点,使我们可以测量变量的绝对值。
行为科学统计第七版考研复习
本站小编 免费考研网/2020-01-16
相关话题/统计
暨南大学经济学院应用统计复试经验贴
今年进复试的有38人,录取24人。面试分为三组,两组是上午,另外一组是下午,每个人面试时间大概是20分钟。我所在的组的面试流程大致如下: 1、 中文自我介绍:进去以后桌上会贴着一张纸,上面要求你先进行自我介绍、本科是否发过什么论文、再介绍一下你最近看过的与统计相关的书。 2、 英文自我介绍:中文介绍完之后,坐 ...考研复试经验 本站小编 免费考研网 2020-01-152020东北大学432统计学真题完整回忆含解析
...专业课考研资料 本站小编 免费考研网 2020-01-14对外经济贸易大学432统计学复试经验分享
初试结束一段时间啦,大家考完都干什么了呢~ 不管结果如何,能坚持下来已经很棒啦,但是别忘了考研路途还没有结束,还有复试这一关呀! 先介绍一下我自己的情况,我本科专业是经济统计学,初试分数不是很高,379,一度以为分数线是380。。出了分也是郁闷了很久才打起精神来准备复试,最后加上复试成绩名次前进了十名,所以 ...考研复试经验 本站小编 免费考研网 2020-01-14统计学贾俊平考研知识点总结
第一章导论 一、比较描述统计和推断统计: 数据分析是通过统计方法研究数据,其所用的方法可分为描述统计和推断统计。 (1)描述性统计:研究一组数据的组织、整理和描述的统计学分支,是社会科学实证研究中最常用的方法,也是统计分析中必不可少的一步。内容包括取得研究所需要的数据、用图表形式对数据进行加工处理和显 ...专业课考研资料 本站小编 免费考研网 2020-01-132019深圳大学经院应用统计真题回忆
作者: 大禾小鱼 时间: 2019-12-23 19:21 标题: 2019深大经院应用统计真题回忆 为感谢上一年在此看到有师姐发出的回忆真题,继续延续相互分享的优良传统,在此发出本人记得的回忆真题 简答题: 一,为什么计算离散系数 二,中心极限定理(大量观察数据的依据) 三,两类错误 四,最小二乘法估计的优良性质 计算: ...专业课考研资料 本站小编 免费考研网 2020-01-122020清华大学432应用统计真题解答
作者: 路小佳的花生米 时间: 2019-12-23 20:58 标题: 432应用统计真题解答 求助同学之后写的,今年没怎么准备来试试水, 明年加油╰_╯ 最后一题最后一问不确定,解答仅供参考交流 作者: 干锅菜花 时间: 2019-12-24 00:18 第一题第二问不对,应该分0-1、1-2、2-3三个区间,图上这个分布函数都能 ...专业课考研资料 本站小编 免费考研网 2020-01-122020中国人民大学统计学805真题回顾
专业课考研资料 本站小编 免费考研网 2020-01-122020清华大学应用统计432回忆版考研试题
专业课考研资料 本站小编 免费考研网 2020-01-12江西财经大学2020年统计学432真题回忆版
简答题(10分一个,共40分) 1.抽样推断 2.离中趋势(离散程度)的统计指标 3.中心极限定理 4.环比发展速度和定基发展速度 计算题(共70分) 1.平均数,标准差,离散系数(10分) 2.回归方程(10分) 3.指数(20分) 4.假设检验(15分) 5.参数估计(15分) 论述题(20分一个,一共40分) 1.统计误差 2.综合指 ...专业课考研资料 本站小编 免费考研网 2020-01-082020年北京理工大学应用统计回忆版考研真题
作者: 七分好女孩 时间: 2020-1-2 15:13 标题: 2020年北京理工大学应用统计回忆版 考完第一天,和室友嗨了一天!昨天的失落的情绪慢慢淡去,人毕竟要向前看。 昨天铃响的那一刹那,专业课结束了,我意识到自己完了,眼泪在眼眶打转,庆幸的是我忍住了。当时只有一个想法,死就死彻底吧,回到宿舍坐在地上,看了下 ...专业课考研资料 本站小编 考研帮 2020-01-0419暨南大学经院应用统计的复试经验
作者: Jackie199619 时间: 2019-12-30 12:40 标题: 19暨大经院应用统计的复试经验 要考上暨大经院的应统专业,初试的500分和复试的200分是同样比重的,也就是说初试高出2.5分,复试只用1分就能追回来了,所以复试可能更需要比初试精心准备。 说说复试的经验吧,复试包括面试和笔试 面试与去年18年相比,发生了比较大 ...专业课考研经验 本站小编 免费考研网 2020-01-022011北京航空航天大学考博2011概率论与数理统计真题
考博 本站小编 免费考研网 2020-01-012020年西南财经大学应用统计025200真题回忆
作者: Puppet丶 时间: 2019-12-25 15:25 标题: 2020年西南财经大学应用统计025200真题回忆 一、因素分析+时点序列平均 二、1. 等比例抽样,平均值的区间估计,总的区间估计 2. 重复抽样,比例的最小抽样数目(比例给了经验值和标准差) 三、组中值,判断分布形状(平均值,中位数,众数) 四、多重线性回归(2元) ...专业课考研资料 本站小编 免费考研网 2020-01-012020华中农业大学432统计学真题回忆
作者: RachelZhong224 时间: 2019-12-25 15:34 标题: 2020华中农业大学432真题回忆 一、选择题(50分) 共25题 知识点较历年重复度较高,比较简单,主要有条件概率,区间估计,假设检验,切比雪夫不等式,卡方分布与指数分布的关系,分布性质等。 二、简答题(30分) 共6题 1、中心极限定理与大数定律的关系 2、总 ...专业课考研资料 本站小编 免费考研网 2020-01-012020年暨南大学432应用统计题目回忆版
作者: 喜吖 时间: 2019-12-25 15:42 标题: 2020年暨南大学432题目回忆版 一. 1.什么是统计整理,它分为哪几个步骤进行110分 2.相关分析和回归分析分为哪些步骤10分 3.(1)问卷星调查问卷与传统调查相比有哪些优缺点4分 (2)会有哪些误差,具体说明误差的危害6分 二.2000名学生,不重复抽样,抽了40个人,每个月话费 ...专业课考研资料 本站小编 免费考研网 2020-01-01