统计学入门
统计、科学与观察
统计:指整理、总结并解释信息的一系列数学过程。
总体与样本
总体:在一个特定研究中所有感兴趣个体的集合。
样本:从一个总体中选择出来的个体的集合,通常在研究中被期望代表总体。
参数:一个值,通常是数字值,描述一个总体。参数可以从单个测量中得到,或从对总体的一组测量中推导出来。
统计量:一个值,通常是数字值,描述了一个样本。统计量可以从单个测量中得到,或从对样本的一组测量中推导出来。
描述性统计方法:把原始数据组织并总结成更易处理的形式的技术。
推论性统计方法:用样本数据做出关于总体的一般性陈述的方法。
取样误差:存在于样本统计量和总体参数间的差异或误差的数量,当样本统计量被用于代表总体参数时,误差总是存在的。
数据结构、研究方法与统计
变量:因个体而变化的特性。
常量:不因个体变化而变化的特性或条件。
比较两组或多组测量:实验法或非实验法
- **实验法**:目的是展示两个变量之间的因果关系。
- **操纵**:操纵一个变量,观察其他变量是否发生变化。
- **控制**:控制无用的变量不影响研究的变量
> 只要结果有多于一个的解释,那么研究就会被混淆。
- **自变量**:被研究者操控的变量
- **因变量**:被观察的变量,用于评估处理效应
- **控制条件**:不接受实验处理,做为参照组
- **实验条件**:个体接受实验处理,做为实验组
- **非实验法**:展示两个变量之间的相关性。
- **准自变量**:不可操控的变量,用于分组
变量与测量
构念:一个事物的内部属性或特性,不能被直接观察,但可以描述并解释行为。例如:智力
操作定义:一个测量过程,描述了一系列测量构念的操作;用测量结果定义了构念。
离散变量:由不同的、不可分割的类别组成,在两个相邻类别之间不存在其他的值,通常限于整数,也可能由性质上不同的观察组成,例如不同类型精神疾病的患者。
连续变量:在任意两个观察到的值之间都存在无限多个可能的值,一个连续变量可以被分割为无限个小数部分。
实限:表示为一条连续数据线上数值组成的区间的界限。将两个相邻数值分开的实限位于这两个数值的中点。每个数值都有两个实限,上实限和下实限。例如:数值70 71,70的上实限为70.5,下实限为69.5
测量量表
- **称名量表**:把变量分类的表,每个分类之间没有系统相关性,也不做相关性分析。例如:艺术、生物、经济、化学
- **顺序量表**:类别之间有顺序关系,但无法确定列表中的个体的差异大小。例如:大、中、小
- **等距量表**:区间相等的顺序列表,零值可以是量表上任意位置,不为起点,量表中的测量值不可互相比较。
- **等比量表**:零值为绝对值,为起点,可以比较两个测量值之间差异的方向和大小,并且可以用比例来描述这种差异。
统计符号
- **分数**:每一个被试的值或分数
- **求和符号**:∑