频数的定义
频数:个体出现的次数
频数分布:是一种组织好的关于位于测量量表每个类别上的个体数目的数据表。
频数分布表
统计上,习惯用
- X表示每个个体的值
- f表示频数(个体出现的次数)
- N表示个体个数总和(N=∑f)
- p表示比例(p=f/N)
- %表示百分率(%=f/N/100)
分组频数分布表:把频数分组形成的表
- 规则1:大约做10个组距,过多或过少都不够清晰(组距越宽,失去的信息越多)
- 规则2:每个区间的宽度应该为相对简单的数字,例如2、5、10、20之类,使用5的倍数比较直观
- 规则3:每个组距的最小数值应为宽度的倍数,例如区间宽度用10,组距应由20、30、40以此类推
规则4:所有区间应具有相同宽度
举例:
一个总数量为25的考试分数,需要做一个频数分布表。
82,75,88,93,53,84,87,58,72,94,69,84,61,91,64,87,84,70,76,89,75,80,73,78,60
步骤:
确定组数。
- 94(最大数)-53(最小数)= 41(值域)
- 41/5(每组的范围)=8.2≈9(最接近10)
确定每组的上下限
- 数据中最小值为53,需要包含在下限中,且下限应为5的倍数,所以下限设置为50
- 第一组数据为 50,51,52,53,54
根据分组表,可加入频数、比例或百分率
频数分布图
一般来说,X轴为值(或组数),Y轴为频数;另一个普遍规则为Y轴大约为X轴的2/3或3/4,违反这个原则将导致图形对数据的误导。
图的目的是提供数据的精确表述,在某些情形下,画图并不是表述信息的最好方法。
频数分布的形状
3种特性可以完整描述任意分布:
- 形状:限定了X和Y的关系
- 集中趋势:测量的是分布中心的位置
- 变异性:显示的是数据是分散在广大区域还是集中在一起
百分位数、百分等级与内插法
累积频数:累积到这个数值为止的所有频数的总和。用cf表示,例如:
x = 4 的累积频数为2+4+8+5=19
累积百分比:代表处于或低于每个类别中的个体的百分率,用c%表示
公式:c% = cf/N*100
内插法:用于测量某个数值的百分位数或某个百分位数对应的数值。
1. 分别测量两个不同量表的某一区间,每个量表区间的端点已知。
2. 已知某一量表的一个中间值,问题是找出另一个量表中相对应的中间值。
3. 开始以下4个步骤:
1. 找出两个量表的区间宽度
2. 找出中间值在区间中的位置,这个位置对应着整个区间的一个分数:分数=到区间顶点的距离/区间宽度
3. 用这个分数确定另一量表中到区间顶点的距离:距离=分数 x 宽度
4. 用这个距离决定所求值在另一个量表中的位置
例:
求x=6.3对应的百分等级

1. x的区间宽度为1
2. x=6.3 区间上下限为5.5-6.5 距离为 6.3-5.5=0.8
3. c%的区间宽度为20%-4%=16%
4. 44%-12%=32%
练习验证计算器:http://www.99cankao.com/analytical/linear-interpolation.php