频数的定义

频数:个体出现的次数

频数分布:是一种组织好的关于位于测量量表每个类别上的个体数目的数据表。

频数分布表

统计上,习惯用

  • X表示每个个体的值
  • f表示频数(个体出现的次数)
  • N表示个体个数总和(N=∑f)
  • p表示比例(p=f/N)
  • %表示百分率(%=f/N/100)

分组频数分布表:把频数分组形成的表

  • 规则1:大约做10个组距,过多或过少都不够清晰(组距越宽,失去的信息越多)
  • 规则2:每个区间的宽度应该为相对简单的数字,例如2、5、10、20之类,使用5的倍数比较直观
  • 规则3:每个组距的最小数值应为宽度的倍数,例如区间宽度用10,组距应由20、30、40以此类推
  • 规则4:所有区间应具有相同宽度

    举例:

    一个总数量为25的考试分数,需要做一个频数分布表。

    82,75,88,93,53,84,87,58,72,94,69,84,61,91,64,87,84,70,76,89,75,80,73,78,60

    步骤:

    1. 确定组数。

      • 94(最大数)-53(最小数)= 41(值域)
      • 41/5(每组的范围)=8.2≈9(最接近10)
    2. 确定每组的上下限

      • 数据中最小值为53,需要包含在下限中,且下限应为5的倍数,所以下限设置为50
      • 第一组数据为 50,51,52,53,54
    3. 根据分组表,可加入频数、比例或百分率

频数分布图

一般来说,X轴为值(或组数),Y轴为频数;另一个普遍规则为Y轴大约为X轴的2/3或3/4,违反这个原则将导致图形对数据的误导。

图的目的是提供数据的精确表述,在某些情形下,画图并不是表述信息的最好方法。

频数分布的形状

3种特性可以完整描述任意分布:

  • 形状:限定了X和Y的关系
  • 集中趋势:测量的是分布中心的位置
  • 变异性:显示的是数据是分散在广大区域还是集中在一起

百分位数、百分等级与内插法

累积频数:累积到这个数值为止的所有频数的总和。用cf表示,例如:

x = 4 的累积频数为2+4+8+5=19

累积百分比:代表处于或低于每个类别中的个体的百分率,用c%表示

公式:c% = cf/N*100

内插法:用于测量某个数值的百分位数或某个百分位数对应的数值。

1. 分别测量两个不同量表的某一区间,每个量表区间的端点已知。

2. 已知某一量表的一个中间值,问题是找出另一个量表中相对应的中间值。

3. 开始以下4个步骤:

    1. 找出两个量表的区间宽度
    2. 找出中间值在区间中的位置,这个位置对应着整个区间的一个分数:分数=到区间顶点的距离/区间宽度
    3. 用这个分数确定另一量表中到区间顶点的距离:距离=分数 x 宽度
    4. 用这个距离决定所求值在另一个量表中的位置

例:

求x=6.3对应的百分等级

![](/assets/Snipaste_2018-11-15_13-35-51.png)

 1. x的区间宽度为1
 2. x=6.3 区间上下限为5.5-6.5 距离为 6.3-5.5=0.8
 3. c%的区间宽度为20%-4%=16%
 4. 44%-12%=32%

 练习验证计算器:http://www.99cankao.com/analytical/linear-interpolation.php

results matching ""

    No results matching ""