例食品厂用自动装罐机生产罐头食品,由于工艺的限制,每个罐头的实际重量有所波动,现从一批罐头中随机抽取100个称其净重,数据如下:
342 352 346 344 343 339 336 342 347 340 340 350 347 336 341
349 346 348 342 346 347 346 346 345 344 350 348 352 340 356
339 348 338 342 347 347 344 343 349 341 348 341 340 347 342
337 344 340 344 346 342 344 345 338 351 348 345 339 343 345
346 344 344 344 343 345 345 350 353 345 352 350 345 343 347
354 350 343 350 344 351 348 352 344 345 349 332 343 340 346
342 335 349 348 344 347 341 346 341 342
对这一样本数据进行整理。
解析:
步骤如下
①首先从给出的数据中找出其最大值与最小值,并计算极差R=一。
在本例中=356,=332,从而R=356-332=24
②根据样本量n决定分组数k和每一组的组距h。
作频数频率分布表的目的是要显示出数据中所隐藏的规律!因此分组数不能太少,也不宜太多。通常可以利用下表进行选择。
直方图分组组数选用表
样本量n推荐组数
50—1006—10
101—2507—12
250以上10—20
每一组的区间长度可以相同也可以不同,而区间长度相同的情况用得比较多。在区间长度相同时,当组数确定后,区间长度(即组距)可以用下式计算:
通常取为最小测量单位的整数倍。
在本例中,n=100的,取k=9,在等距分组时,组距可以取为。
③决定各组的区间端点:
通常要求。
必要时还可以计算各组的组中值。
在本例中取,便可以逐一计算每一个组的组限,具体的值列下表。
④用唱票的方法统计样本落在每一个区间中的个数(称为频数),记为,并计算每个区间
对应的频率,列出频数频率分布表。
本例的频数频率分布表见表。
频数频率分布表
组号区间组中值频数频率
1(331.5,334.5 33310.01
2(334.5,337.5 33640.04
3(337.5,340.5 339170.17
4(340.5,343.5 342270.27
5(343.5,346.5 34530 0.30
6(346.5,349.5 348 120.12
7(349.5,352.5 35170.07
8(352.5,355.5 354100.01
9(355.5,358.5 357100.01
合 计 100 1.00
可见,绝大多数,罐头净重集中在337.5—352.5之间,特别是大量集中在340.5—349.5之间,而特别重的和特别轻的所占的比例很少。
责任编辑:wangpeng6151