今天我们继续介绍QC七大手法的第六种——直方图。
直方图,又叫质量分布图,由一系列高低不等的条形组成,用来表示数据的分布情况。
直方图的一般形式如下:
根据统计学的统计分析,我们日常接触到的特性,如人群的身高、体重、智力水平等等,基本都符合正态分布。同样的,在我们企业生产过程中的种种质量特性在正常情况下也是符合正态分布的。如下图所示:
直方图是将某一特性数据以条形按连续的数据区间展示出来,对比正态分布图,就很容易使可能存在的问题显示出来,便于进行管理和改善。
要绘制直方图,首先需要有较大量的数据,这是由统计学的特点决定的。当数据量较小时,单一数据的点概率不足以表示整体特性的概率分布情况。传统上的统计学一般要求统计的数据量不少于30个,而当今大数据的统计分析,数据量以千万、亿为单位,其统计分析的结果,更加接近客观情况。
在企业中,如果有相应的数据采集分析系统,那么数据量在其计算范围内当然是越多越好。而对于人工绘制直方图,过多的数据量会使工作过于复杂。一般的,我们以50-200的数据量为宜。
对于数据的统计,需要按照一定的规则进行采样,本文不做详细的描述,重点讲解直方图的绘制方法。如下数据:
第一,在收集到的数据中找出最大值和最小值,并计算全距R。
R=最大值-最小值
最大值=82.8,最小值=77.5,R=82.8-77.5=5.3
第二,根据数据量n决定分组的组数K。
K=1+lg n/lg 2≈1+3.32×lg n
或者参考下表:
根据上表,选择组数K=10。
第三,决定组距。
组距= 全距/组数
(为便于计算平均数与标准差,组距常取2、5或10的倍数,或测量单位的整数倍)
组距=5.3/10=0.53,测量单位为0.1,因此组距取0.5。
第四,决定各组的下组界和上组界。
最小一组的下组界=全部数据的最小值–测量值最小单位/2
最小一组的上组界=最小一组的下组界+组距
最小二组的下组界=最小一组的上组界
最小二组的上组界=最小一组的上组界+组距
其它依此类推
第一组下组界=77.5-0.1/2=77.45
第一组上组界=77.45+0.5=77.95
第二组下组界=第一组上组界=77.95
第二组上组界=77.95+0.5=78.45
其他各组组界以此类推。
第五,决定各组的中心点。
组的中心点=(上组界+下组界)/2
第一组中心点=(77.45+77.95)/2=77.70
第二组中心点=(77.95+78.45)/2=78.20
其他各组中心点以此类推。
第六,将所有数据按分组统计数量。
这里我们看到,最终的组数与我们前面选择的10组并不一致。这是由于我们在选择组距时的误差造成的,通常来说,并不会对我们的分析造成影响。
第七,按分组-数量,以组距为底边,以组的数据个数为高,绘制柱状图,并填写各组中心点、数量等信息。
第八,填写主题、规格、平均值、数据来源、日期等相关数据。
绘制完成直方图后,我们可以根据直方图的分布形态,判断可能出现的问题。
有了直方图的直观判断,我们除了可以寻找存在的问题,还可以对生产过程的过程能力进行评价,如正常型直方图分析中的第三幅图,提示我们生产过程能力不足,应考虑设备、人员等的改善,或者产品标准的设定是否过严;而第四幅图则提示我们生产过程能力强,是否存在标准设定过于宽放。