行业知识
与粒子计数测量和标准有关的统计学原理
粒子计数,统计学,抽样测量
统计是洁净室空气洁净度分级的本质,然而这些背后的原因常常得不到很好的理解和重视。这是不足为奇的,因为通常人们总是遵循标准操作程序进行分级,很少对它作出解释。如果理解了为什么要这样做,并且从收集的粒子统计数据得到了进一步的信息,对设计和维护高效的洁净室环境就非常有用。
空气洁净度是通过对给定尺寸范围的粒子计数来测量的。在生物、医药业中,粒子尺寸在0.5μm以上,而在半导体工业中粒子尺寸为0.1μm以下。就生物、医药环境而论,这是由法规确定的,而在半导体工业中,这是根据获得最大产品质量的需要确定的。本文深入浅出地解释等级分类中的统计学与粒子计数的关系,叙述它们是如何测量的。还提供有更多的内容进行更详细的解释[ 1-3]。
统计基础
测量任何东西时,结果总会受到随机波动和系统性(因果)变化的影响。例如,在平直的公路上的小汽车的速度可以认为是恒定不变,但是实际上由于空气速度、空气密度、道路表面变化和其他许多因素的影响,汽车的速度实际上是变化的。这里我们说的随机波动是指未知甚至是不可知的效应。虽然测定值的变化(不确定性) 是随机的,但是进行大量测量后,这些变化却遵循明确的规律。
平均值(Mean)是数值之和除以数值的个数,经常表示为:
式中X是一个数值,N 为数值的个数。
数值的分布称为标准偏差σ。标准偏差用下述公式计算:
如果测定值的变化是遵循高斯分布,那么可以预期所有值的67%是落在±σ范围内。例如,如果平均值为20,标准偏差为5,则所有值中67%在15和25之间。而且,95%的数值落在平均值±2σ的范围内,所有数值中有99%落在平均值±3σ的范围内。
“显着”这个词常用于下面的句子中:“差别显着吗”?这个问题可以改写为:这两次测定值相等的机会大于5%(20分之1)吗?如果这个问题的答案是肯定的,则这两个值的差别不很显着。如果答案是否定的,则这两个值的差别显着。
必须记住每个平均值都有一个标准偏差。他们是分不开的;如果缺少其中之一个,另外一个就无意义。在表达统计数据时常犯的错误是忘记这个规则,经常表现为下面的说法:“如果每立方英尺有一个,每立方米就有35个。”实际上,实际情况是每立方英尺一个,标准偏差为一,意味着每立方米的期望个数为35,标准偏差为35个,这意味着每立方米的“真实”个数在0和105之间。
计数统计
当定量测量某些东西时,例如粒子计数,统计数字遵循泊松分布。这就预示着有离散项是随机分布的,取子样时(例如从室中取出1立方英尺的空气),标准偏差就是该计数的平方根。即期望值等于方差,即等于该计数。
这种关系是非常有用的,因为利用它我们可以进行预测并将实际测量的粒子数的标准偏差与理论标准偏差进行比较。如果测量的和计算的标准偏差差别相当显着,我们就可断定有非随机因素影响测量。这可能是标准偏差太大,暗示抽样存在问题(例如,粒子沉降),或者数值太低,表示仪表有问题。在统计学中,最可疑的是完善性。
图. 高斯分布曲线
因为我们期望标准偏差是平均值的平方根,那么一个4的计数与一个0的计数差别不是很显着的。另一项观察是低的计数具有固有的不准确性:计数越高,测量的准确性越高。 如果一次测量计数为25, 则标准偏差为5(或者百分之20)。如果一次测量1,000个计数,则标准偏差是大约百分之3。换句话说,如果测量重复100次,67次的结果预期将落在1,000的3% 范围内。
标准误差
标准误差是衡量结果代表真实性的准确程度。在粒子计数中,它表示在不同位置测得的粒子个数的平均值,而不同位置常常代表着各个抽样。
一个测量结果的准确度通过规定的上下置信范围来规定。通常用95%置信度(记住“显着”这个术语)。对于洁净室分级,我们关心的是95%置信范围的上限(UCL)。
标准误差(se)等于标准偏差除以抽样次数的平方根:
95%的置信范围上限(UCL)可用下述公式计算:
Tval用一个复杂公式计算或从表中查得,这取决于取值的次数或待测的置信度水平。在洁净室分级中,Tval值用计算置信度上限(UCL)预先计算和表示。 如果数值的个数大于9,则将Tval设置在0,这样标准误差可以忽略不计。
选择抽样容积
ISO 14644-1[4]和美国联邦政府标准209(11/29/01废除)的分级要求最小的抽样容积大于0.1立方英尺或者在级别限制上预计包含20个粒子。例如,如果待测的级别期望每立方英尺(28.3公升)100次计数,则最小抽样容积为0.2立方英尺(5.6公升)。应注意ISO标准要求取样至少一分钟,不管流速大小。
另一方面,英国标准5295(BS5295)规定在1立方英尺/分钟的流速下抽样容积为1立方英尺,并且通过指定每个位置抽样次数改变抽样容积。
选择每个抽样容积最小20个粒子可以从上一节计数统计来理解。如果抽样容积不够大,则测量的值的不确定性就很大,这样就不可能看出每立方英尺100个计数的粒子浓度与每立方英尺10个计数之间的差别。
欧盟GMP 规定对于一些级别每立方米的计数为零。从前边的讨论中可以看出,这将需要一个无限大的抽样容积。在某种意义上,你永远不可能确认一个计数为零的测量,也无法确信它为零。
选择抽样位置的数量
每个标准都有自己的方法来确定抽样位置的数量。对于较高级别等级,需要更多的抽样位置(ISO标准不要求,FS209和BS5295标准要求)。这样可通过增加抽样次数再次降低测量的粒子计数的不确定性。
理论上,这些位置应在一个标准格网上,以便得到一个区域内的粒子计数的好的分布空间表达式。然而,这种方案可能会受到区域的物理布局的限制不能在合适的位置上进行测量。另一个可能要遇到的问题是操作者经常下意识地避免已知有问题区域。
对于规定计算95%的UCL,用ISO 和FS209,最好在10个位置进行测量。 这意味着标准误差可以忽视,平均值认为是95%UCL。
正如所期望的,对于一般的监视系统的位置数由监视目的确定,其中必须考虑该工艺的风险、目的和好处,以及需要遵循的规章。
尽管没有规章或指南规定要监视的位置数,一个良好的预期位置数起始估计是取以平方米表示的地面面积的均方根,这与在ISO标准规定一样。
空气洁净度是通过对给定尺寸范围的粒子计数来测量的。在生物、医药业中,粒子尺寸在0.5μm以上,而在半导体工业中粒子尺寸为0.1μm以下。就生物、医药环境而论,这是由法规确定的,而在半导体工业中,这是根据获得最大产品质量的需要确定的。本文深入浅出地解释等级分类中的统计学与粒子计数的关系,叙述它们是如何测量的。还提供有更多的内容进行更详细的解释[ 1-3]。
统计基础
测量任何东西时,结果总会受到随机波动和系统性(因果)变化的影响。例如,在平直的公路上的小汽车的速度可以认为是恒定不变,但是实际上由于空气速度、空气密度、道路表面变化和其他许多因素的影响,汽车的速度实际上是变化的。这里我们说的随机波动是指未知甚至是不可知的效应。虽然测定值的变化(不确定性) 是随机的,但是进行大量测量后,这些变化却遵循明确的规律。
平均值(Mean)是数值之和除以数值的个数,经常表示为:
式中X是一个数值,N 为数值的个数。
数值的分布称为标准偏差σ。标准偏差用下述公式计算:
如果测定值的变化是遵循高斯分布,那么可以预期所有值的67%是落在±σ范围内。例如,如果平均值为20,标准偏差为5,则所有值中67%在15和25之间。而且,95%的数值落在平均值±2σ的范围内,所有数值中有99%落在平均值±3σ的范围内。
“显着”这个词常用于下面的句子中:“差别显着吗”?这个问题可以改写为:这两次测定值相等的机会大于5%(20分之1)吗?如果这个问题的答案是肯定的,则这两个值的差别不很显着。如果答案是否定的,则这两个值的差别显着。
必须记住每个平均值都有一个标准偏差。他们是分不开的;如果缺少其中之一个,另外一个就无意义。在表达统计数据时常犯的错误是忘记这个规则,经常表现为下面的说法:“如果每立方英尺有一个,每立方米就有35个。”实际上,实际情况是每立方英尺一个,标准偏差为一,意味着每立方米的期望个数为35,标准偏差为35个,这意味着每立方米的“真实”个数在0和105之间。
计数统计
当定量测量某些东西时,例如粒子计数,统计数字遵循泊松分布。这就预示着有离散项是随机分布的,取子样时(例如从室中取出1立方英尺的空气),标准偏差就是该计数的平方根。即期望值等于方差,即等于该计数。
这种关系是非常有用的,因为利用它我们可以进行预测并将实际测量的粒子数的标准偏差与理论标准偏差进行比较。如果测量的和计算的标准偏差差别相当显着,我们就可断定有非随机因素影响测量。这可能是标准偏差太大,暗示抽样存在问题(例如,粒子沉降),或者数值太低,表示仪表有问题。在统计学中,最可疑的是完善性。
图. 高斯分布曲线
因为我们期望标准偏差是平均值的平方根,那么一个4的计数与一个0的计数差别不是很显着的。另一项观察是低的计数具有固有的不准确性:计数越高,测量的准确性越高。 如果一次测量计数为25, 则标准偏差为5(或者百分之20)。如果一次测量1,000个计数,则标准偏差是大约百分之3。换句话说,如果测量重复100次,67次的结果预期将落在1,000的3% 范围内。
标准误差
标准误差是衡量结果代表真实性的准确程度。在粒子计数中,它表示在不同位置测得的粒子个数的平均值,而不同位置常常代表着各个抽样。
一个测量结果的准确度通过规定的上下置信范围来规定。通常用95%置信度(记住“显着”这个术语)。对于洁净室分级,我们关心的是95%置信范围的上限(UCL)。
标准误差(se)等于标准偏差除以抽样次数的平方根:
95%的置信范围上限(UCL)可用下述公式计算:
Tval用一个复杂公式计算或从表中查得,这取决于取值的次数或待测的置信度水平。在洁净室分级中,Tval值用计算置信度上限(UCL)预先计算和表示。 如果数值的个数大于9,则将Tval设置在0,这样标准误差可以忽略不计。
选择抽样容积
ISO 14644-1[4]和美国联邦政府标准209(11/29/01废除)的分级要求最小的抽样容积大于0.1立方英尺或者在级别限制上预计包含20个粒子。例如,如果待测的级别期望每立方英尺(28.3公升)100次计数,则最小抽样容积为0.2立方英尺(5.6公升)。应注意ISO标准要求取样至少一分钟,不管流速大小。
另一方面,英国标准5295(BS5295)规定在1立方英尺/分钟的流速下抽样容积为1立方英尺,并且通过指定每个位置抽样次数改变抽样容积。
选择每个抽样容积最小20个粒子可以从上一节计数统计来理解。如果抽样容积不够大,则测量的值的不确定性就很大,这样就不可能看出每立方英尺100个计数的粒子浓度与每立方英尺10个计数之间的差别。
欧盟GMP 规定对于一些级别每立方米的计数为零。从前边的讨论中可以看出,这将需要一个无限大的抽样容积。在某种意义上,你永远不可能确认一个计数为零的测量,也无法确信它为零。
选择抽样位置的数量
每个标准都有自己的方法来确定抽样位置的数量。对于较高级别等级,需要更多的抽样位置(ISO标准不要求,FS209和BS5295标准要求)。这样可通过增加抽样次数再次降低测量的粒子计数的不确定性。
理论上,这些位置应在一个标准格网上,以便得到一个区域内的粒子计数的好的分布空间表达式。然而,这种方案可能会受到区域的物理布局的限制不能在合适的位置上进行测量。另一个可能要遇到的问题是操作者经常下意识地避免已知有问题区域。
对于规定计算95%的UCL,用ISO 和FS209,最好在10个位置进行测量。 这意味着标准误差可以忽视,平均值认为是95%UCL。
正如所期望的,对于一般的监视系统的位置数由监视目的确定,其中必须考虑该工艺的风险、目的和好处,以及需要遵循的规章。
尽管没有规章或指南规定要监视的位置数,一个良好的预期位置数起始估计是取以平方米表示的地面面积的均方根,这与在ISO标准规定一样。
无菌服推荐:
无菌服/耐高温高压服 翻领式无尘大褂
立领无尘大褂 三连体无尘服