瑞士万通中国有限公司
瑞士万通中国有限公司

从HQI和p值了解手持拉曼的识别与验证技术

2020-03-182236

       如今,便携式设备的发展已为制药行业的质量控制、质量保证和制造带来了全新的技术革命,使原材料识别和验证方式发生了巨大变化。便携式设备的性能已显着提高,并在某些情况下,其数据质量不亚于实验室仪器。

       拉曼光谱法是快速识别未知样品的重要方法之一,而在手持式拉曼光谱仪中,用作光谱数据分析的两种Z常见的数学表示形式为Hit Quality Index(HQI)和p-values(p值)。其中HQI是未知样品匹配的方法,而p值Z适合验证已知样品的身份。我们以Mira P来说明。

HQI

       数据库匹配是光谱学中用于研究未知物质的一种行之有效的方法,通常将未知样品的光谱谱图与已知材料的经过验证的光谱图库进行互相关联并比较, 然后通过计算HQI来量化每个潜在匹配项的相关程度(相似度)。

20200318-2004982721.png

       HQI的值介于0到1.0之间,数值越大,则表示未知样品谱图与已知的参考图谱之间的相似度越高,未知样品和参考之间的相关性Z高为1。在典型行业,例如制药领域中通常将Z小HQI设置为0.95,以此来判定未知样品与标准图谱是否“匹配/不匹配”。

20200318-327054537.png

       注意:HQI只反映未知谱图与已知图库的相关性,并非衡量所测材料的纯度。因此可能导致非常相似的材料的发生错误识别。换句话说,使用HQI进行分析可导致误报。如下所示分子及其谱图:

20200318-1676040353.png

       当我们使用HQI进行分析则可能的结果如下:

20200318-1887476265.png

       此时,我们就要借助p值来对样品进行身份验证。

p 值

       与基于光谱之间相似性的识别技术不同,该验证方法基于各个光谱之间的差异,称为主要成分分析(PCA),这是一种统计分析,可将复杂的数据集缩减为Z能描述数据的基本特征。该方法将高度相关的光谱转换为一小组正交变量,并绘制出散点图,并以此建模。

20200318-1200452688.png

       PCA散点图与模型极限组合成为参考模型,模型极限由置信区间确定,置信区间由霍特林统计量而来。下图中分别为置信度为90%和95%的椭圆,可以用来对样本进行测量。将每个样本光谱投影到PCA模型上,以查看其是否符合模型极限。

20200318-916260477.png

20200318-343489669.png

       当将样品光谱投影到模型空间上时,我们得到的结果为p值。在统计学上,当p值小于α(显著性水平)时,我们可以拒绝原假设(H0)。对于PCA分析和拉曼光谱的验证来说,原假设(H0)表示“测得的光谱属于所用构建模型“,通常我们选取α=0.05。此时使用PAC模型以及统计得到的p值,即可表明脂肪酸之间的无限区别。

20200318-703503391.png

       注意:PCA模型的有效性完全取决于训练集。训练集是模型群体中高度相关的光谱库。通常至少收集20种具有某种允许变化的单一物质的光谱来构建训练集。

结论

       本文阐述了Mira P手持式光谱仪的识别和验证方法,分别针对不同应用的独特分析。

       当样品身份未知时,我们使用HQI进行识别;

       当需要确认样品时,我们使用p值进行验证。


相关产品
上一篇:如何掌控润滑油的寿命?
下一篇:燃料电池(二)燃料电池的种类

网站导航