一、背景介紹
近紅外(Near Infrared,簡稱NIR)光是指介于可見光與中紅外之間的電磁波,譜區范圍是780~2526nm (12820~3959cm-1),通常又將此波長范圍劃分為近紅外短波區(780~1100 nm)和近紅外長波區(1100~2526 nm)。與中紅外相比,該區域主要是O-H,N-H,C-H,S-H等含氫基團振動光譜的倍頻及合頻吸收,譜帶寬,重疊較嚴重,而且吸收信號弱,信息解析復雜,所以盡管該譜區被發現較早,但分析價值一直未能得到足夠的重視。近年來,由于計算機與化學統計學軟件的發展,特別是化學計量學的深入研究和廣發應用,使近紅外成為發展最快、最引人注目的光譜技術。與傳統的分析方法比較,近紅外光譜分析技術擁有許多獨到之處。但和其它析方法一樣,近紅外分析方法也存在不足之處。首先,它是一種間接的分析技術,需要通過收集大量具有代表性的標準樣品,通過嚴格細致的化學分析測出必要的數據,再通過計算機建立數學模型,才能預測未知樣品的結果。而模型的建立需耗用大量的人力、物力和財力;其次,由于NIR譜區為分子倍頻與合頻的振動光譜,信號弱,譜峰重疊嚴重,所以目前還僅能用于常量分析,被測定組分的量一般應大于樣品重量的0.1%;此外,在進行近紅外光譜分析時,應考慮樣品的特征、分析實驗的設計及數據處理等多方面的問題,才能取得正確的分析結果,建立可靠的校正模型是利用近紅外實現成功分析的關鍵。
二、原理及分析方法
由于一張近紅外光譜既可以給出活性成分、輔料的化學結構信息、還可以給出活性成分的工藝信息(如晶型、旋光度、密度等)以及制劑的工藝特征信息(如制粒的大小、硬度等)和部分包裝材料的結構信息,所以利用近紅外光譜,我們既可以做定性分析也可以做定量分析,但與常規的分析方法不同,近紅外光譜技術不是通過觀察供試品或測量供試品譜圖參數直接進行定性或定量分析,而是首先通過測定樣品校正集的光譜、組成或性質數據(組成或性質數據需通過其他認可的標準方法測定),采用合適的化學計量學方法建立校正模型,再利用建立的校正模型與未知樣品進行比較,從而實現定性或定量分析。
1.定性分析
近紅外光譜譜帶較寬,特征性不強,因此很少像其他光譜(如紫外和紅外光譜)那樣用于化合物基團的識別及結構的鑒定。近紅外光譜的定性分析一般是用于被分析樣品在已知樣品集中的位置。常用的方法包括:
(1)判別分析法:分析是經典的定性識別方法,其基本思路是相同樣品在相同波長下具有相近的光譜吸收,這種光譜間的比較可以是原始光譜也可以是經過處理的光譜。
(2)主成分分析(Principal Component Analysis PCA)法:利用PCA方法將多種波長下的光譜數據壓縮到有限的幾個因子空間內,再通過樣品在各個因子空間的得分確定其歸屬類別,但PCA對樣本與校正集間的確切位置缺乏定量的解釋。其缺點是當真藥與劣藥的含量相當接近時此法容易判錯。
(3)馬氏距離(Mahalanobis Distance MD)法:該方法的核心是通過多波長下的光譜距離定量描述出測量樣本離校正集樣本的位置,因而在光譜匹配、異常點檢測和模型外推方面都很有用。但應用該方法時,波長位置的選擇非常重要,波長點過少,光譜得不到合理得描述;波長點過多,計算量大,為此,也有人提出將PCA與馬氏距離相結合解決模型得適用性問題,可以充分利用PCA對大量光譜數據進行降維處理,也較好地解決了馬氏距離計算時波長點的選擇問題,避免了大量光譜數據直接進行馬氏距離計算出現的共線性或計算量大等問題,且克服了采用PCA自身進行判斷界限不易量化的問題。
2.定量分析
近紅外光譜測量時一般不需對樣品進行預處理,但測定的光譜可能受到各種干擾因素的影響。利用單一波長下獲得的光譜數據很難獲得準確的定量分析結果。NIR光譜結構復雜,譜圖重疊較多,所以在進行定量分析時,一般采用多波長下獲得的數據并進行一定的數據處理才能獲得準確可靠的分析結果。常用如下:
(1)主成分回歸(Principal Component,PCR);原理與PCR在解釋光譜數據時起著重要作用,從主成分權重中能夠確定主成分與哪個組份有關,但確切而全面地解釋每個主成分代表什么含義迄今仍是最難解決的問題。
(2)偏最小二乘法(Partial Least Square,PLS):該法是一種全光譜分析方法,充分利用多個波長下的有用信息,無需刻意的選擇波長,并能濾去原始數據噪音,提高信噪比,解決交互影響的非線性問題,很適合在NIR中使用。實驗證明,PLS法同近紅外漫反射光譜法結合,直接分析很多固態藥品如磺胺甲基異唑、安體舒通、安乃近、磺胺脒等是可行的。
(3)人工神經網絡法(Artificial Neural Networks,ANN):近年來興起的ANN法研究,根據樣品各組分的光譜數據建立人工神經網絡模型,預測未知樣品并討論影響網絡的各參數。采用ANN法的最大優點是其抗干擾、抗噪音及強大的非線性轉換能力,對于某些特殊情況ANN會得到更小的校正誤差和預測誤差,并且它的預測結果要稍優于PLS(t檢驗無顯著差異)。這可能是由于ANN法具有更強的非線性處理能力所致。
此外還有多元線性回歸(Multiple Linear Regression,MLR)、拓撲(Topology,TP)等方法也在近紅外光譜分析中得到應用。
三、采樣原理與技術
近紅外光譜分析的采樣技術具有相當大的選擇彈性,可依不同樣品性質或環境而改變。一般近紅外光譜儀主要有三種采樣方式(圖1) 。其中以漫反射式較為常用。
如圖2所示,當光束入射到粉末狀的晶粒層時,一部分光會在各晶粒面產生鏡面反射,另一部分會折射入表層晶粒內部,經部分吸收后射至內部晶粒界面,再發生反射,折射吸收,如此反復多次,最后由粉末表層朝各個方向輻射出來,此輻射光稱為漫反射光。
四、應用范圍近紅外分光光度法具有快速、準確、對樣品無破壞的檢測特性,不僅可用于對“離線”供試品的檢驗,還能直接對“在線”樣品進行檢測,可廣泛地應用于藥品的理化分析。
(一)化學分析
1.定性分析
可對藥品的活性成分、輔料、制劑、中間產物、化學原料以及包裝材料進行鑒別。
2.定量分析
可定量測定藥品的活性成分和輔料;測定某些脂肪類化合物的化學值,如羥值、碘值和酸值等,水分的測定,羥基化程度測定以及溶劑量的控制。
3.過程控制
(二)物理分析
1.晶型和結晶性、多晶性、假多晶性和粒度測定。
2.溶出行為、崩解模式、硬度測定。
3.薄膜包衣性質檢測。
4.制劑過程控制,如對混合和制粒過程的監測。
五、溶劑
除了2.7~3.0μm區域外大多數溶劑都可以在近紅外區使用,幾種代表性溶劑的光譜區如圖6.2所示,同時附有最佳使用光程。因為分子間鍵合作用存在,近紅外光譜帶受溶劑影響很大,因此在進行未知物分析時,標準物與樣品必須使用同一種溶劑。
六、儀器和儀器性能指標的控制
(一)儀器
近紅外分光光度計的記錄波長范圍為780~2500nm(按波數計算為12800~4000 cm-1)。所有近紅外光譜的測定分為透射和反射兩種類型。近紅外分光光度計由光源、單色器(或干涉儀)、檢測器、數據處理和評價系統等組成。常用的單色器有聲光可調型、光柵型和棱鏡型。高強度的光源石英殼鎢燈,如石英鹵素鎢燈光源較為穩定。檢測器常用的材料有硅、硫化鉛、砷化銦、銦鎵、汞鎘碲和氘代硫酸三甘肽。常規的普通樣品池、光纖探頭,液體透射池、積分球是一些常用的采樣裝置。需根據供試品的類型選擇合適的檢測器和采樣系統。
(二)儀器性能指標的控制
1.波長使用在780~2500nm (按波數計算為12800~4000 cm-1)范圍內具有特征吸收的合適的標準物質(例如含鏑、鈥、鉺等稀土氧化物)進行波長的校驗,在校驗的波長范圍內至少需檢查三個波長。對于傅立葉變換型的儀器,可以使用一個已被證明過的標準物質的狹窄譜線進行驗證。可接受的波長不確定度為:1200nm±1nm(830 cm-1±8 cm-1),1600 nm±1nm(6250 cm-1±4 cm-1), 2000 nm±1.5nm(5000 cm-1±4 cm-1)。
2.光線度性用一組透光率或反射率已知標準物質檢查分光光度計的線性。使用標準物質檢查儀器相應值的穩定性。
3.儀器的分辨率近紅外光譜儀的分辨率是指儀器對于緊密相鄰的峰可以分辨的最小波長間隔,表示儀器實際分開相鄰兩的能力,它是最重要的儀器指標之一,也是儀器質量的綜合反映。
儀器的分辨率主要取決于儀器分光系統的性能,對于色散型儀器而言,其分辨率取決于分光后狹縫截取的波段精度,狹縫越小截取的波段越窄,分辨率越高。但隨之而來的是能量急劇下降,靈敏度不斷降低,為了兼顧檢出靈敏度,就不能讓狹縫無限制的縮小來提高分辨率,因此,要讓色散型的儀器分辨率達到0.1 cm-1,又能得到一張質量良好的譜圖是很困難的事。而對于傅立葉型的近紅外光譜儀,有多路通過的特點,無狹縫的限制,儀器的分辨率僅僅取決于干涉采樣數據點的多少,即取決去動鏡移動的距離,而動靜的移動由激光控制,因此可以很輕松的得到一張高質量,高分辨的譜圖。
4.波長準確度
波長的準確度是指儀器所顯示的波長值和分光系統實際輸出單色光的波長值之間相符的程度。波長準確度可用波長誤差,即上述兩值之差來表示。保證波長準確度是近紅外光譜儀器能夠準確測試樣品的前提,是保證分析結果準確的前提。近紅外分析結果是通過用已知化學值的標準樣品的建立的模型來分析待測樣品,如果波長準確度不能保證,整組數據就會因波長的移動(即X軸發生了平移)而使每個數據產生偏差,造成分析結果的誤差。同時,模型傳遞也會受到影響。波長準確度主要取決于光學系統的結構,此外還受到溫度的影響。傅立葉近紅外光譜儀因內部裝有波長校正系統,儀器的光學結構簡單,干涉儀只有一個動鏡是運動部件,且運動速度又受到高穩定的氦-氖干涉系統的監視,加之在傅立葉儀器中使用了單色性能極好的氦-氖干涉系統作為采樣標尺,因此測量的重復性和準確度都非常高。而色散型儀器和濾光片型的儀器需要使用已知波長且性質穩定的標準物質經常進行校正,因此波長準確度較低。
5.波長精密度波長精密度又被稱為波長重復性,是指對同一樣品進行多次掃描,光譜峰位置間的差異程度或重復性,通常用多次測量某一譜峰所得波長的標準差來表示。波長精密度是體現儀器穩定的一個重要指標,取決于光學系統的結構,與波長準確度一樣,也會影響分析結果的準確性。儀器的光學系統可動部件越少則儀器的波長精密度越高。
6.信噪比信噪比就是樣品吸光度與儀器吸光度噪聲的比值。儀器吸光度噪聲是指在一定的測試條件下,在確定的波長范圍內對樣品進行多次測量,得到光譜吸光度的標準差,儀器的噪聲只要取決于儀器光源的穩定性、電子系統的噪聲、檢測器產生的噪音以及環境產生的噪聲,比如電子系統設計不良、儀器接地不良、外界電磁干擾等因素都會使儀器的噪聲增大。信噪比使近紅外光譜儀非常重要的指標之一,直接影響分析結果的準確度和精確度;因為近紅外光譜分析是一門弱信號的提取技術,在一個很強的背景信號下提取出相對較弱的有用信息,得到分析結果,所以信噪比顯得尤為重要。一般測試信噪比的方法分為兩種,一種是峰-峰值,另一種是均方根值(RMS),其中峰-峰值更能客觀的反映出信噪比。
7.雜散光強度
雜散光是指分析光以外被檢測器接收的光,主要是由于光學期間表面的缺陷、光學系統設計不良以及機械零件表面處理不佳等因素引起的,尤其是色散型近紅外光譜儀器的設計中,雜散光的控制非常關鍵,往往是導致儀器測量出現非線性的主要原因。雜散光對分析測量的影響在分析高吸光度樣品時更為明顯。抗雜散光能力越強,儀器的靈敏度越高。傅立葉型近紅外光譜儀檢測器上檢測到的信號,不是光的實際信號,而是按照f=2vυ(其中f-調制頻率;v-動鏡移動速度;υ-波數)調制的聲頻信號,故外界高雜散光不會干擾檢測,可當作直流分量處理。一般情況下,傅立葉型儀器的雜散光信號可以忽略不計,同時其優秀的抗干擾能力也保證了它有良好靈敏度和高的信噪比。只有在考察光柵型儀器時才需要考慮這個指標。
8.軟件功能以及數據處理能力
軟件是現代近紅外光譜儀器的主要組成部分,軟件一般有光譜采集軟件和化學計量學處理軟件兩部分組成。不同公司的軟件差異較大,光譜化學計量學軟件一般由譜圖的預處理、定性或定量校正模型的建立和未知樣品的預測三大部分組成。有些公司的軟件的只能化程度較高,可以推薦最佳主成分維數等指標,適于初學者和經驗豐富的科學工作者使用;有些軟件的只能化程度則差些,僅僅適合經驗豐富的使用者。
七、影響近紅外光譜的主要因素
影響近紅外光譜的主要因素有樣品溫度、樣品的含水量和殘留溶劑、樣品厚度、樣品的光學性質、多晶型和樣品的實際儲存時間等。
八、應用近紅外分光光度法進行定性、定量分析的基本要求
(一)定性分析
首先建立參考譜庫,然后進行數據預處理和數據評估,最后對數據庫的專屬性和耐用性進行驗證。
1.參考譜庫的建立
記錄適宜數量批數的某物質的譜圖,這批物質必須按照建立好的質量標準已進行了全面的測試,并包含了該物質的各種信息(如生產企業、物理形態、粒度等的不同)。該套光譜包含了各種鑒別信息,據此可用該譜庫對被測物質進行鑒別。
2.數據預處理
建立一個分類或校正模型前,必須對譜圖進行某種數學預處理,典型的方法有多元散射校正、Kubelka-Munk變換,能使噪音降低的譜圖壓縮技術以及譜圖一階或二階導數的數學計算法,在某些情況下可采用歸一化法。做任何數學轉換時必須防止基礎信息丟失或人為信息的引入,因此在所有情況下使用數學轉換的合理性必須用文件闡明。
3.數據評估
數據評估時將被測物質的譜圖在數學相關性或其他向平的算法基礎上直接與譜庫中單一或平均參考譜圖比較,有多種不同的計算方法;主成分分析與聚類分析連用、SIMCA(soft independent modeling by class analogy)及近紅外儀器中使用的其他軟件。
4.數據庫的驗證
(1)專屬性
專屬性的驗證系指利用數據庫鑒別陽性化合物時能給出正確的結果,并足以區分陰性化合物。應使用一些與譜庫中的物質在化學結構上相近的物質進行挑戰性驗證,驗證結果應能將這些物質與譜庫中的物質區分。對譜庫中有代表性而未用于建庫(如不同批次、混合樣)的同類樣品,進行驗證時應能給出陽性結果。
(2)耐用性
在預處理和校正算法的參數沒有改變的情況下,考查分析中正常操作條件有微小變化的影響;
①不同操作者、環境條件(如實驗室中的溫度、濕度)變化的影響。
②樣品溫度、樣品在光學窗口的位置、探頭的深度以及被測物質的包裝狀況的影響。
③儀器部件或進樣裝置的更換。
(二)定量分析
首先建立一個校正模型的參考譜庫,然后進行數據的預處理,最后進行方法學驗證。
1.校正模型的參考譜庫的建立
首先記錄某指標含量已知、適宜數量樣品的光譜集,然后建立近紅外光譜與樣品某指標含量聯系起來的數學模型。可以使用任何一個經過校正、能夠清楚而確切地由數學表達并給出正確結果的定量校正方法,常用的方法由多元線性回歸法、主成分回歸法和偏最小二乘法等。
2.數據的預處理
系指近紅外譜圖數據的數學變換,目的室在建立校正模型前增強光譜特征和(或)去除(或降低)不需要的變異源。根據應用目的可選擇適宜的數據預處理和校正算法。
3.方法學驗證
近紅外定量分析的方法學驗證與其它分析方法的要求相似。對于每一個被驗證的參數,其可被接受的限度范圍必須與該方法應用的目的一致。通常應考慮專屬性、線性、范圍、準確度、精密度、耐用性和界外點。
九、近紅外模型的經常性評價當被測物質物理性質發生改變,或物質的來源改變時均有必要對已建立的定性模型進行再驗證。當樣品組成發生變化、生產工藝發生改變及原料的來源(或級別)發生改變時,則需要對已建立的定量模型進行再驗證。
十、近紅外模型的傳遞
當近紅外模型傳遞到另一臺儀器上時,必須考慮儀器型號、數據格式、光譜范圍、數據點數量、光譜分辨率等。必須用有代表性的樣品(樣品數量依據模型確定)在一臺儀器上建立模型,這批樣品分別在建立模型儀器和另一臺儀器掃描光譜,用建立模型儀器上所建立的模型分別預測兩臺儀器掃描的光譜,對兩臺儀器測定結果進行統計驗證,以確證該模型在另一儀器上是否有效,否則另一臺儀器所使用的模型應予重建。