電話:86-0755-23229824
手機:18948346937 / 13510373651
地址:深圳市寶安區沙井街道后亭茅洲山工業園工業大廈全至科技創新園科創大廈11層C
微信:
微信客服號:
抖音官方號:
基于高光譜技術檢測香水梨硬度的研究
香水梨又名軟兒梨,屬于秋子梨的一個品種,主要分布于甘肅、寧夏境內。在寧夏海原地區,香水梨是當地農民的主要收入來源,近年來種植面積不斷擴大,然而目前仍存在很多技術上的問題需要解決。硬度作為梨果的一個重要參數,與香水梨的成熟度,口感,食用性息息相關,傳統的檢測方法具有明顯的破壞性,不適用于大規模量產的地區,因此利用光譜學技術建立一種香水梨的硬度檢測方法顯得尤為重要。高光譜技術作為一種高效、快速、無損的檢測技術,目前已廣泛應用于水果內部指標的檢測。因此,結合當地需求,本文通過對光譜數據進行 4 種預處理方法,3 種特征波長的提取方法處理后,選擇一種最優模型來預測香水梨硬度。
一、材料與方法
1.1 樣品采集
實驗樣品全部來自于寧夏回族自治區海原縣方堡村,樣品自采摘后于 24 h 內運輸至寧夏大學,在寧夏大學冷庫內進行保存,貯藏溫度 0 ~ 2 ℃。樣品測試前需將樣品從冷庫取出,放置在 20 ℃恒溫條件下 24 h,待樣品中心溫度恢復至 20 ℃開始檢測。
①光譜采集儀器。Hyper Spec VIS/NIR 高光譜成像系統,光譜范圍為 400 ~ 1000 nm 和 125 波段的超高光譜影像可見 / 近紅外光譜儀系統。包括 v10e-qe 高光譜影像光譜儀、C8484-05G-CCD- 相機、90-254vac 線性光源、Dcrih 鹵素燈、傳輸裝置、計算機和數據采集軟件。②硬度檢測。硬度計HLY-YD5。③數據處理軟件。ENVI5.3,The Unscrambler X 10.4,MATLAB R2014a。以上軟、硬件由寧夏大學提供。
二、結果與分析
2.1 PLSR初模型的建立及評價方法
偏最小二乘回歸(PLSR)是一種多元回歸方法,用于建立分析樣品光譜響應與參考值之間的驗證模型。相對于其他模型直接考慮因變量和自變量而建立回歸模型的方法,PLSR 則是重新過濾信息,選擇最佳變量,再對篩選出的變量進行建模。因此,其篩選出的光譜值決定了建模成功率的高低。一般來說,評價 PLSR 模型成功率的指標有 3 個:預測樣本集的標準差(RMSEP)、校正集的均方根誤差(RMSEC)、決定系數(R2)。一般情況下,R2值越大,RMSEP 和 RMSEC 越小,表明模型的預測能力越強。使用 ENVI5.3 提取香水梨樣本的感興趣區域(Region Of Interesting,ROI)感興趣區域必須具有一定的代表性,可以代表香水梨樣品的硬度指標。為了獲得具有代表性的光譜值,在選取 ROI 時要盡量避免過于灰暗的部分,選擇香水梨整體光量部分,記錄每個樣本 ROI 的平均光譜。將每個樣品提取出的光譜值和硬度數據導入至 The Unscrambler X 10.4,選擇 PLSR 進行初步的模型建立。初始模型效果如圖 1 所示。
由圖 1 可知,樣品初始模型效果不佳,數據點不連續,R2值為 0.782。因此,需要對光譜進行處理后,達到降噪均勻優化光譜的目的,再進行 PLSR 預測模型。
2.2 預處理方法的選擇
采集到的光譜圖像由于光源強度不均勻及噪音等因素的影響,可能在某種程度上會存在基線漂移等現象,為了提取出有效的光譜信號,消除光源強度不均勻的問題,需要對原始光譜數據進行預處理,為后續的光譜數據處理提供更加具有代表性的光譜區域。本文采用以下幾種方法進行預處理。
2.2.1 卷積平滑法
卷積平滑(Savitzky-Golay ,S-G)是一種對光譜進行平滑處理的方式,主要包括移動平均法、高斯濾波法、中值濾波法和 S-G 卷積平滑法。
2.2.2 歸一化法
歸一化(Normaliaze)是一種行式轉換算法,適用于光譜信號與樣品函數關系的分析,或者利用其他光譜值代替樣品檢測值的方法。通過計算機變換,最終使光譜數據在同一范圍內,變量和均值的分布更加均勻。
2.2.3 標準正態變換法
標準正態變換(Standard Normal Variate,SNV)是一種通過樣品的方差對光譜進行校正的方法,SNV 可以有效的消除光源強度不一、散射噪聲等檢測時出現的干擾,通過線性變換對初始光譜數據標準化進行校正,減小樣本因為表面散射、光譜遷移等因素帶來的誤差。經過上述預處理后模型結果如表 1 所示,歸一化法擁有較小的 CV 值和較大的 R2值,表明其對結果的預測效果較好,因此后續的特征光譜提取均采用歸一化法作為光譜的預處理方法。
2.3 特征波長的提取
2.3.1 競爭性自適應加權算法
競爭性自適應加權算法(CARs)是模仿“適者生存”理論而提出的特征變量選擇算法。CARs 算法的核心是首先采用自適應重加權采樣技術,優選出 PLSR 模型中絕對值大的回歸系數所對應的波長變量點,然后借助指數衰減函數,最后將 RMSECV 最小的子集定義為最優變量子集。使用 Matlab運行 CARs 程序多次后,選擇CV值最小的波長組作為特征波長,一共12條,將12條特征波長導入Unscrambler 后建模得到模型如圖2所示,其RMSEC值為0.659,R2為 0.764。
2.3.2 區間變量迭代空間收縮法
區間變量迭代空間收縮法(i VISSA)的主旨思想是選擇最優區間,然后根據最優選區間再進行建模,該算法來自于VISSA 算法,之后結合全局和局部搜索,智能地優化波長的寬度、組合及間隔。在局部搜索上,i VISSA 算法使用光譜數據的連續性信息來確定波長間隔的寬度,在全局搜索上,主要搜索信息波長的組合和位置。最終用迭代的方式優化光譜間的數據間隔,確定光譜的組合、位置以及寬度。使用 Matlab 運行 i VISSA 程序多次后,選擇 CV 值最小的波長組作為特征波長,一共 66 條,將 66 條特征波長導入Unscrambler 后建模得到模型如圖3所示 , 其 RMSEC 值為0.666,R2為 0.760。
2.3.3 變量組合集群分析法
變量組合集群分析(VCPA)是一種新興的特征變量識別算法,該方法的特點是充分考慮了變量集之間可能存在的影響。方法的計算原理是,首先通過利用二進制矩陣采樣法對樣本空間進行重采樣,之后將數據隨機劃分為若干子集,針對子集分別建立子模型,最后對子模型一一進行評價。一般情況下,VCPA 算法計算過程如下:①先利用二進制矩陣采樣法,對樣本變量進行采樣,選取目標函數 CV 值最小的變量子集;②計算每個波長點對應的化學值或者實測值,在本次迭代計算過程中出現的概率;③通過衰減函數篩選出概率較小的波長范圍或者波長點,達到縮小變量集空間的目的;④最后將保留的變量重復上述過程將剩余變量進行組合,最終得到特征波長變量。使用 Matlab 運行 VCPA 程序多次后,選擇 CV 值最小的波長組作為特征波長,共 10 條,將 10 條特征波長導入Unscrambler 后建模得到模型如圖4所示,其 RMSEC 值為0.351,R2為 0.933。
三、結論
對香水梨硬度原始光譜進行了 3 種預處理后,選擇歸一化法為最佳方法,以此作為基礎光譜,對比 3 個特征波長建模后的 PLSR 模型效果,最終選擇 VCPA 法,其提取特征波長10個,建立的 PLSR 模型優于初始模型,R2=0.933,可以用作一種快速檢測香水梨硬度的方法。