高光譜技術(shù)在紅棗分類識(shí)別中的應(yīng)用
發(fā)布者:
發(fā)布時(shí)間:2017-08-28
高光譜技術(shù)在紅棗分類識(shí)別中的應(yīng)用
一、測(cè)試原理及方法:
高光譜成像技術(shù)是近二十年來(lái)發(fā)展起來(lái)的基于非常多窄波段的影像數(shù)據(jù)技術(shù),其最突出的應(yīng)用是遙感探測(cè)領(lǐng)域,并在越來(lái)越多的民用領(lǐng)域有著更大的應(yīng)用前景。它集中了光學(xué)、光電子學(xué)、電子學(xué)、信息處理、計(jì)算機(jī)科學(xué)等領(lǐng)域的先進(jìn)技術(shù),是傳統(tǒng)的二維成像技術(shù)和光譜技術(shù)有機(jī)的結(jié)合在一起的一門新興技術(shù)。
高光譜成像技術(shù)的定義是在多光譜成像的基礎(chǔ)上,在從紫外到近紅外(200-2500nm)的光譜范圍內(nèi),利用成像光譜儀,在光譜覆蓋范圍內(nèi)的數(shù)十或數(shù)百條光譜波段對(duì)目標(biāo)物體連續(xù)成像。在獲得物體空間特征成像的同時(shí),也獲得了被測(cè)物體的光譜信息。
目標(biāo)物體-成像物鏡-入射狹縫-準(zhǔn)直透鏡-PGP-聚焦透鏡-CCD棱鏡-光柵-棱鏡:PGP
圖1 成像原理圖
光譜儀的光譜分辨率由狹縫的寬度和光學(xué)光譜儀產(chǎn)生的線性色散確定。最小光譜分辨率是由光學(xué)系統(tǒng)的成像性能確定的(點(diǎn)擴(kuò)展大?。?。
成像過(guò)程為:每次成一條線上的像后(X方向),在檢測(cè)系統(tǒng)輸送帶前進(jìn)的過(guò)程中,排列的探測(cè)器掃出一條帶狀軌跡從而完成縱向掃描(Y方向)。綜合橫縱掃描信息就可以得到樣品的三維高光譜圖像數(shù)據(jù)。
圖2 像立方體
鏡頭:22mm鍍膜消色差鏡頭;光譜范圍:900nm-1700nm,光譜分辨率:5.36nm@1129.58nm
探測(cè)器像素:320x256;內(nèi)置控制、掃描機(jī)構(gòu);內(nèi)置電池;軟件:控制完成自動(dòng)曝光、自動(dòng)對(duì)焦、自動(dòng)掃描速度匹配;數(shù)據(jù)處理:黑白、輻射度、均勻性、鏡頭等校準(zhǔn);光譜查看。
圖3 高光譜成像儀
本文以不同種類的紅棗作為研究對(duì)象,利用近紅外相機(jī)(光譜范圍900nm-1700nm)采集測(cè)試對(duì)象的高光譜數(shù)據(jù)。
圖4 樣本的RGB圖(R:1235nm G:1409nm B:1536nm)
對(duì)原始數(shù)據(jù)進(jìn)行主成分分析(Principal Component Analysis, PCA),去除波段之間的多余信息、將多波段的圖像信息壓縮到比原波段更有效的少數(shù)幾個(gè)轉(zhuǎn)換波段下。同時(shí)利用由于光譜儀采集得到的光譜信號(hào)中既包含實(shí)驗(yàn)所需的有用信息,同時(shí)由于儀器精密度等原因帶來(lái)隨機(jī)噪聲,最常用的消除噪聲的方法Savitzky-Golay(SG)卷積平滑法,通過(guò)多項(xiàng)式來(lái)移動(dòng)窗口內(nèi)的數(shù)據(jù)進(jìn)行多項(xiàng)式最小二乘擬合信號(hào)平滑,既消除噪聲又保留了光譜輪廓。由于各個(gè)樣本間分布不均勻、樣本大小不一樣、樣本表面散射及光程變化等都會(huì)產(chǎn)生散射影響,采用多遠(yuǎn)散射校正(multiplicative scatter correction,MSC)的方法可以有效的消除這些散射影響。
圖5 經(jīng)PCA處理
分別選取樣本上的兩個(gè)區(qū)域標(biāo)注為駿棗-A和灰棗-B,以此為標(biāo)樣對(duì)其他樣品進(jìn)行歸類識(shí)別。對(duì)已經(jīng)劃分出來(lái)的類別進(jìn)行PLS-DA算法處理,評(píng)估劃分出來(lái)類別成分。
-
分別在前面幾種不同預(yù)處理方法的基礎(chǔ)上,對(duì)樣品進(jìn)行主成分分析聚類。并對(duì)數(shù)據(jù)做PLS-DA算法處理,PLS-DA方法是基于PLS回歸的一種判別分析方法,在構(gòu)造因素時(shí)考慮到了輔助矩陣以代碼形式提供的類成員信息,因此具有高效的鑒別能力。
-
利用主成分分析得到的載荷圖提取對(duì)各類植物識(shí)別敏感的特征波長(zhǎng)。以特征波長(zhǎng)為輸入變量,從每種植物的樣本中隨機(jī)抽取2/3組成建模集,通過(guò)這組樣本的光譜及其對(duì)應(yīng)的基礎(chǔ)數(shù)據(jù),利用簇類的獨(dú)立軟模式 soft independent modeling of class analogy(SIMCA)分類法建立識(shí)別模型,對(duì)樣本進(jìn)行分類。
SIMCA方法為每個(gè)類建立了獨(dú)立的主成分分析(principal component analysis,PCA)模型,然后依據(jù)該模型對(duì)未知樣品進(jìn)行分類。然而,該方法在建立模型時(shí)沒(méi)有考慮到其他的類,因此,在每個(gè)類的模型中,有些因素在獲取類中明顯的變化時(shí)只能反映出有限的鑒別信息。當(dāng)多維數(shù)據(jù)不同類中的子空間都非常接近時(shí),由于類之間不必要的重疊,從而存在產(chǎn)生非優(yōu)化鑒別模型的危險(xiǎn)。
獲取灰棗和駿棗的特征光譜,可以看出,兩種栆的特征光譜位置基本一致,只是其光譜反射率會(huì)有一些差別。具體成因還需進(jìn)一步分析。
圖6 灰棗(紅色)和駿棗(綠色)特征高光譜
圖7 SIMCA方法分類識(shí)別結(jié)果
通過(guò)獲取感興趣的平均光譜,利用(SIMCA)分類法建立識(shí)別模型,對(duì)樣本進(jìn)行分類。預(yù)測(cè)駿棗-A所占比例為65.6%,灰棗-B所占比例為34.4%。
圖8 SIMCA方法分類統(tǒng)計(jì)結(jié)果