題目
利用高光譜圖像提取小波特征識別花生霉變
應(yīng)用關(guān)鍵詞
連續(xù)小波變換;高光譜圖像;真菌感染;花生
背景
花生是世界上大部分地區(qū)種植和消費的最重要的油籽作物之一,但是容易受到真菌感染,其中黃曲霉毒素是一種劇毒、致突變和致癌物質(zhì)。因此,有必要對發(fā)霉花生進(jìn)行檢測,防止其進(jìn)入食物鏈,從而保護(hù)人類和動物免受危害。高光譜成像技術(shù)將成像技術(shù)和近紅外光譜技術(shù)集成到一個系統(tǒng)中,可以同時提供空間和光譜信息,已被許多學(xué)者用于檢測谷物和油籽(包括玉米)中的真菌。
高光譜圖像中的高維數(shù)據(jù)會增加數(shù)據(jù)進(jìn)一步處理的計算量,不利于應(yīng)用于在線檢測系統(tǒng)中。因此,在進(jìn)一步分析之前,通常會對高光譜圖像進(jìn)行特征約簡。目前使用的特征約簡方法可以分為兩類:特征選擇(偏最小二乘回歸、連續(xù)投影算法、遺傳算法)和特征提?。ㄖ鞒煞址治觥⒕€性判別分析、非參數(shù)加權(quán)特征提取)。除了這些常用的特征約簡方法外,連續(xù)小波變換(Continuous wavelet transform, CWT)是一種有效的特征提取方法,已成功地用于高光譜圖像的信息提取。它可以將原始光譜數(shù)據(jù)分解成不同的幅度和尺度,以方便識別細(xì)微特征,并提供與原始高光譜波段直接可比的信息。然而,CWT很少用于鑒定谷物和油籽中的真菌感染。
因此,在本研究中,我們將CWT與傳統(tǒng)的光譜特征提取方法進(jìn)行比較,以確定其在霉變花生鑒定中的性能。本研究的重點是提取敏感小波特征(Wavelet feature, WF),并對其在花生霉變鑒定中的魯棒性進(jìn)行了測試。研究目標(biāo)是:(1)了解霉變花生的光譜特征;(2)確定適合鑒定霉變花生的CWT;(3)通過比較WF與SPA(Successive projection algorithm)選擇的最佳波段來檢驗CWT在霉變花生鑒定中的性能。
試驗設(shè)計
中國礦業(yè)大學(xué)蔣金豹團(tuán)隊使用GaiaSorter(江蘇雙利合譜)獲得了健康、霉變20天、霉變30天后的花生高光譜圖像。光譜成像系統(tǒng)由光譜范圍為920 ~ 2530 nm的高光譜相機(Image-λ-N25E-HS)與標(biāo)準(zhǔn)C-mount變焦鏡頭(F/2, F = 22.5 mm, HSIA-OLES22)連接而成。將花生樣品置于10 cm × 10 cm的黑色托盤中,獲取高光譜圖像,如圖1所示。
圖1 花生樣品。前3張用于訓(xùn)練集,后4張用于測試集。
CWT是一種線性運算算法,通過該運算,高光譜反射光譜可以通過使用不同波長和尺度的母小波函數(shù)轉(zhuǎn)換為系數(shù)集。其公式如下所示:
|
(1) |
式中,a和b分別為表示小波寬度和位置的縮放因子和位移因子,為待分析的光譜反射率,Wf(a,b)為小波系數(shù),為母小波函數(shù)。母小波函數(shù)公式如下所示:,
|
(2) |
在本研究中,由于吸收特征的形狀與標(biāo)準(zhǔn)高斯函數(shù)相似,因此選擇墨西哥帽作為母小波基。為了減少計算量,我們只在尺度21、22、23、…、27下取小波冪。
Jeffries-Matusita(J-M)距離是一種靈活、直觀的特征可分性指標(biāo),被廣泛用于指導(dǎo)特征選擇。J-M距離范圍從0到2,J-M距離越大,說明兩類可分的概率越大,反之亦然。在本研究中,利用J-M距離對不同尺度和波長的小波系數(shù)進(jìn)行評價,用于WF的選擇。
霉變花生仁的連續(xù)分解導(dǎo)致許多WF是冗余的,因此需要一種特征選擇方法來識別最重要的特征。首先,以墨西哥帽為母小波,在不同尺度下對每個花生籽粒的原始高光譜反射率數(shù)據(jù)進(jìn)行CWT分解。將原始光譜轉(zhuǎn)換為不同波長和尺度的小波系數(shù)集合;其次,通過計算健康花生和霉變花生樣品之間的J-M距離,構(gòu)建J-M距離尺度圖;最后,按照J(rèn)-M距離的降序?qū)μ卣鬟M(jìn)行排序,并使用閾值J-M距離來劃定前1%的特征。閾值所圈定的特征在J-M的距離尺度圖上形成了一個分散的特征區(qū)域。理論上,特征區(qū)域中的所有特征都是被選中的WF。然而,它們攜帶了冗余的光譜信息,因為同一區(qū)域的特征是在連續(xù)的波長位置和尺度上產(chǎn)生的。具體流程如圖2所示。
本研究使用SPA選擇最佳波段與WFs的分類結(jié)果進(jìn)行比較。使用的分類模型為偏最小二乘判別分析(PLS-DA)和支持向量機(SVM)。評價指標(biāo)為靈敏度、特異度和準(zhǔn)確率。
圖2 圖像處理流程
結(jié)論
健康花生在1208 nm、1472 nm、1747 nm、1938 nm、2145 nm和2329 nm處可見6個顯著的吸收峰(圖3),主要歸因于花生對水、蛋白質(zhì)和油成分相關(guān)的C-H、N-H和O-H的吸收。在1000 ~ 1500 nm波長范圍內(nèi),健康花生和霉變花生的光譜曲線形狀有明顯差異?;ㄉl(fā)霉后1118 nm處的反射率降低,吸收峰減弱。在1365 ~ 2486 nm波長范圍內(nèi),霉變花生的反射率值高于健康花生,這可能由于真菌的入侵會導(dǎo)致胚乳變得多孔,從而導(dǎo)致發(fā)霉的果仁比健康的果仁散射更多的光。
圖3 健康花生和霉變花生的光譜響應(yīng)。黑點表示健康花生的吸收峰,垂直虛線表示SPA選擇的最佳波長。
前1%特征的閾值J-M值為1.70,利用該閾值得到了5個對霉變花生敏感的小波特征區(qū)域(圖4中橙色區(qū)域)。對發(fā)霉花生敏感的特征區(qū)域集中在1000 ~ 1500 nm,其中光譜曲線形狀有明顯差異(圖3),這些結(jié)果符合CWT分析基于光譜曲線形狀而不是反射率大小的事實。最終選取了5種用于霉變花生和健康花生分類的WF,分別為WF1, 1005、WF1, 1045、WF4, 1410、WF1, 1422、WF5, 1518。
對原始光譜反射率進(jìn)行SPA,最終確定了1005 nm、1208 nm、1450 nm、1927 nm、2078 nm、2190 nm和2251 nm為霉變花生鑒定的最佳波段(圖3)。最佳波段和WFs之間只有一個共同波段(1005 nm)。這主要是由于兩種方法的選擇標(biāo)準(zhǔn)不同,CWT主要捕獲光譜形狀的差異,而SPA主要選擇共線性最小的波段。
圖4 連續(xù)小波分析提取WFs的J-M距離圖
花生籽粒尺度分類結(jié)果如圖5和表1所示。對于訓(xùn)練數(shù)據(jù),無論使用WFs還是最優(yōu)波段,都可以正確識別出健康和霉變花生。相比之下,對于測試數(shù)據(jù),使用兩種分類器的WFs在三個閾值上的總體精度都優(yōu)于最佳波段。此外,WFs的敏感性和特異性高于或等于使用最優(yōu)波段的模型,說明WFs在健康花生和霉變花生的分類中具有更好的性能。CWT的兩個主要優(yōu)點可以解釋其在鑒定霉變花生方面的優(yōu)越性。CWT可以隔離不同尺度的吸收特征,將窄吸收特征和寬吸收特征區(qū)分為低尺度和高尺度。這種特性的好處是可以實現(xiàn)對WFs的完整研究,從而實現(xiàn)光譜特征的最佳選擇。
本研究使用閾值來確定花生仁是否發(fā)霉。從理論上講,越小的閾值越好,因為它可以避免將發(fā)霉的花生識別為健康花生。反之,如果閾值越小,健康花生仁被識別為發(fā)霉的可能性就越大,可能會因錯誤丟棄而造成經(jīng)濟損失。因此,確定閾值至關(guān)重要??紤]到不同分類器使用0.05、0.1和0.15閾值的分類結(jié)果,本文建議采用折中閾值0.1。但是,未來還需要探索一種可靠的閾值確定方法。此外,盡管本研究表明,利用CWT結(jié)合高光譜成像技術(shù)可以以相對較高的精度識別霉變花生,但本研究獲得的特征和模型可能仍未準(zhǔn)備好應(yīng)用于多品種花生的霉變識別。然而,文中描述的特征提取和建模方法可以作為開發(fā)核心算法的參考。此外,本研究將真菌感染不同時間獲得的霉變花生樣品作為一類處理,在未來的研究中,將通過測量黃曲霉毒素的含量來定量確定感染水平。
圖5 SVM對訓(xùn)練集使用最優(yōu)波段(a)和WF(b)進(jìn)行籽粒尺度分類,對測試集使用最優(yōu)波段(c)和WF(d)進(jìn)行籽粒尺度分類
表1 霉變花生仁鑒定結(jié)果
作者信息
蔣金豹,博士,中國礦業(yè)大學(xué)地球科學(xué)與測繪工程學(xué)院教授,博士生導(dǎo)師。
主要研究方向:資源環(huán)境遙感、工業(yè)遙感、農(nóng)業(yè)保險遙感、深度學(xué)習(xí)。
參考文獻(xiàn):
地址:無錫市梁溪區(qū)南湖大道飛宏路58-1-108
電話:13810664973
郵箱:info@dualix.com.cn
地址:北京市海淀區(qū)中關(guān)村大街19號
電話:13810664973
郵箱:info@dualix.com.cn
地址:陜西省西安市高新區(qū)科技一路40號盛方科技園B座三層?xùn)|區(qū)
電話:13810664973
郵箱:info@dualix.com.cn
地址:成都市青羊區(qū)順城大街206號四川國際大廈七樓G座
電話:13810664973
郵箱:info@dualix.com.cn