電話:86-0755-23229824
手機(jī):18948346937 / 13510373651
地址:深圳市寶安區(qū)沙井街道后亭茅洲山工業(yè)園工業(yè)大廈全至科技創(chuàng)新園科創(chuàng)大廈11層C
微信:
微信客服號(hào):
抖音官方號(hào):
產(chǎn)地是影響山楂品質(zhì)的重要因素之一,目前對(duì)于各類農(nóng)產(chǎn)品產(chǎn)地的溯源主要是依靠化學(xué)分析技術(shù),如高效液相色譜技術(shù)(HPLC)、氣相-質(zhì)譜聯(lián)用技術(shù)(GC-MS)、超高效液相色譜(UPLC)等,這些方法通常在測(cè)量前需要對(duì)樣本進(jìn)行粉碎或勻漿處理,并使用有機(jī)溶劑對(duì)樣本中的化學(xué)成分進(jìn)行萃取,這一過(guò)程不但會(huì)損壞樣本,同時(shí)有機(jī)溶劑還可能會(huì)對(duì)環(huán)境造成污染。與之相比,高光譜成像技術(shù)是一種基于非常多窄波段的影像數(shù)據(jù)技術(shù),可以在樣本完好的情況下對(duì)其進(jìn)行定性或定量分析,具有快速、無(wú)損、無(wú)污染檢測(cè)的特點(diǎn)。
為滿足市場(chǎng)需求,本文旨在探究高光譜成像技術(shù)在山楂產(chǎn)地識(shí)別中的應(yīng)用及不同采樣方向?qū)τ谀P头诸愋阅艿挠绊?,利用高光譜成像系統(tǒng)(410~2500 nm),分別采集山楂樣本果梗面、側(cè)面及底面的光譜數(shù)據(jù),結(jié)合多種機(jī)器學(xué)習(xí)算法分別建立產(chǎn)地識(shí)別模型,最終實(shí)現(xiàn)基于高光譜成像技術(shù)對(duì)山楂進(jìn)行產(chǎn)地溯源的目的。
一、材料與方法
1.1 材料與儀器
山楂樣品均采自2022年10月至12月,其中山東省2批;山西省3批;遼寧省2批;河北省3批;河南省1批。每個(gè)批次隨機(jī)選擇80~100粒品相完好、大小相近的山楂,最終共采集900粒樣品。使用干布擦拭樣品表面殘留泥土,然后于4℃環(huán)境中冷藏保存,便于后續(xù)圖像采集。
1.2 實(shí)驗(yàn)方法
1.2.1高光譜數(shù)據(jù)采集
樣本圖像采集前,關(guān)閉環(huán)境燈光,打開(kāi)鹵鎢燈并對(duì)高光譜成像系統(tǒng)進(jìn)行預(yù)熱。為探究擺放方式對(duì)山楂產(chǎn)地識(shí)別模型的影響,將山楂樣本以果梗朝上(G)、側(cè)面朝上(C)和底面朝上(D)三種方式擺放(圖1),分別拍攝圖像。采集圖像時(shí),將15~20粒樣本放置在水平移動(dòng)平臺(tái)上,在樣本排列末端放置白板,分別采集三個(gè)方向的圖像數(shù)據(jù)。為減小環(huán)境以及儀器對(duì)圖像數(shù)據(jù)的影響,在圖像采集完成后使用軟件對(duì)原始光譜數(shù)據(jù)進(jìn)行RAD校正。隨后進(jìn)行黑白板校正以消除空氣等外界因素對(duì)圖像的影響并得到相對(duì)反射率,相對(duì)反射率計(jì)算公式如下:
校正完成后,使用軟件ENVI5.3在圖像中手動(dòng)選取感興趣區(qū)域(ROI),對(duì)于不同拍攝方向的樣本圖像,分別取其相應(yīng)部位(即果梗面、側(cè)面和底面)作為ROI,以ROI平均反射率作為樣本的光譜值。手動(dòng)合并兩個(gè)鏡頭得到的光譜數(shù)據(jù),最終得到包含396個(gè)波段反射率的數(shù)據(jù)集。將樣本按照7:3的比例隨機(jī)劃分為訓(xùn)練集和預(yù)測(cè)集,用于后續(xù)分類建模。
圖1三種樣本擺放方式注:a為果梗朝上(G);b為側(cè)面朝上(C);c為底面朝上(D)
1.2.2 主成分分析
本研究在得到樣本光譜原始數(shù)據(jù)后,首先利用PCA方法,對(duì)樣本數(shù)據(jù)進(jìn)行初步的可視化分析。
1.2.3 光譜數(shù)據(jù)預(yù)處理方法
為消除噪聲的影響,分別采用多元散射校正(MSC)、一階導(dǎo)數(shù)(D1)、SG平滑(SG)和標(biāo)準(zhǔn)正態(tài)變量變換(SNV)四種方式對(duì)原始光譜數(shù)據(jù)進(jìn)行預(yù)處理,再使用預(yù)處理后的數(shù)據(jù)進(jìn)行分類建模。
1.2.4特征波長(zhǎng)提取方法
在建立全波段分類模型后,為降低模型復(fù)雜度,分別采用連續(xù)投影算法(SPA)和競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)采樣算法(CARS)對(duì)原始光譜數(shù)據(jù)進(jìn)行特征波長(zhǎng)提取,然后基于特征波長(zhǎng)數(shù)據(jù)建立分類模型,為山楂專屬小型高光譜設(shè)備的開(kāi)發(fā)提供參考。
1.2.5分類模型的建立
對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理或特征波長(zhǎng)提取后,基于處理得到的數(shù)據(jù),分別采用不同方法建立分類模型,并綜合對(duì)比各項(xiàng)評(píng)估指標(biāo)以篩選出最優(yōu)模型。
1.2.6模型評(píng)估
標(biāo)準(zhǔn)模型建立完成后,分別通過(guò)以下指標(biāo)篩選出最優(yōu)模型:準(zhǔn)確率(Accuracy)是分類問(wèn)題最常用的評(píng)價(jià)指標(biāo);精確率(Precision)和召回率(Recall)則反映了模型對(duì)于正例的敏感程度,三個(gè)指標(biāo)計(jì)算公式如下:
本研究通過(guò)建立混淆矩陣,綜合對(duì)比模型指標(biāo),篩選出最優(yōu)分類模型。
二、結(jié)果與分析
2.1 原始光譜曲線分析
在進(jìn)行分類建模前,首先對(duì)各產(chǎn)區(qū)樣本的光譜特征進(jìn)行分析并探究部分特征峰的成因,不同產(chǎn)區(qū)樣本的平均光譜曲線如圖2所示。對(duì)比發(fā)現(xiàn)不同產(chǎn)區(qū)山楂樣品的平均反射率總體趨勢(shì)相似;但是同產(chǎn)區(qū)山楂平均反射率在不同數(shù)據(jù)集(C、G和D)上有所不同,這可以歸因于樣品表面信息的差異。另外,不同產(chǎn)區(qū)山楂樣品的反射率數(shù)值存在一定差異,這些差異主要與樣品的表面信息(如果皮、果斑顏色)和品質(zhì)特性有關(guān),其中山東產(chǎn)區(qū)的山楂在400~800nm波段下的反射率明顯高于其他產(chǎn)區(qū),區(qū)域特征較為明顯,根據(jù)楊曉寧等的研究報(bào)道:相比于其他產(chǎn)區(qū),山東產(chǎn)區(qū)山楂的有機(jī)酸含量較高,這與上述現(xiàn)象相吻合。不同產(chǎn)區(qū)山楂在600~700nm處的吸收峰略有不同,但總體趨勢(shì)相似;對(duì)于短波紅外波段(SWIR),各產(chǎn)地反射率曲線趨勢(shì)相近,但在1000~1200nm處的吸收峰有所區(qū)分。對(duì)不同波段下的吸收峰進(jìn)行分析,700~800nm處的吸收峰可歸因于樣本中的葉綠素;970nm附近的吸收峰可能是水中O-H鍵的伸縮振動(dòng)造成;1200nm附近的吸收峰可能與C-H的第二拉伸泛音有關(guān),可歸因于碳水化合物和脂肪,總體而言,各產(chǎn)地樣本所含化學(xué)成分種類相似,但具體含量存在差異,這與張悅等報(bào)道的不同產(chǎn)地陳皮光譜曲線規(guī)律一致。
對(duì)比各數(shù)據(jù)集的平均反射率曲線(圖2),發(fā)現(xiàn)G數(shù)據(jù)集在700~1000nm處反射率略高于其他數(shù)據(jù)集,而此波段反射率與樣品水分及葉綠素含量密切相關(guān),因此推測(cè)山楂樣本不同部位所含成分略有不同。山東與遼寧產(chǎn)區(qū)樣品的平均反射率在三個(gè)數(shù)據(jù)集上都表現(xiàn)出了較大差異(山東產(chǎn)區(qū)樣品反射率較高,而遼寧產(chǎn)區(qū)樣品則偏低),說(shuō)明兩組樣品差異明顯。光譜平均反射率曲線雖然展現(xiàn)出樣本的部分差異,但是僅憑這些特征很難對(duì)樣本進(jìn)行產(chǎn)地溯源。綜上所述,有必要建立分類模型以挖掘樣品光譜數(shù)據(jù)的潛在特征。
圖2不同產(chǎn)地在VNIR和SWIR波段下的平均反射率曲線
注:a、c、e分別為C、D、G數(shù)據(jù)集在VNIR波段的平均反射率曲線;
b、d、f分別為C、D、G數(shù)據(jù)集在SWIR波段的平均反射率曲線。
2.2 樣本數(shù)據(jù)PCA分析
使用主成分分析(PCA)對(duì)三個(gè)數(shù)據(jù)集進(jìn)行初步的可視化分析,繪制的PCA得分圖見(jiàn)圖3,保留了前兩個(gè)主成分。初步分析發(fā)現(xiàn),無(wú)監(jiān)督模型分類效果并不好,三個(gè)數(shù)據(jù)集前兩個(gè)主成分能解釋的方差占比之和在75%左右。山東與遼寧產(chǎn)地的樣本區(qū)分相對(duì)較好,這與原始光譜分析時(shí)得出的結(jié)論相符。對(duì)于大部分樣本,使用無(wú)監(jiān)督算法進(jìn)行分類的效果并不理想,因此后續(xù)還需要采用PLSDA、SVM和RF方法進(jìn)行有監(jiān)督分類建模。
圖3原始數(shù)據(jù)PCA得分圖注:a、b和c分別為G、C和D數(shù)據(jù)集
推薦:
便攜式高光譜成像系統(tǒng) iSpecHyper-VS1000
專門用于公安刑偵、物證鑒定、醫(yī)學(xué)醫(yī)療、精準(zhǔn)農(nóng)業(yè)、礦物地質(zhì)勘探等領(lǐng)域的最新產(chǎn)品,主要優(yōu)勢(shì)具有體積小、幀率高、高光譜分辨率高、高像質(zhì)等性價(jià)比特點(diǎn)采用了透射光柵內(nèi)推掃原理高光譜成像,系統(tǒng)集成高性能數(shù)據(jù)采集與分析處理系統(tǒng),高速USB3.0接口傳輸,全靶面高成像質(zhì)量光學(xué)設(shè)計(jì),物鏡接口為標(biāo)準(zhǔn)C-Mount,可根據(jù)用戶需求更換物鏡。