電話:86-0755-23229824
手機:18948346937 / 13510373651
地址:深圳市寶安區(qū)沙井街道后亭茅洲山工業(yè)園工業(yè)大廈全至科技創(chuàng)新園科創(chuàng)大廈11層C
微信:
微信客服號:
抖音官方號:
1、引言
面對現(xiàn)今用來進行地物識別的遙感數(shù)據(jù)的數(shù)量以及種類越來越多,需要進行處理實際問題也越來越復(fù)雜的情況,單純地對一種算法進行改進已經(jīng)不能滿足解決問題的需要,然而集成學(xué)習(xí)方法可以較好地解決該問題。集成學(xué)習(xí)方法按照分類器之間的種類關(guān)系可以分為異態(tài)集成學(xué)習(xí)和同態(tài)集成學(xué)習(xí)兩種。異態(tài)集成學(xué)習(xí)指的是使用各種不同的分類器進行集成,它的優(yōu)勢在于異態(tài)集成學(xué)習(xí)中的某種基本算法會對某類特定數(shù)據(jù)樣本比其他的基本算法更為有效,得到的效果也會更好;同態(tài)集成學(xué)習(xí)是指集成的基分類器都是同一類分類器,只是基分類器之間的參數(shù)有所不同,它針對各種不同的數(shù)據(jù)類型用抽樣與集成進行結(jié)合,對原始訓(xùn)練集進行一系列抽樣,產(chǎn)生多個分類器,然后用投票或合并的方式輸出最終結(jié)果。
決策樹的研究為這兩種集成方式提供了研究平臺,利用決策樹來進行特征提取也是其中的一個研究方向,然而有學(xué)者提出決策樹在構(gòu)建過程中進行特征選擇有不足之處:決策樹中出現(xiàn)的特征是有等級的,淺節(jié)點的特征明顯要比深節(jié)點處的特征更為重要,如果直接綜合每個節(jié)點的特征來進行特征選擇,就完全忽略了這種等級特性,有可能使特征子集的潛在作用得不到發(fā)揮。因此如何正確地使用決策樹來進行特征選擇也是一個研究熱點,這也是輪轉(zhuǎn)森林(Rot-F)提出的出發(fā)點。輪轉(zhuǎn)森林對特征進行深層劃分,將原特征集隨機分為多個小的特征子集,利用PCA(主成分分析)變換得到的系數(shù)對原數(shù)據(jù)集進行改變,以此來建立樹的過程要明顯優(yōu)于普通決策樹在分叉過程中對原始數(shù)據(jù)的分類性能。然而決策樹對遙感數(shù)據(jù)的分類往往會出現(xiàn)過分類的現(xiàn)象,所以考慮將具有自學(xué)習(xí)和自組織能力的徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(RBFN)與之進行結(jié)合,用輪轉(zhuǎn)森林轉(zhuǎn)換各子集后的數(shù)據(jù)樣本作為神經(jīng)網(wǎng)絡(luò)的輸人,對應(yīng)轉(zhuǎn)換后的樣本類標作為網(wǎng)絡(luò)的輸出,以此來構(gòu)造多個子分類器集。通過將原數(shù)據(jù)集進行分化的方法,構(gòu)造多個內(nèi)部參數(shù)差異較大的同態(tài)集成基分類器,提升總體的分類精度,集成兩種方法的優(yōu)勢達到對遙感地物的識別更加精確。
2、Rot-F和RBFNN的集成算法
異不顯著 (表 2)。對樹體水勢的研究結(jié)果表明,3個地塊中只有8號地內(nèi)不同生長勢植株間有顯著的差異:生長勢強的樹中庸樹其樹體水勢顯著高于弱樹; 其他兩塊地樹勢間無顯著差異。輪轉(zhuǎn)徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)首先是利用輪轉(zhuǎn)森林對特征集的轉(zhuǎn)換,得到多個新的特征子集,并將改變后的數(shù)據(jù)用于RBFN的分類過程。對原始數(shù)據(jù)集的處理過程如下:將原始數(shù)據(jù)按照特征集隨機分為多個小的特征子集數(shù)據(jù)塊,之后在每個特征子集的數(shù)據(jù)塊中依據(jù)數(shù)據(jù)實例進行重采樣,將重采樣后的數(shù)據(jù)小塊進行主成分分析,使得到的各特征值的重要性程度系數(shù)與原數(shù)據(jù)集進行相應(yīng)的乘積變動。因采樣過程得到的數(shù)據(jù)塊要小于原始數(shù)據(jù)塊,所以得到特征集的大小也就不同,以新特征集作為各個RBFN基分類器的輸人來訓(xùn)練模型和預(yù)測數(shù)據(jù)。
為了利用訓(xùn)練樣本集來構(gòu)建這些子分類器,需要進行以下幾個步驟:
1)隨機的將F分為K個子集,這些子集可能是相對獨立的,也有可能是相互交叉重復(fù)的。為了最大可能地增加多樣性,選用相對獨立的特征子集。同時為簡化計算,假定K是一個可調(diào)的變量,那么對于每個特征子集所包含的特征個數(shù)為M=n/K。
2)定義Fi,j為Di個子分類器用來進行訓(xùn)練的第j個特征子集。利用Botstrap進行隨機抽樣選取一組數(shù)據(jù)樣本,抽樣的比例為該子集數(shù)據(jù)的75%。僅利用Fi,j中的M個特征進行PCA變換,將得到的主成分系數(shù)進行存儲,每個系數(shù)的維數(shù)為M×1。對于上述的矩陣,得到的特征值有可能是0,所以可能得不到所有的M個向量,即Mj≤M。因此通過在這些子集中運用PCA技術(shù)而不是在所有的數(shù)據(jù)集中應(yīng)用,其目的就是為了避免在不同的子分類器中對于相似特征子集產(chǎn)生類似的系數(shù)。
3)將所獲得的帶有主成分系數(shù)的向量進行綜合,構(gòu)造一個具有稀疏性的輪轉(zhuǎn)矩陣Ai,
4)用來進行訓(xùn)練Di個子分類器的訓(xùn)練數(shù)據(jù)集為XAi*,將這樣的訓(xùn)練集作為輸人對RBFN進行訓(xùn)練來建立神經(jīng)網(wǎng)絡(luò)模型,訓(xùn)練部分分為兩個階段:
(1)訓(xùn)練輸人層和隱含層之間的徑向基函數(shù),即確定基函數(shù)的中心和方差。隱含層的徑向基函數(shù)有多種形式,最常用的是高斯函數(shù)。
(2)訓(xùn)練隱含層和輸出層之間的線性權(quán)值。通過采樣和樣本聚類生成RBFN的中間節(jié)點參數(shù),中間層狀態(tài)確定法選用K-means聚類,該方法采用最小平方誤差和作為分類準則,通過迭代獲得聚類中心點集,即中間層的狀態(tài),節(jié)點個數(shù)等于聚類數(shù)。
3)該集成模型解決的是一個c類的模式分類問題,集成的規(guī)模為P(即有P個子分類器)通過期望的輸人輸出編碼映射關(guān)系對P個成員網(wǎng)絡(luò)進行訓(xùn)練。
3、數(shù)據(jù)的選取及實驗結(jié)果分析
實驗區(qū)采用扎龍濕地,它位于黑龍江省西部,烏裕河下游齊齊哈爾市及富裕、林甸、杜蒙、泰來縣交界地域。扎龍濕地保護區(qū)是以蘆葦沼澤為主的內(nèi)陸濕地和水域生態(tài)系統(tǒng)。它是中國北部最完整、最原始和廣闊的濕地生態(tài)系統(tǒng),已被列人國際重要濕地名錄。該地區(qū)地物類型主要包括鹽堿地、草地(包括蘆葦)、水體、沼澤(輕度和重度沼澤歸為一類)這些具有比較代表性的類物。選用的遙感圖像為2001-10-05獲取的xandsatETMI圖像,圖像大小為500X500像素,待分類圖像采用TM影像7個波段中的3、2、1共3個波段的真彩色合成圖像,如圖1所示。
圖 1 研究區(qū)域影像
經(jīng)目視判讀,結(jié)合土地利用現(xiàn)狀圖,確定濕地影 像區(qū)域內(nèi)主要包括六大類地物:鹽堿地、草地、水域、 沼澤地、受火區(qū)域以及農(nóng)用地(包括農(nóng)用耕地和農(nóng)用居住地)。
xandsatTM+ETMI影像的3、2、1波段組合能較好地反映土地植被特征。根據(jù)目視判讀結(jié)果,并且結(jié)合土地利用現(xiàn)狀圖和2003年5月/11月的實地調(diào)查資料,在真彩色合成影像上共選取1700個樣本點,其中1020個像素點作為輪轉(zhuǎn)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,340個像素點作為校驗樣本,剩余的340個用來測試分類精度.為進一步減小輸人數(shù)據(jù)的不同所造成不同算法之間的差異性,將所有的原始輸人數(shù)據(jù)都歸一化到[-1,1]之間,具體結(jié)果如下表1所示 。分別應(yīng)用樸素貝葉斯(NB)方法、傳統(tǒng)徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)方法(RBFN)、普通輪轉(zhuǎn)森林方法(RotationForest)方法、文獻中的方法(Rot-Bost)、隨機森林方法(RandomForest)以及本文方法(Rot-RBFN)對所選的區(qū)域ETMI遙感影像進行分類,分類結(jié)果如圖2。對應(yīng)每個類標的分類 結(jié)果量化后如表2所示.由表2和圖2的6幅分類效果圖可以看出隨機森林算法對水體的分類精度要高,但是對于訓(xùn)練樣本較少的鹽堿地和草地以及農(nóng)用地等分類,精度要低于本文方法,本文方法的精度分別達到了0.917,0.6,0.795。而且從圖中可以看出采用決策樹作為基分類器的分類方法中出現(xiàn)了過分類現(xiàn)象,所以有較多的斑點出現(xiàn),文獻中的方法雖然在農(nóng)用地的精度上要略高一些,但是對于 其他幾類地物出現(xiàn)了明顯分辨不出的情況。此外,從圖2可以看出,本文方法雖沒有NB方法看起來清晰、明亮,但從精度上卻明顯優(yōu)于NB算法。
表 1 波段值和總體樣本數(shù)目
將上述結(jié)果采用R-C曲線下面積(A0C)的大小以及用誤差矩陣的主要參考指標總體精度和Kappa系數(shù)來進行評估。其中Kappa系數(shù)是綜合整個誤差矩陣的信息提出的一個精度表達系數(shù),可以比較不同分類器的誤差矩陣在精度上的差異,得到 的結(jié)果如表4所示。從表3結(jié)果可以看出,本文方法在A0C、Kappa系數(shù)和總體精度上都比其他幾種算法高,分別達到了0.909,0.6138和68.4211,相比于其他5種常用的算法,本文方法效果更好。A0C值越大說明該分類器的分類結(jié)果越靠近于R-C坐標的縱軸,對應(yīng)分類器的分類效果和泛化性能也就越好;Kappa系數(shù)越高則說明對應(yīng)該算法的過度擬合情況越小,也就從側(cè)面說明該分類器所建模型的泛化能力越強。而總體精度則從準確率方面說明所提方法的有效性更強。從上述3個方面來說,本文方法更能給出較高的分類精度和較好的泛化性能。從算法耗時來講,本文方法耗時稍微較長一些,達到24.21s。而其他幾種算法的耗時基本在10s左右。
圖 2 不同分類器的分類結(jié)果
4、總結(jié)
應(yīng)用遙感技術(shù)測定NDVI能快速評價葡萄生長勢的差異,為確定與之相適應(yīng)的栽培管理技術(shù)決策提供依據(jù),其結(jié)果數(shù)據(jù)可以更好地與越來越廣泛的機械化操作相適應(yīng),從而提高釀酒葡萄原料質(zhì)量均一性,保證獲得高品質(zhì)的葡萄酒。這一技術(shù)在未來葡萄生產(chǎn)中使用具有廣闊的前景。
表 2 不同校驗樣本的生產(chǎn)者精度對比表
表 3 不同算法下評價指標結(jié)果比較
推薦:
便攜式地物光譜儀iSpecField-NIR/WNIR
專門用于野外遙感測量、土壤環(huán)境、礦物地質(zhì)勘探等領(lǐng)域的最新明星產(chǎn)品,由于其操作靈活、便攜方便、光譜測試速度快、光譜數(shù)據(jù)準確是一款真正意義上便攜式地物光譜儀。
無人機機載高光譜成像系統(tǒng)iSpecHyper-VM100
一款基于小型多旋翼無人機機載高光譜成像系統(tǒng),該系統(tǒng)由高光譜成像相機、穩(wěn)定云臺、機載控制與數(shù)據(jù)采集模塊、機載供電模塊等部分組成。無人機機載高光譜成像系統(tǒng)通過獨特的內(nèi)置式或外部掃描和穩(wěn)定控制,有效地解決了在微型無人機搭載推掃式高光譜照相機時,由于振動引起的圖像質(zhì)量較差的問題,并具備較高的光譜分辨率和良好的成像性能。
便攜式高光譜成像系統(tǒng)iSpecHyper-VS1000
專門用于公安刑偵、物證鑒定、醫(yī)學(xué)醫(yī)療、精準農(nóng)業(yè)、礦物地質(zhì)勘探等領(lǐng)域的最新產(chǎn)品,主要優(yōu)勢具有體積小、幀率高、高光譜分辨率高、高像質(zhì)等性價比特點采用了透射光柵內(nèi)推掃原理高光譜成像,系統(tǒng)集成高性能數(shù)據(jù)采集與分析處理系統(tǒng),高速USB3.0接口傳輸,全靶面高成像質(zhì)量光學(xué)設(shè)計,物鏡接口為標準C-Mount,可根據(jù)用戶需求更換物鏡。