基于BPSO和SVM的烤煙煙葉圖像特征選擇方法研究
發(fā)布時(shí)間:2019-08-24 來(lái)源: 歷史回眸 點(diǎn)擊:
摘要:利用圖像特征對(duì)煙葉進(jìn)行分級(jí)時(shí),提出了一種對(duì)煙葉圖像特征進(jìn)行有效選擇的新方法——利用二進(jìn)制粒子群算法聯(lián)合SVM模型自適應(yīng)地選擇對(duì)煙葉分級(jí)影響較大的特征,剔除對(duì)分級(jí)影響較小或相互間有關(guān)聯(lián)的某些特征,并利用Adaboost和RBF分類器進(jìn)行驗(yàn)證。結(jié)果表明,用SVM分類器時(shí),用被選特征比輸入全部特征具有更好的分級(jí)正確率;對(duì)于相同的分類器,利用二進(jìn)制粒子群和SVM算法自適應(yīng)篩選后的特征比輸入全部特征具有更好的分級(jí)吻合率。
關(guān)鍵詞:煙葉;二進(jìn)制粒子群;支持向量機(jī);特征選擇
中圖分類號(hào):TP181 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2015)02-0449-04
DOI:10.14088/j.cnki.issn0439-8114.2015.02.050
Methods of Selecting Image Feature of Tobacco Leaf Based
on BPSO Combined with SVM
YANG Fan, SHEN Jin-yuan
。⊿chool of Information Engineer, Zhengzhou University, Zhengzhou 450001, China)
Abstract: A method combining binary particle swarm optimization(BPSO) with SVM algorithm was proposed to select the important features for grading tobacco. Adaboost and RBF with the features selection was used to verify the conclusion. Results showed that the accuracy of SVM was improved by the new method. The adaptive feature selection of BPSO combined with SVM improved the accuracy of the tobacco grading with same model.
Key words: tobacco leaf; BPSO; SVM; feature selection
目前,我國(guó)煙葉分級(jí)主要還是依靠人工進(jìn)行分級(jí),這種方法存在著主觀性強(qiáng)、效率低等缺點(diǎn),因此近年來(lái)研究人員在煙葉智能分級(jí)方面進(jìn)行了研究。煙葉的智能識(shí)別方法主要有利用煙葉的化學(xué)特征、光譜特征和圖像特征。其中,利用圖像特征對(duì)煙葉進(jìn)行分級(jí)有著對(duì)煙葉無(wú)損、設(shè)備簡(jiǎn)單、效率較高等優(yōu)點(diǎn),能夠解決人工檢測(cè)方法的各種缺點(diǎn),因此有著廣闊的應(yīng)用前景,研究人員在這一領(lǐng)域進(jìn)行了大量的研究[1-3]。在圖像特征的基礎(chǔ)上,人們使用了多種分類器對(duì)煙葉進(jìn)行分級(jí),包括支持向量機(jī)[4,5]、神經(jīng)網(wǎng)絡(luò)[6-8]、主成分分析[9]、模糊識(shí)別[10]、粗糙集[11]等方法。但是在之前的研究中通常采用獲得的所有圖像特征進(jìn)行訓(xùn)練和分類,而一些特征如長(zhǎng)、寬、長(zhǎng)寬比、面積、周長(zhǎng)等之間存在著很大的相關(guān)性,同時(shí)由于特征數(shù)目多使得分級(jí)模型復(fù)雜、計(jì)算量大,不僅造成訓(xùn)練模型所需時(shí)間長(zhǎng),而且分級(jí)時(shí)所需要的時(shí)間也長(zhǎng),這對(duì)于收購(gòu)煙葉的實(shí)時(shí)要求是非常不利的。另外,特征數(shù)目多、模型復(fù)雜,建立訓(xùn)練模型時(shí)所需要尋找的參數(shù)多,參數(shù)之間又互相影響,這可能影響到最佳參數(shù)的選擇,因而影響到分級(jí)模型的正確分級(jí)率。因此對(duì)特征進(jìn)行有效篩選,減少特征數(shù)目對(duì)于煙葉自動(dòng)分級(jí)是必要而有意義的[12,13]。本研究提出一種與結(jié)果直接相關(guān)的特征選擇方法,在去除那些相關(guān)性較大的特征改善煙葉圖像識(shí)別效果的同時(shí),還可以減短分類器訓(xùn)練和分級(jí)時(shí)間而加快分級(jí)速度。
粒子群算法(PSO)屬于進(jìn)化算法的一種,這種算法以其實(shí)現(xiàn)容易、精度高、收斂快等特點(diǎn)引起了學(xué)術(shù)界的重視,并且在解決實(shí)際問(wèn)題中展示了其優(yōu)越性,其中二進(jìn)制粒子群(BPSO)是將PSO算法離散化的一種改進(jìn)算法。支持向量機(jī)(SVM)是一種經(jīng)典的模式識(shí)別方法,其在解決小樣本、非線性及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì),也曾被應(yīng)用于煙葉的分類中。本研究使用BPSO并聯(lián)合SVM算法對(duì)煙葉的圖像特征進(jìn)行選擇,并分別使用SVM、RBF和Adaboost算法進(jìn)行了驗(yàn)證。
1 烤煙煙葉特征提取
煙葉分級(jí)主要是對(duì)煙葉的部位、顏色、等級(jí)進(jìn)行分類,其中部位為B(上部)、C(中部)、X(下部)3種,等級(jí)根據(jù)不同品質(zhì)可能有3種或者4種,顏色分為F(檸檬黃)、L(橘黃)、R(紅棕色)3種。在這3個(gè)部分的基礎(chǔ)上,我國(guó)最新發(fā)布的煙葉分級(jí)標(biāo)準(zhǔn)將烤煙煙葉分為了42個(gè)等級(jí)。
本研究采用的烤煙煙葉圖片為使用CCD攝像頭在暗箱中拍攝獲取的煙葉透射圖像(圖1),因?yàn)橄啾确瓷鋱D片,透射圖片能更好的體現(xiàn)厚度等特征。在對(duì)煙葉圖像進(jìn)行背景分割、降噪等一系列預(yù)處理后在對(duì)其進(jìn)行特征提取,本研究提取8個(gè)外形特征:長(zhǎng)、寬、長(zhǎng)寬比、面積、周長(zhǎng)、破損率、圓形度、矩形度;12個(gè)顏色特征:R、G、B和H、S、I的均值和方差;4個(gè)紋理特征:能量、慣性、相關(guān)性、熵。
2 基于BPSO和SVM的特征篩選
2.1 PSO算法
粒子群算法是1995年由Eberhart和Kennedy 提出的一種進(jìn)化算法,來(lái)源于對(duì)鳥群捕食的行為研究。PSO初始化即為一個(gè)覓食的鳥群,其中每只鳥為一個(gè)隨機(jī)粒子(隨機(jī)解),每個(gè)初始粒子的位置都是隨機(jī)的。由一個(gè)速度參數(shù)來(lái)決定它們位置變化的快慢,而每個(gè)粒子的位置優(yōu)劣都由一個(gè)適應(yīng)度值(Fitness value)來(lái)評(píng)價(jià)。在每一代中,整個(gè)族群找到的最優(yōu)解被稱為全局極值(gbest),每個(gè)粒子本身所找到的最優(yōu)解被稱為這個(gè)粒子的個(gè)體極值(pbest)。在每一代進(jìn)化中,每個(gè)粒子通過(guò)跟蹤gbest和pbest兩個(gè)極值來(lái)不斷更新自己和自己的速度,然后通過(guò)迭代找到最優(yōu)解。
熱點(diǎn)文章閱讀