多光譜成像結合多變量分析的單株紫花苜蓿種子品種鑒別
摘要:快速準確地辨別苜蓿品種對生產者、消費者和市場監管者來說至關重要。然而,傳統的苜蓿品種鑒別程序既費時又費力。在這項研究中,評估了一種新方法的潛力,該方法使用多光譜成像結合對象多變量圖像分析來區分具有單個種子的紫花苜蓿品種。應用主成分分析(PCA)、線性判別分析(LDA)和支持向量機(SVM)三種多元分析方法,根據其形態和光譜特征對12個苜蓿品種的種子進行區分。結果表明,形態特征和光譜數據的結合可以為不同品種的紫花苜蓿種子進行多變量分析提供一個極其簡潔的過程,而僅用種子的形態特征無法進行分類。LDA 測試集的種子分類準確率為91.53%,SVM 為 93.47%。因此,多光譜成像結合多變量分析可以提供一種簡單、穩健和無損的方法來區分苜蓿種子品種。
Abi700、Boja、Maverick、Ranger、Sutter、uc-1465、Fado、Vernal、Zhongmu1、Zhongmu3、Dongmu1、Zhonglan2 12個苜蓿品種由甘肅寒旱區種質資源庫提供。種子被保存在平均溫度為-18°C的儲藏室的防水袋中,直到2020年1月用于成像。種子照片如圖1所示。
圖1.12種苜蓿的種子圖像
當我們將PCA應用于形態特征時,前三個原理成分解釋了種子之間原始方差的 67.41%,PC1、PC2 和 PC3 分別為 35.40、20.28 和 11.73%(圖 2a)。 對于光譜特征,前三個主成分的解釋方差率分別為總方差的 60.56、25.63 和 9.33%(圖2b)。此外,基于形態特征和種子光譜的 PCA 結果還表明,前三個主成分解釋了種子之間原始方差的 65.98%,PC1、PC2和 PC3 分別為 31.60、19.59 和 14.79%(圖 2c)。然而,無論是基于形態學、光譜數據或其組合的PCA得分圖都未能將不同品種的種子分成12個不同的組。
圖2.(a)形態學、(b)光譜學和(c)形態學與12個品種的光譜特征數據集結合的前三個主成分(PC)的三維圖
總的來說,12個品種種子的反射率表現出相似的趨勢,波長越長,反射率越高(圖3)。然而,在每個波長下,品種之間的反射率存在顯著差異。例如,法朵在365~780 nm光譜范圍內的反射率值明顯高于其他品種,而在850~970 nm范圍內的反射率值低于除中木1、中木3、春夏、冬木以外的其他品種。1和Zhonglan2。12個品種的種子根據其對365~540 nm和880~970 nm的光反射率可分為3組。第一組只包括法朵,第二組包括中木1、中木3、東木1和中蘭2,第三組包括阿比700、博雅、馬克里克、游俠、薩特UC-1465和弗納爾。對于 uc-1465、Boja和 Maverick,它們表現出非常相似的反射率模式,在 365 到 540 nm 范圍內具有最低值,在780到970nm范圍內具有最高值。
圖3.12個紫花苜蓿品種的19個波長(nm)的平均光反射率
如前所述,基于不同的數據源開發了兩種多元判別分析模型:形態特征數據、光譜特征數據以及形態和光譜特征數據的組合。結果表明,基于形態特征數據的LDA 模型對訓練和獨立測試數據集的分類準確率分別為 43.63% 和 42.22%。另一方面,法多與其他品種有明顯的距離,其他11個品種無法分開(圖4a)。相比之下,LDA 模型的準確度在光譜數據的基礎上得到了極大的提高,在訓練和測試數據集上分別表現出高達 87.50% 和 86.81% 的辨別準確度(補充表 S4)(圖 4b)。當使用組合形態特征和光譜數據時,總體正確分類率在訓練集和測試集分別為 91.96%、92.44% 和 91.53%。然而,不同品種的分類精度差異很大。例如,分類Fado的準確率是100%,而中牧3的準確率低至LDA的11.67%。
圖4.基于(a)形態,(b)光譜和(c)形態結合光譜特征的線性鑒別分析(LDA)模型用于鑒別紫花苜蓿12個品種種子的得分圖
對于具有形態數據的LDA模型,前5個特征解釋了總變異的72.98%,其次是寬長比 (24.60%)、直徑面積 (15.56%)、緊湊橢圓 (15.33%)、偏心率 (10.13%) , 和寬度 (7.36%), 表明品種之間的形態區分主要基于形狀特征 (圖 5a)。對于光譜數據,470 nm (12.75%)、490 nm (9.74%)、940 nm (8.79%)、430 nm (7.44%)、970 nm (7.28%) 是前五個特征加起來 LDA的 46.00% 變化(圖5c)。對于形態和光譜數據的組合(圖5e),寬度/長度比(15.53%)、直徑面積(11.60%)、緊湊橢圓(8.81%)、偏心率(5.76%)和寬度(5.14%)是前5個特征,占LDA變異的46.86%,說明形態特征對品種鑒別有很大貢獻。
圖5.LDA和支持向量機 (SVM) 模型的形態、光譜和形態結合光譜特征的相對重要性。(a)LDA的形態特征
相關閱讀
Videometer種子表型組學:多光譜成像作為菠菜種子健康檢測的潛在工具
Videometer種子表型組學:多光譜圖像分析在種子種質庫管理中的應用
Videometer種子表型組學:利用可見光、近紅外多光譜和化學計量學對不同番茄種子品種的分類
Videometer種子表型組學:使用多光譜成像和化學計量學方法在線鑒別水稻種子
Videometer種子表型組學:使用多光譜成像預測蓖麻種子的活力
Videometer種子表型組學:甜菜種子加工損傷的多光譜圖像分類
種子表型組學:利用多光譜成像和化學計量學方法對大豆種子進行無損鑒別
種子表型組學:Videometer多光譜成像種子質量評估的新工具
種子表型組學:基于可見-近紅外多光譜圖像數據的偏最小二乘判別分析檢測菠菜種子的發芽能力和胚芽長度
種子表型組學:使用灰度共生矩陣和機器學習技術識別單倍體玉米種子
種子表型組學:通過射線照相和多光譜圖像分析測定小麥種子中的侵染