欢迎您来到博普特科技官方网站!
电话 010-82794912

Food Chemistry: X | 基于种子多光谱成像与机器学习算法的生菜品种鉴别(Videometer)-广东省农业科学院、华南农业大学

Seed multispectral imaging combined with machine learning algorithms for distinguishing different varieties of lettuce (Lactuca sativa L.)

Jinpeng Wei a,b,1 , Zhangyan Dai b,1 , Qi Zhang b,1 , Le Yang a,b , Zhaoqi Zeng b,c ,
Yuliang Zhou a,* , Jun Liu b,* , Bingxian Chen b,*
该研究由广东省农业科学院与华南农业大学联合完成,发表于《Food Chemistry: X》,针对传统生菜品种鉴定方法耗时费力、效率低下的痛点,首次整合多光谱成像技术与机器学习算法,建立了快速、无损、高精度的生菜品种鉴定方法,为生菜种子品质检测和品种纯度鉴定提供了全新技术方案,也为其他作物的品种识别提供了参考。

研究背景和目的

背景:生菜是全球广泛种植和消费的叶菜类蔬菜,品种资源丰富(包括茎用型、叶用型、散叶型、直立型等),市场需求持续增长,但不同生菜品种对种植环境要求差异显著,准确鉴定品种是保障产量和品质的关键。传统生菜品种鉴定依赖形态学观察(需完整生长周期,60-90 天)和分子标记技术(SSR、SAMPL 等),存在耗时久、操作复杂、成本高、对专业要求高等问题;且生菜遗传多样性相对有限,分子标记需高信息含量引物,应用受限。多光谱成像(MSI)技术兼具光谱与计算机视觉优势,可快速获取样本形态和光谱特征,具有无损、高效、操作简便等特点,已成功应用于燕麦、番茄、咖啡豆等作物的品种鉴定,但在生菜品种识别中的系统研究尚未开展。

研究目的:利用多光谱成像技术采集不同生菜品种种子的形态和光谱数据,提取关键特征;对比支持向量机(SVM)、随机森林(RF)、反向传播神经网络(BP)、线性判别分析(LDA)四种机器学习算法的品种鉴定性能;建立最优的生菜品种无损鉴定模型,实现快速、准确的品种区分,为农业生产中的种子纯度检测和品种筛选提供技术支撑。

核心试验方法

①多光谱图像采集:仪器:丹麦 Videometer Lab4 多光谱成像系统,含 19 个窄带 LED 光源(365-970 nm,覆盖紫外、可见、近红外波段),图像分辨率 2192×2192 像素,像素尺寸 40 μm;采集流程:仪器经白板、黑板、圆点板校准后,将种子均匀铺于培养皿(无接触),置于积分球中采集多光谱图像,每个品种分 3 次重复(100 粒 / 次)。

②特征提取:形态特征:提取 14 项指标,包括二进制特征(面积、长度、宽度)、形状特征(长宽比、圆形紧密度、椭圆紧密度等)、颜色特征(CIELab L*、a*、b*、饱和度、色调);光谱特征:提取 19 个波段的平均反射率数据(365-970 nm)。

③数据预处理与降维:数据预处理:通过 Blob Toolbox 分离种子与杂质、背景,确保特征提取准确性;降维分析:采用主成分分析(PCA)和归一化典型判别分析(nCDA)进行数据降维,探索品种间特征差异。

④模型构建与评价:算法选择:构建四种机器学习模型 ——SVM(径向基核函数)、RF(500 棵决策树)、BP(多层感知器,梯度下降优化)、LDA(最大化类间距离、最小化类内方差);数据集划分:按 7:3 比例随机划分训练集和测试集,采用十折交叉验证和随机搜索优化模型参数,避免过拟合;评价指标:准确率(Accuracy)、精确率(Precision)、召回率(Sensitivity)、F1 值,通过混淆矩阵分析分类误差。

⑤批量验证:采用不同生产批次的种子(预测验证组)验证最优模型的稳健性,评估模型对批次差异的适应性。

15个生菜品种在可食期营养器官的形态学研究

15个生菜品种种子形状特征差异的箱线图分析:(A) 紧实度圆形分布 (B) 紧实度椭圆形分布 (C) 宽长比分布 (D) BetaShpe_a分布 (E) BetaShpe_b分布 (F) 垂直偏度分布。图中不同小写字母表示同形状品种间存在显著差异(P < 0.05)。

15个生菜品种种子在19个波长(nm)下的平均光反射率折线图,不同颜色代表不同生菜品种,误差线表示±标准偏差。

基于15种生菜品种多光谱数据的PCA二维评分散点图。基于以下数据的前两个主成分(PCs)二维平面图:(A)形态学与光谱融合特征数据;(B)形态学特征数据;(C)15种生菜品种的光谱特征数据。

基于15个生菜品种的多光谱数据的nCDA二维评分散点图。基于15个生菜品种的(A)形态学与光谱融合特征数据、(B)光谱特征数据、(C)形态学特征数据。

本研究展示了15种生菜品种种子的RGB、nCDA及PCA转换图像。其中nCDA和PCA图像基于19个波长的多光谱数据,对所有生菜品种进行了标准化转换。图中采用从低到高的nCDA和PCA值进行颜色渐变(图例说明:红色对应2.00,绿色对应0.00,蓝色对应−2.00)。关于图例中颜色标注的解读,请参阅本文网络版说明。

研究结论

1.多光谱成像技术可有效提取生菜种子的形态和光谱特征,15 个品种的种子在形态指标(面积、长宽比、CIELab 颜色参数)和光谱反射率(365-970 nm)上存在显著差异:形态特征间:面积与长度、宽度呈极显著正相关(P<0.01),长宽比与椭圆紧密度呈极显著正相关(P<0.01);颜色特征间:CIELab L与 a、饱和度呈极显著正相关(P<0.01);光谱与形态特征间:紫外、可见光波段前 3 个波长与二进制特征(面积、长度、宽度)呈显著正相关,远红外波段与面积呈显著正相关。

2.基于形态 + 光谱融合特征的LDA 模型是生菜品种鉴定的最优模型,测试集准确率 92.7%,不同批次种子的验证准确率达 93.2%,稳定性和泛化能力强;

3.该方法实现了生菜品种的快速、无损、高精度鉴定,解决了传统方法的痛点,可广泛应用于农业生产中的种子纯度检测、品种筛选和质量控制,也为其他作物的品种识别提供了技术参考。

北京博普特科技有限公司是丹麦Videometer多光谱成像系统的中国区总代理,全面负责其系列产品在中国市场的推广、销售和售后服务。