背景
烟叶成熟度分为田间成熟度和烘烤成熟度。田间成熟度是烟叶在田间的生长情况。烘烤成熟度是烤制后烟叶成熟的情况。合适的田间成熟度是获得高品质烟叶的基础。
烟叶田间成熟度影响着烤后质量的好坏,包括色泽、香气、油分等。目前,鉴别烟叶田间成熟度的方法是通过烟农肉眼鉴别,鉴别质量参差不齐、效率低且可靠性差。因此,建立一种能直接在田间鉴别烟叶成熟度的方法很有必要。
研究方法
本实验采用近红外光谱技术和图像识别技术结合机器学习算法,建立相应的烟叶成熟度鉴别模型,最 后通过分析对比各个模型的分类效果,寻找最合适的烟叶成熟度检测方法。
实验主要于2019年在大理两不同烘烤工场进行,选择烤烟品种K326,上、中和下部位各采集鲜烟叶样本2431、2401和2400个,共采集7232个样本,每个样本都进行了近红外光谱的采集。
图1. 光谱采集位置分布示意图
实验用海洋光学NIRQuest近红外光谱仪采集样本光谱,配件包含标准探头和漫反射白板,积分时间为5 ms,光谱范围为900-2500 nm,开机预热30 min,优化光谱仪扫描条件后进行近红外光谱扫描,扫描时每个样本在视线范围内避开主脉在左右两侧各取3个点扫描(见图1),所有点的平均值作为该烟叶的代表光谱。
数据采集及处理
近红外光谱含大量噪声,预处理有助于提取和分析有用信息。不同预处理方法导致不同的预测结果。因此,为探索不同预处理方法对模型构建的影响,试算了一阶导数、二阶导数、标准正态变换(SNV)四种经典预处理方法、多元散射校正(MSC)结合Savitz-Golay平滑和归一化进行对比分析。
图2. 烟叶近红外光谱图(a)原始光谱,(b)预处理后光谱
从上部烟叶样本训练集中随机抽取450个样本,按2:1比例分组,选择合适的预处理方法。实验随机重复五次,取平均值作为结果。发现与原始光谱比,预处理后的光谱鉴别准确度有所提高。
经对比发现一阶导数处理的光谱数据可获得更好的分类结果。因此,在随后的分类实验中,选择其作为上、中、下烟叶光谱的预处理方法。预处理前后的光谱如图2所示。
值得注意的是,不同的预处理方法对CNN模型的分类结果影响较小。这表明,与其他方法相比,用于开发NIR模型的CNN方法对预处理的依赖性较小。
表1. 不同预处理方法的判别准确率(%)
模型对比及结论
作者随后采用主成分分析法(PCA)对烟叶各成熟度水平的光谱数据进行聚类分析,发现样本数据显著重叠,无法分离。因此,有必要开发一种更强大的多分类方法来区分不同成熟度的烟叶。考虑到CNN强大的特征提取和学习能力,它可能是一个不错的选择。
图3. 上部烟叶五个成熟度水平NIR光谱方差的PCA得分图
为对比CNN模型的性能,建立了KNN、BPNN、SVM和ELM模型进行比较分析。证实了CNN模型在区分烟叶成熟度方面的出色分类能力。
表2. CNN和其他四种方法的预测结果(%)
结论
本实验研究了近红外光谱结合深度学习方法对新鲜烟叶成熟度水平进行分类的潜力。近红外光谱技术是一种非常有用的工具,可准确、无损地测定烟叶的内部和外部品质。实验表明,CNN方法具有很强的特征提取和学习能力,对分类精度有着有利的影响。为进一步准确识别烟叶成熟度、研制烟叶采收机奠定基础,从而提高烟叶的生产效益。
特别鸣谢
特别感谢云南烟草农业研究院陈颐老师及贵州大学烟草学院老师及其实验室其他成员的工作及对海洋光学的支持和信任。