留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

不同产地苹果糖度可见近红外光谱在线检测

刘燕德 徐海 孙旭东 姜小刚 饶宇 徐佳 王军政

刘燕德, 徐海, 孙旭东, 姜小刚, 饶宇, 徐佳, 王军政. 不同产地苹果糖度可见近红外光谱在线检测[J]. 中国光学, 2020, 13(3): 482-491. doi: 10.3788/CO.2019-0128
引用本文: 刘燕德, 徐海, 孙旭东, 姜小刚, 饶宇, 徐佳, 王军政. 不同产地苹果糖度可见近红外光谱在线检测[J]. 中国光学, 2020, 13(3): 482-491. doi: 10.3788/CO.2019-0128
LIU Yan-de, XU Hai, SUN Xu-dong, JIANG Xiao-gang, RAO Yu, XU Jia, WANG Jun-zheng. On-line detection of soluble solids content of apples from different origins by visible and near-infrared spectroscopy[J]. Chinese Optics, 2020, 13(3): 482-491. doi: 10.3788/CO.2019-0128
Citation: LIU Yan-de, XU Hai, SUN Xu-dong, JIANG Xiao-gang, RAO Yu, XU Jia, WANG Jun-zheng. On-line detection of soluble solids content of apples from different origins by visible and near-infrared spectroscopy[J]. Chinese Optics, 2020, 13(3): 482-491. doi: 10.3788/CO.2019-0128

不同产地苹果糖度可见近红外光谱在线检测

doi: 10.3788/CO.2019-0128
基金项目: 国家自然科学基金(No.31760344);江西省创新能力建设项目(No.S2016-90)
详细信息
    作者简介:

    刘燕德(1967—),女,江西泰和人,博士,教授,博士生导师,1990年、2001年于江西农业大学分别获得学士、硕士学位,2006年于浙江大学获得博士学位,主要从事光电检测技术与装备方面的研究。E-mail:jxliuyd@163.com

    通讯作者: 刘燕德(1967−),女,江西泰和人,博士,教授,博士生导师,1990年、2001年于江西农业大学分别获得学士、硕士学位,2006年于浙江大学获得博士学位,主要从事光电检测技术与装备方面的研究。E-mail:jxliuyd@163.com
  • 中图分类号: O657.33

On-line detection of soluble solids content of apples from different origins by visible and near-infrared spectroscopy

Funds: Supported by National Natural Science Foundation of China(No.31760344); Jiangxi Provincial Project for Innovation Capacity Construction(No.S2016-90)
More Information
  • 摘要: 为了实现不同产地苹果糖度的快速在线无损检测,减少产地差异对近红外光谱检测模型的影响,建立了不同产地苹果糖度的在线检测通用模型。首先,采用水果动态在线检测设备采集了包括栖霞、洛川与会宁3个产地的红富士苹果的漫透射光谱。其次,采用偏最小二乘算法(PLS),结合无信息变量消除(UVE)方法,筛选出58个特征变量,建立了苹果糖度的UVE-PLS通用模型,该模型对个体产地预测集及总预测集的均方根误差分别为0.50~0.74°Brix与0.63°Brix,较原始个体模型分别提高了23.2%~44.4%与35.7%。最后,提出了一个新的外部验证样本集对模型性能进行评价,其残留预测偏差为2.33,预测值在±1.0°Brix和±1.5°Brix误差范围内的占比分别为85%与100%。实验结果表明:建立多个产地苹果糖度的在线检测通用模型,能够提高其他产地样本糖度的预测稳健性,并且采用合适的波长筛选方法能够简化模型。开发不同产地水果内部品质通用模型在波长有限的光谱设备中具有良好的应用潜力。
  • 图  1  漫透射检测机构

    Figure  1.  Mechanism of diffuse transmission detection

    图  2  光谱采集触发装置

    Figure  2.  Trigger device of spectral acquisition

    图  3  样品原始光谱

    Figure  3.  Samples′ original spectra

    图  4  经过MSC的苹果光谱的前3个主成分得分图

    Figure  4.  The first three PC score plot of apple spectra after MSC processing

    图  5  UVE选择变量结果

    Figure  5.  Results of variables selected by UVE

    图  6  UVE-PLS通用模型糖度测量值与预测值的散点图

    Figure  6.  Scatter plots of measured values versus predicted values for SSC by using UVE-PLS universal model

    图  7  糖度测量值与预测值的散点图

    Figure  7.  Scatter plot of measured value versus predicted value of SSC for a new external sample set

    表  1  样本集糖度含量统计

    Table  1.   Statistical values of the SSC(°Brix)for sample sets

    产地校正集预测集
    数量范围平均值标准差数量范围平均值标准差
    11298.8~16.612.931.43439.3~15.512.471.24
    21358.5~16.4131.28418.9~15.112.931.23
    312710.1~18.214.971.214011.7~17.615.031.17
    3918.5~18.213.621.611248.9~17.613.451.64
    下载: 导出CSV

    表  2  单个产地的PLS建模结果

    Table  2.   Results of PLS modeling for single origin

    产地LVs校正集预测集RPD
    $R_{\rm{C}}^2$RMSEC(°Brix)$R_{\rm{P}}^2 $RMSEP(°Brix)
    190.920.400.900.413.02
    2100.890.420.850.472.62
    3110.860.460.800.512.29
    下载: 导出CSV

    表  3  不同产地红富士苹果的预测结果

    Table  3.   Prediction results of Fuji apples from different origins

    产地预测集
    123
    $R_{\rm{P}}^2 $RMSEP(°Brix)$R_{\rm{P}}^2 $RMSEP(°Brix)$R_{\rm{P}}^2 $RMSEP(°Brix)$R_{\rm{P}}^2 $RMSEP(°Brix)
    1//0.540.820.731.240.421.30
    20.540.90//0.671.340.670.98
    30.731.440.721.25//0.681.27
    下载: 导出CSV

    表  4  苹果糖度通用模型预测结果

    Table  4.   Results of SSC of apples predicted by universal modeling

    模型变量数LVs$R_{\rm{C}}^2 $RMSEC(°Brix)$R_{\rm{P}}^2 $RMSEP(°Brix)RPD
    Ori-PLS400120.840.640.850.632.60
    UVE-PLS5880.820.680.850.632.60
    下载: 导出CSV

    表  5  UVE-PLS糖度通用模型的实际性能

    Table  5.   The practical performance of UVE-PLS universal model for SSC

    RMSEP/(°Brix)RPD
    栖霞洛川会宁
    0.670.510.720.642.33
    下载: 导出CSV
  • [1] GIOVANELLI G, SINELLI N, BEGHI R, et al. NIR spectroscopy for the optimization of postharvest apple management[J]. Postharvest Biology and Technology, 2014, 87: 13-20. doi:  10.1016/j.postharvbio.2013.07.041
    [2] FAN SH X, ZHANG B H, LI J B, et al. Effect of spectrum measurement position variation on the robustness of NIR spectroscopy models for soluble solids content of apple[J]. Biosystems Engineering, 2016, 143: 9-19. doi:  10.1016/j.biosystemseng.2015.12.012
    [3] MENDOZA F, LU R F, ARIANA D, et al. Integrated spectral and image analysis of hyperspectral scattering data for prediction of apple fruit firmness and soluble solids content[J]. Postharvest Biology and Technology, 2011, 62(2): 149-160.
    [4] 高升, 王巧华, 李庆旭, 等. 基于近红外光谱的红提维生素C含量、糖度及总酸含量无损检测方法[J]. 分析化学,2019,47(6):941-949.

    GAO SH, WANG Q H, LI Q X, et al. Non-destructive detection of vitamin c, sugar content and total acidity of red globe grape based on near-infrared spectroscopy[J]. Chinese Journal of Analytical Chemistry, 2019, 47(6): 941-949. (in Chinese)
    [5] 史云颖, 李敬岩, 褚小立. 多元校正模型传递方法的进展与应用[J]. 分析化学,2019,47(4):479-487.

    SHI Y Y, LI J Y, CHU X L. Progress and applications of multivariate calibration model transfer methods[J]. Chinese Journal of Analytical Chemistry, 2019, 47(4): 479-487. (in Chinese)
    [6] 王凡, 李永玉, 彭彦昆, 等. 基于可见/近红外透射光谱的番茄红素含量无损检测方法研究[J]. 分析化学,2018,46(9):1424-1431.

    WANG F, LI Y Y, PENG Y K, et al. Nondestructive determination of lycopene content based on visible/near infrared transmission spectrum[J]. Chinese Journal of Analytical Chemistry, 2018, 46(9): 1424-1431. (in Chinese)
    [7] 路皓翔, 徐明昌, 张卫东, 等. 基于压缩自编码融合极限学习机的柑橘黄龙病鉴别方法[J]. 分析化学,2019,47(5):652-660.

    LU H X, XU M CH, ZHANG W D, et al. Identification of citrus huanglongbing based on contractive auto-encoder combined extreme learning manchine[J]. Chinese Journal of Analytical Chemistry, 2019, 47(5): 652-660. (in Chinese)
    [8] 郭文川, 王铭海, 谷静思, 等. 近红外光谱结合极限学习机识别贮藏期的损伤猕猴桃[J]. 光学 精密工程,2013,21(10):2720-2727. doi:  10.3788/OPE.20132110.2720

    GUO W CH, WANG M H, GU J S, et al. Identification of bruised kiwifruits during storage by near infrared spectroscopy and extreme learning machine[J]. Optics and Precision Engineering, 2013, 21(10): 2720-2727. (in Chinese) doi:  10.3788/OPE.20132110.2720
    [9] 郭志明, 黄文倩, 彭彦昆, 等. 自适应蚁群优化算法的近红外光谱特征波长选择方法[J]. 分析化学,2014,42(4):513-518.

    GUO ZH M, HUANG W Q, PENG Y K, et al. Adaptive ant colony optimization approach to characteristic wavelength selection of NIR spectroscopy[J]. Chinese Journal of Analytical Chemistry, 2014, 42(4): 513-518. (in Chinese)
    [10] ZHANG B H, HUANG W Q, GONG L, et al. Computer vision detection of defective apples using automatic lightness correction and weighted RVM classifier[J]. Journal of Food Engineering, 2015, 146: 143-151. doi:  10.1016/j.jfoodeng.2014.08.024
    [11] ZHANG B H, DAI D J, HUANG J CH, et al. Influence of physical and biological variability and solution methods in fruit and vegetable quality nondestructive inspection by using imaging and near-infrared spectroscopy techniques: a review[J]. Critical Reviews in Food Science and Nutrition, 2018, 58(12): 2099-2118. doi:  10.1080/10408398.2017.1300789
    [12] 樊书祥, 黄文倩, 郭志明, 等. 苹果产地差异对可溶性固形物近红外光谱检测模型影响的研究[J]. 分析化学,2015,43(2):239-244.

    FAN SH X, HUANG W Q, GUO ZH M, et al. Assessment of influence of origin variability on robustness of near infrared models for soluble solid content of apples[J]. Chinese Journal of Analytical Chemistry, 2015, 43(2): 239-244. (in Chinese)
    [13] LI X N, HUANG J CH, XIONG Y J, et al. Determination of soluble solid content in multi-origin ‘Fuji’ apples by using FT-NIR spectroscopy and an origin discriminant strategy[J]. Computers and Electronics in Agriculture, 2018, 155: 23-31. doi:  10.1016/j.compag.2018.10.003
    [14] JANNOK P, KAMITANI Y, HIRONAKA K, et al. Development of a near infrared calibration model with temperature compensation using common temperature-difference spectra for determining the Brix value of intact fruits[J]. Journal of Near Infrared Spectroscopy, 2017, 25(1): 26-35. doi:  10.1177/0967033516678516
    [15] 王拓, 戴连奎, 马万武. 拉曼光谱结合后向间隔偏最小二乘法用于调和汽油辛烷值定量分析[J]. 分析化学,2018,46(4):623-629.

    WANG T, DAI L K, MA W W. Quantitative analysis of blended gasoline octane number using raman spectroscopy with backward interval partial least squares method[J]. Chinese Journal of Analytical Chemistry, 2018, 46(4): 623-629. (in Chinese)
    [16] 刘翠玲, 吴静珠, 孙晓荣. 近红外光谱技术在食品品质检测方法中的研究[M]. 北京: 机械工业出版社, 2016.

    LIU C L, WU J ZH, SUN X R. Study on Near Infrared Spectroscopy in Food Quality Testing Methods[M]. Beijing: China Machine Press, 2016. (in Chinese)
    [17] CHANG CH W, LAIRD D A, MAUSBACH M J, et al. Near-infrared reflectance spectroscopy-principal components regression analyses of soil properties[J]. Soil Science Society of America Journal, 2001, 65(2): 480-490. doi:  10.2136/sssaj2001.652480x
    [18] ZHANG D Y, XU L, WANG Q Y, et al. The optimal local model selection for robust and fast evaluation of soluble solid content in melon with thick peel and large size by Vis-NIR spectroscopy[J]. Food Analytical Methods, 2019, 12(1): 136-147. doi:  10.1007/s12161-018-1346-3
    [19] YUAN L M, CAI J R, SUN L, et al. Nondestructive measurement of soluble solids content in apples by a portable fruit analyzer[J]. Food Analytical Methods, 2016, 9(3): 785-794. doi:  10.1007/s12161-015-0251-2
    [20] YUN Y H, LI H D, DENG B CH, et al. An overview of variable selection methods in multivariate analysis of near-infrared spectra[J]. TrAC Trends in Analytical Chemistry, 2019, 113: 102-115. doi:  10.1016/j.trac.2019.01.018
  • [1] 刘燕德, 饶宇, 孙旭东, 肖怀春, 姜小刚, 徐海, 李雄, 徐佳, 王观田.  基于光源发射接收一体化探头的糖度分选线改造研究 . 中国光学, 2020, 13(4): 795-804. doi: 10.37188/CO.2019-0165
    [2] 金文玲, 曹乃亮, 朱明东, 陈伟, 张佩光, 赵庆磊, 梁静秋, 余应弘, 吕金光, 阚瑞峰.  基于近红外超连续激光光谱的水稻种子活力无损分级检测研究 . 中国光学, 2020, 13(5): 1032-1043. doi: 10.37188/CO.2020-0027
    [3] 孙桂芳, 王雅丽, 孟现柱, 史强, 杨冰.  Na5[B2P3O13]晶体的紫外-远红外光谱分析 . 中国光学, 2019, 12(5): 1118-1123. doi: 10.3788/CO.20191205.1118
    [4] 邢笑雪, 王宪伟, 秦宏伍, 商微微, 马玉静.  PbSe量子点近红外光源的CH4气体检测 . 中国光学, 2018, 11(4): 662-668. doi: 10.3788/CO.20181104.0662
    [5] 李欣远, 纪穆为, 王虹智, 涂国鹏, 万晓冬, 刘佳佳, 刘佳, 徐萌, 张加涛.  近红外光热转换纳米晶研究进展 . 中国光学, 2017, 10(5): 541-554. doi: 10.3788/CO.20171005.0541
    [6] 欧阳爱国, 张宇, 程梦杰, 王海阳, 刘燕德.  中红外光谱技术对乙醇汽油乙醇含量的检测 . 中国光学, 2017, 10(6): 752-759. doi: 10.3788/CO.20171006.0752
    [7] 欧阳爱国, 唐天义, 王海阳, 刘燕德.  近红外光谱法检测乙醇柴油主要性能指标 . 中国光学, 2017, 10(3): 363-369. doi: 10.3788/CO.20171003.0363
    [8] 李充, 谢冀江, 潘其坤, 陈飞, 何洋, 张阔.  中红外光学参量振荡器技术进展 . 中国光学, 2016, 9(6): 615-624. doi: 10.3788/CO.20160906.0615
    [9] 穆治亚, 艾华, 樊孝贺, 何昕, 何丁龙, 韩冬松, 于国栋.  采用整体最小二乘法的条纹图配准方法 . 中国光学, 2016, 9(6): 625-632. doi: 10.3788/CO.20160906.0625
    [10] 毕研盟, 王倩, 杨忠东, 谷松岩, 吴荣华, 刘成保.  星载近红外高光谱CO2遥感进展 . 中国光学, 2015, 8(5): 725-735. doi: 10.3788/CO.20150805.0725
    [11] 梁静秋, 梁中翥, 吕金光, 秦余欣, 田超, 王维彪.  空间调制微型傅里叶变换红外光谱仪研究 . 中国光学, 2015, 8(2): 277-298. doi: 10.3788/CO.20150802.0277
    [12] 陶小平.  大口径反射镜加工机床在线检测高精度对准方法 . 中国光学, 2015, 8(6): 1027-1034. doi: 10.3788/CO.20150806.1027
    [13] 刘怡轩, 颜昌翔.  在线式分光测色仪发展现状 . 中国光学, 2014, 7(5): 712-722. doi: 10.3788/CO.20140705.0712
    [14] 杜小平, 刘明, 夏鲁瑞, 陈杭.  基于光谱角累加的高光谱图像异常检测算法 . 中国光学, 2013, 6(3): 325-331. doi: 10.3788/CO.20130603.0325
    [15] 陈星旦, 高静, 丁海泉.  论无创血糖监测的红外光谱方法(特邀) . 中国光学, 2012, 5(4): 317-326. doi: 10.3788/CO.20120504.0317
    [16] 张军强, 吴清文, 颜昌翔.  星载成像光谱仪杂散光检测技术 . 中国光学, 2010, 3(4): 337-342.
    [17] 陈万英, 唐玉国, 巴音贺希格, 崔继承, 冯树龙.  微型平像场近红外光谱仪的消杂散光设计 . 中国光学, 2010, 3(3): 263-267.
    [18] 于杰.  用于相移点衍射干涉仪的加权最小二乘相位提取算法 . 中国光学, 2010, 3(6): 605-615.
    [19] 王德俊, 王建立, 阴玉梅, 王鸣浩.  基于FPGA的近红外实时透雾成像方法 . 中国光学, 2009, 2(5): 445-451.
    [20] 陈少杰, 唐玉国, 巴音贺希格, 李延超, 于宏柱, 崔继承.  高速便携式近红外光栅光谱仪光电系统设计 . 中国光学, 2009, 2(4): 322-328.
  • 加载中
图(7) / 表 (5)
计量
  • 文章访问数:  747
  • HTML全文浏览量:  408
  • PDF下载量:  35
  • 被引次数: 0
出版历程
  • 收稿日期:  2019-06-21
  • 修回日期:  2019-08-20
  • 网络出版日期:  2020-06-30
  • 刊出日期:  2020-06-01

不同产地苹果糖度可见近红外光谱在线检测

doi: 10.3788/CO.2019-0128
    基金项目:  国家自然科学基金(No.31760344);江西省创新能力建设项目(No.S2016-90)
    作者简介:

    刘燕德(1967—),女,江西泰和人,博士,教授,博士生导师,1990年、2001年于江西农业大学分别获得学士、硕士学位,2006年于浙江大学获得博士学位,主要从事光电检测技术与装备方面的研究。E-mail:jxliuyd@163.com

    通讯作者: 刘燕德(1967−),女,江西泰和人,博士,教授,博士生导师,1990年、2001年于江西农业大学分别获得学士、硕士学位,2006年于浙江大学获得博士学位,主要从事光电检测技术与装备方面的研究。E-mail:jxliuyd@163.com
  • 中图分类号: O657.33

摘要: 为了实现不同产地苹果糖度的快速在线无损检测,减少产地差异对近红外光谱检测模型的影响,建立了不同产地苹果糖度的在线检测通用模型。首先,采用水果动态在线检测设备采集了包括栖霞、洛川与会宁3个产地的红富士苹果的漫透射光谱。其次,采用偏最小二乘算法(PLS),结合无信息变量消除(UVE)方法,筛选出58个特征变量,建立了苹果糖度的UVE-PLS通用模型,该模型对个体产地预测集及总预测集的均方根误差分别为0.50~0.74°Brix与0.63°Brix,较原始个体模型分别提高了23.2%~44.4%与35.7%。最后,提出了一个新的外部验证样本集对模型性能进行评价,其残留预测偏差为2.33,预测值在±1.0°Brix和±1.5°Brix误差范围内的占比分别为85%与100%。实验结果表明:建立多个产地苹果糖度的在线检测通用模型,能够提高其他产地样本糖度的预测稳健性,并且采用合适的波长筛选方法能够简化模型。开发不同产地水果内部品质通用模型在波长有限的光谱设备中具有良好的应用潜力。

English Abstract

刘燕德, 徐海, 孙旭东, 姜小刚, 饶宇, 徐佳, 王军政. 不同产地苹果糖度可见近红外光谱在线检测[J]. 中国光学, 2020, 13(3): 482-491. doi: 10.3788/CO.2019-0128
引用本文: 刘燕德, 徐海, 孙旭东, 姜小刚, 饶宇, 徐佳, 王军政. 不同产地苹果糖度可见近红外光谱在线检测[J]. 中国光学, 2020, 13(3): 482-491. doi: 10.3788/CO.2019-0128
LIU Yan-de, XU Hai, SUN Xu-dong, JIANG Xiao-gang, RAO Yu, XU Jia, WANG Jun-zheng. On-line detection of soluble solids content of apples from different origins by visible and near-infrared spectroscopy[J]. Chinese Optics, 2020, 13(3): 482-491. doi: 10.3788/CO.2019-0128
Citation: LIU Yan-de, XU Hai, SUN Xu-dong, JIANG Xiao-gang, RAO Yu, XU Jia, WANG Jun-zheng. On-line detection of soluble solids content of apples from different origins by visible and near-infrared spectroscopy[J]. Chinese Optics, 2020, 13(3): 482-491. doi: 10.3788/CO.2019-0128
    • 苹果是一种被广泛生产及消费的水果品类,其富含抗氧化成分,如抗坏血酸和多酚类化合物,可以对各种退化性疾病起到预防作用[1-2]。苹果的外观和内部品质直接决定消费者是否购买。可溶性固形物含量(Soluble Solids Content,SSC),一般也称为糖度,是评价苹果内部品质的关键参数,也是集可溶性糖、酸、纤维素等成分在内的综合指标[3]。因此,开发一种快速可靠的SSC检测方法至关重要。近年来,具有快速、准确、易于实现等优点的近红外(Near Infrared,NIR)光谱无损检测技术在水果品质评定方面得到了广泛应用[4-8]

      由于土壤养分、光照条件、气候以及果园生产管理方式等各不相同,导致水果的成分和品质也不同[9-10]。此外,这种生物变异性也会影响光学传播特性及其相互作用,从而降低水果内、外部品质检测的准确性[11]。经过调研发现,关于消除产地差异对SSC检测模型准确性影响的报道很少。Fan[12]等通过混合4个产地苹果的校正集建立了混合模型,结果表明,混合产地模型在提升苹果SSC预测模型稳健性方面具有较好的效果。Li等[13]建立了富士苹果SSC 的多产地回归测量模型,结果表明,与单一产地模型相比,结合产地判别法和模型搜索方法建立的多产地模型对苹果SSC的预测具有更好的预测结果及鲁棒性。然而,这些研究都是基于傅立叶变换近红外光谱仪进行的,光谱采集都为静态采集。对于水果实际分选环节,建立基于动态在线检测设备的SSC检测模型尤为关键。因此,本研究以产自山东栖霞、陕西洛川与甘肃会宁的红富士苹果为实验对象,利用团队自主研发的水果动态在线检测设备采集样品光谱,建立单一产地及混合产地苹果糖度的在线检测模型,并采用合适的波长筛选方法筛选出特征波长变量,尝试在保持模型预测精度及稳定性的基础上简化模型。本文研究结果将对苹果SSC的准确检测具有重要应用价值。

    • 实验样品于2018年11月购自3个不同的富士苹果商业果园,经过手工分拣后共选出132个无明显缺陷与损伤的苹果样品。其中44个来自山东栖霞,45个来自陕西洛川,43个来自甘肃会宁。将所有样品单独洗涤,干燥,编号,然后在赤道周围标记取样点,各点相距90°并垂直于茎轴,且每个观测点均作为一个独立样本。在光谱采集前,将苹果置于实验室环境(温度:22 °C;相对湿度:60%)下储存24小时以使样品达到室温,降低样品温度对预测精度的影响[14]。每个批次使用15~20个果实,并进行定期评估。

    • 本文所用漫透射检测机构如图1所示。考虑光源穿透性及水果糖度的光谱范围,以保证光谱仪接收到足够的光谱信息,考虑光照强度以确保光源不会对果皮造成灼伤,故设备采用10盏12 V,100 W 的卤素灯,以圆弧状配置方式对称排列在待测样品两侧,每盏灯与样品垂直呈45°放置,卤素灯发出的光均匀照射样品表面,透过样品内部的光由果杯下方的光纤探头收集后传回光谱仪,这样可以得到更多的样品果肉信息,从而避免了果实表面反射光及外部光的干扰,同时能有效消除由于照射果实不同部位导致的糖、酸等成分的测定误差。采用QE65Pro光纤光谱仪(Ocean optics, INC., USA)测量,波长范围为350~1 100 nm。

      图  1  漫透射检测机构

      Figure 1.  Mechanism of diffuse transmission detection

      实验前,设备预热30 min,设置运行速度为5个/s,以保证样品平稳运行。以聚四氟乙烯球作为参比,校正参比后采集光谱。采用配套的SpectraSuite软件采集样品光谱,在光谱采集时设置积分时间为100 ms,并采用硬件触发方式采集光谱,装置实物图如图2所示。齿轮每隔4个齿安装一个果杯,果杯和分度盘齿一一对应。分度盘下方2 mm处安装有光电开关,每转一齿,即传动一个果杯的行程,触发传感器,使后续电路发出信号,从而触发光谱仪采集并保存一条光谱信息。

      图  2  光谱采集触发装置

      Figure 2.  Trigger device of spectral acquisition

    • 光谱采集完成后,使用温度补偿糖度计(型号PAL-1; Atago Co., Tokyo, Japan)测定样品的SSC。从每个样品相应测量位置取出一个圆形楔形物(最大直径为50 mm),通过粗棉布压制挤汁滴于糖度计镜面上,并记录读数。对于同一测量部位,重复测量3次,取其平均值作为SSC参考值。

    • 偏最小二乘(PLS)回归是一种被广泛使用的无监督统计方法,用于在NIR分析中建立校正模型[15]。PLS分析的目的是通过将光谱矩阵X与浓度矩阵Y投影到新的潜在空间,使其中的潜在变量(Latent Variables,LVs)之间的协方差最大化,最终执行潜变量线性回归模型,其基本公式如下:

      $${{Y}}={{Xb}}+ {{e}},$$ (1)

      式中,b表示回归系数的向量,e表示模型残差。

      在校正与验证过程中,将LVs作为新的特征向量来解释方差和降低原始光谱维数[3]。在本研究中,PLS回归用于在光谱数据和苹果SSC属性之间建立定量关系,其中,LVs的最佳数量由基于校正样本的10倍交叉验证最低均方根误差确定。

      PLS广泛用于建立近红外光谱检测模型,具有独特的优越性[16]

      (1)可灵活使用光谱矩阵,根据需要使用全部或者部分数据达到很好的建模效果;

      (2)同时进行数据分解与回归,使特征矢量与被测成分有效融合;

      (3)适用于处理样品数量少,但变量相对多的问题;

      (4)PLS是多元线性回归与主成分分析的完美结合,显著提高了校正模型的预测能力。

      通过校正集的决定系数($R_{\rm{C}}^2$)与均方根误差(RMSEC)来评价SSC与光谱数据之间的校正方程。通过预测集的决定系数($R_{\rm{P}}^2$)与均方根误差(RMSEP)来评价校正模型的预测精度。利用残留预测偏差(Residual Prediction Deviation,RPD)来判断模型的质量。上述统计指标的计算公式如下:

      $${R_{\rm{C}}^2},{R_{\rm{P}}^2} = 1 - \frac{{\displaystyle\sum\limits_{i = 1}^n {{{\left( {{y_i} - {{\hat y}_i}} \right)}^2}} }}{{\displaystyle\sum\limits_{i = 1}^n {{{\left( {{y_i} - {y_m}} \right)}^2}} }},$$ (2)
      $$RMS\!EC,RMS\!EP = \sqrt {\frac{1}{n}\displaystyle\sum\limits_{i = 1}^n {{{({y_i} - {{\hat y}_i})}^2}} },$$ (3)
      $$RPD = \frac{{SD}}{{RMS\!EP}} = \frac{{\sqrt {\tfrac{1}{{n - 1}}\displaystyle\sum\limits_{i = 1}^n {{{({y_i} - {y_m})}^2}} } }}{{\sqrt {\tfrac{1}{n}\displaystyle\sum\limits_{i = 1}^n {{{({y_i} - {{\hat y}_i})}^2}} } }},$$ (4)

      式(2)~式(4)中,n表示校正集或预测集中的样本数,yi${\hat y_i}$分别表示校正集和预测集中第i个样本的测量值和预测值,ym表示样本集所有测量值的平均值。

      RPD值越大表明模型质量越好,Chang等[17]定义了3个质量类别以考虑模型的可靠性,它们分别是:优秀模型,RPD大于2;可靠模型,RPD为1.4~2;不可靠模型,RPD小于1.4。

    • 对所建模型进行校正之前,对样本进行肖维勒准则测试。其中,对于栖霞,洛川与会宁3个产地的样本,各剔除异常样本4、4和5个,共计13个。将栖霞、洛川与会宁依次定义为产地1,2与3,每个产地的剩余样本通过Kennard-Stone(K-S)法按约3∶1的比例分成2组,分别作为校正集与预测集。

      全部剩余样本的校正集与预测集分别由各个产地的校正子集和预测子集组成。校正集仅用于构建校正模型,预测集仅用于决定模型参数,以评估校正模型。样本集SSC统计结果见表1。如表1所示,校正集与预测集的SSC范围分别为8.5~18.2°Brix与8.9~17.6°Brix,标准差分别为1.61°Brix与1.64°Brix,样本集覆盖的范围足够大,且校正集大于每个产地的预测集,这些特征有利于建立稳健的近红外模型。

      表 1  样本集糖度含量统计

      Table 1.  Statistical values of the SSC(°Brix)for sample sets

      产地校正集预测集
      数量范围平均值标准差数量范围平均值标准差
      11298.8~16.612.931.43439.3~15.512.471.24
      21358.5~16.4131.28418.9~15.112.931.23
      312710.1~18.214.971.214011.7~17.615.031.17
      3918.5~18.213.621.611248.9~17.613.451.64
    • 由于光谱下部(350~594 nm)与上部(900~1 100 nm)的光谱能量值较低,主要包含的是无效信息,故将有效波长范围定义为594~900 nm(400个数据点)。由图3(彩图见期刊电子版)可知,3个产地的平均原始光谱曲线走势相似,但也存在一定的差异:在600~700 nm波段,光谱连续上升至645 nm处对应的波峰,接着下降至678 nm处对应的波谷,这可能与叶绿素吸收有关[18];在700~900 nm波段,光谱急剧上升至705 nm处对应的波峰,接着又下降至740~780 nm对应的宽阔区域,该区域光谱的吸收变化主要受O-H的三倍频伸缩振动与C-H的四倍频伸缩振动影响[19],其中会宁样本光谱能量值较高,其原因可能与其果型较小有关,曲线最终从810 nm附近继续下降直至结束。经过比较分析可知,使用多元散射校正(MSC)的光谱预处理方法可以减小因颗粒分布不均及颗粒大小不同产生的散射影响。

      图  3  样品原始光谱

      Figure 3.  Samples′ original spectra

      MSC主要是通过一组样本的光谱,基于统计的方法来修正光谱因散射所产生的线性变化。该方法假定散射系数在所有波长处均相同,将化学物质的吸收信息和光谱中的散射光信号进行有效分离,其校正过程[16]如下:

      首先计算所需校正光谱的平均光谱,如式(5)所示:

      $${\bar X_{i,j}} = \frac{{\displaystyle\sum\limits_{i = 1}^n {{{{X}}_{i,j}}} }}{n},$$ (5)

      对平均光谱进行回归,如式(6)所示:

      $${{{X}}_i} = {{{m}}_i}\bar {{X}} + {{{b}}_i},$$ (6)

      最后对每条光谱作多元散射校正,如式(7)所示:

      $${{{X}}_{i(MSC)}} = \frac{{\left( {{{{X}}_i} - {{{b}}_i}} \right)}}{{{{{m}}_i}}},$$ (7)

      式(5)~式(7)中,Xn×p维光谱矩阵,n表示样本数,p表示波长点数,$\bar {{X}}$表示所有样品的原始近红外光谱在各个波长点处求平均所得的平均光谱,Xi为1×p维向量,表示单个样品光谱矢量,mi表示一元线性回归得到的相对偏移系数,bi表示偏移量。

      对处理后的光谱进行主成分分析(PCA)以判断3个产地光谱的差异性,通过光谱的前3个主成分得分计算样本的空间距离(前3个主成分已表征了95%的原始信息),最终的三维得分分布图如图4所示。由图4可知,3个产地样本的主成分空间分布具有较大的重合区,光谱相似性较高,对不同产地具有通用性。

      图  4  经过MSC的苹果光谱的前3个主成分得分图

      Figure 4.  The first three PC score plot of apple spectra after MSC processing

    • 对3个产地分别进行PLS建模,并对其进行交互预测,即用单个产地的校正集去预测其余产地的预测集。以栖霞为例,将栖霞的校正集作为校正模型,分别去预测洛川,会宁以及包含所有产地的预测集,其他产地预测方式类似,最终结果如表2表3所示。

      表 2  单个产地的PLS建模结果

      Table 2.  Results of PLS modeling for single origin

      产地LVs校正集预测集RPD
      $R_{\rm{C}}^2$RMSEC(°Brix)$R_{\rm{P}}^2 $RMSEP(°Brix)
      190.920.400.900.413.02
      2100.890.420.850.472.62
      3110.860.460.800.512.29

      表 3  不同产地红富士苹果的预测结果

      Table 3.  Prediction results of Fuji apples from different origins

      产地预测集
      123
      $R_{\rm{P}}^2 $RMSEP(°Brix)$R_{\rm{P}}^2 $RMSEP(°Brix)$R_{\rm{P}}^2 $RMSEP(°Brix)$R_{\rm{P}}^2 $RMSEP(°Brix)
      1//0.540.820.731.240.421.30
      20.540.90//0.671.340.670.98
      30.731.440.721.25//0.681.27

      表2显示了单个产地校正模型预测出的相同产地果实SSC的结果。在校正集与预测集的产地相同时,$R_{\rm{P}}^2 $及RMSEP的范围分别为0.80~0.90与0.41~0.51°Brix,且RPD为2.29~3.02。结果表明:使用原始个体模型在预测同一产地果实糖度时表现优秀。而由表3可知,当使用原始单个产地校正模型预测其他个体产地果实糖度时,其结果并不理想,其RMSEP较高(0.82~1.44°Brix)。而对于预测包含3个产地的总预测集,个体校正模型的预测结果同样不佳,RMSEP为0.98~1.30°Brix。这可能是由于当使用个体模型学习校正集数据中的细节和噪声时,模型对其他产地数据的预测性能产生了负面影响,从而导致过度拟合。显然,只用原始个体产地建立的模型并不能很好地预测其他产地的SSC值。

    • 为了提升对其他产地数据的预测效果,采用PLS回归算法建立混合3个产地的通用模型,用于预测所有产地的SSC值。为了消除不包含有效信息的变量,采用基于PLS回归系数的无信息变量消除法(Uninformative Variable Elimination,UVE)筛选出特征变量。其基本思想是把变量对应的回归系数平均值与其标准差的比值作为变量选择的衡量依据[20],其表达式如下:

      $${C_i} = \frac{{mean({b_i})}}{{Std({b_i})}},$$ (8)

      式中,C为回归系数平均值与标准差之比,表示变量的稳定性。

      最终的判断方法是将一定数量的随机变量矩阵加入光谱矩阵中,然后通过交叉验证建立PLS模型,进而得到回归系数矩阵,由$\left| {{C_i}} \right|$的大小确定是否将第i列变量用于PLS建模,当$\left| {{C_i}} \right|$低于随机变量稳定性的99%时,该列变量被剔除。

      采用UVE对经过预处理的全谱变量(400个数据点)进行筛选,控制随机变量的大小,使其为原变量的10−10,以保证扩展矩阵的特征值基本不变,从而最大程度地降低随机矩阵对原变量回归系数的影响。随机变量个数设为200,最终的处理结果如图5所示。

      图  5  UVE选择变量结果

      Figure 5.  Results of variables selected by UVE

      图5(a)中,竖线为光谱变量与随机变量的分界线,其左侧曲线表示光谱变量的稳定性分布情况,右侧曲线表示随机变量的稳定性分布情况,2条水平虚线表示算法所得阈值的上下限。虚线之间的变量为被剔除的变量,而虚线外的变量即为选中的光谱变量。最终经过UVE筛选出的剩余光谱变量个数为58,图5(b)显示了经过UVE 处理后选中变量在全谱变量中的位置分布。不难看出,选中变量主要集中在由含氢基团伸缩振动所引起的吸收光谱区间,模型的预测结果如表4所示。

      表 4  苹果糖度通用模型预测结果

      Table 4.  Results of SSC of apples predicted by universal modeling

      模型变量数LVs$R_{\rm{C}}^2 $RMSEC(°Brix)$R_{\rm{P}}^2 $RMSEP(°Brix)RPD
      Ori-PLS400120.840.640.850.632.60
      UVE-PLS5880.820.680.850.632.60

      表4可知,将仅经过预处理的原始混合产地模型及经过UVE筛选变量后的通用模型分别记为Ori-PLS与UVE-PLS。其中,Ori-PLS模型的RMSEC与RMSEP差值不大,分别为0.64°Brix与0.63°Brix,建模所用变量数及LVs数分别高达400与12。而UVE-PLS通用模型所用建模变量数及LVs数仅为58与8,这极大地提升了模型的运算速率,降低了模型的复杂程度。但是UVE-PLS模型的$R_{\rm{C}}^2$及RMSEC均略差于Ori-PLS模型,这可能与算法在计算过程中遗漏了某些关键变量有关。

      UVE-PLS通用模型能够预测包含3个产地预测集的SSC值(图6(a)),其中RMSEP为0.63°Brix,偏差为0.03°Brix。而图6(b)~6(d)显示了每个产地果实SSC值预测的散点图。对于每个产地的预测集,模型的糖度预测值位于目标线附近,且偏差较小。

      图  6  UVE-PLS通用模型糖度测量值与预测值的散点图

      Figure 6.  Scatter plots of measured values versus predicted values for SSC by using UVE-PLS universal model

      对比表3相关数据可知,在预测其他产地预测集样本时,相较于原始单个产地校正模型,UVE-PLS通用模型的RMSEP均有所降低,与交互预测中的较好结果(0.90,0.82,1.24与0.98°Brix)相比,预测精度分别提高了44.4%,23.2%,40.3%与35.7%。

    • 本文提出了一个新的样本集用来验证UVE-PLS方法所获得的SSC模型的实际性能。从当地超市购买了30个苹果,每个产地各10个。在每个苹果上选择两个测量点,在样品的赤道处随机标记,间隔约180°。对新样本采集光谱及测得SSC真值后,放入模型中进行验证,每个产地与总样本的预测误差列于表5

      表 5  UVE-PLS糖度通用模型的实际性能

      Table 5.  The practical performance of UVE-PLS universal model for SSC

      RMSEP/(°Brix)RPD
      栖霞洛川会宁
      0.670.510.720.642.33

      表5可知,对新样本集中每个产地的SSC进行预测,其RMSEP值为0.51~0.72°Brix,而图7(彩图见期刊电子版)显示了SSC预测值与测量值之间的绝对误差值的分布情况。

      图  7  糖度测量值与预测值的散点图

      Figure 7.  Scatter plot of measured value versus predicted value of SSC for a new external sample set

      图7所示,对于总样本组的SSC预测,其$R_{\rm{P}}^2$和RMSEP分别为0.81和0.64°Brix。中间的黑色实线为目标线,即y=x,两条黑色虚线表示预测偏差为±1.0°Brix的分界线,而两条品红色实线表示预测偏差为±1.5°Brix的分界线。经过计算,在±1.0°Brix和±1.5°Brix偏差范围内的预测值占比分别为85%与100%,而RPD为2.33,因此,使用UVE-PLS方法建立的通用模型更适用于SSC的定量检测。

    • 本研究采用多元散射校正方法,有效减小了由产地变异性引起的光谱差异。单个产地糖度校正模型在预测同一产地数据时显示出较好的预测结果,RMSEP为0.41~0.51°Brix,但当预测集包含其他产地时,相关性则不显著,RMSEP较高,为0.98~1.30°Brix。采用PLS回归算法建立了不同产地苹果的糖度通用模型,结合UVE方法筛选出58个特征波长变量,在保证预测精度的基础上,简化了模型,其RMSEP为0.63°Brix。与单一产地校正模型相比,UVE-PLS通用模型在预测每个产地糖度时,预测精度大大提升,表明随着更多的生物变异性被考虑进来,预测精度对外部因素的未知变化变得不那么敏感,使得校正模型对未来的变化更加稳健。外部验证结果表明,UVE-PLS通用模型对3种产地苹果糖度均具有出色的预测能力。实验结果表明,水果动态在线检测设备可以用于开发不同产地苹果的糖度模型,本文研究简化了水果商品化加工过程,降低了建立糖度分选模型的维护成本,对水果采后商品化处理具有指导意义。

参考文献 (20)

目录

    /

    返回文章
    返回