《Talanta》| 光镊-拉曼光谱结合深度学习对海洋细菌进行分类

2022-03-29 15:07:45

1650957670882354.png

2022年3月,中科院长光所李备研究员团队与英国格拉斯哥大学尹华兵教授团队合作,应用长光辰英拉曼产品??D100近红外生物拉曼检测仪,结合光镊捕获与操纵技术,建立了一种深海微生物单细胞拉曼识别与分选技术,为深海微生物资源的研究与开发提供了有价值的方法。成果以“Laser tweezers Raman spectroscopy combined with deep learning to classifymarine bacteria”为题,发表于《Talanta》期刊上。

一、研究背景

微生物的快速鉴定在生态学中具有重要意义。传统的DNA鉴定方法不仅耗时,而且具有复杂的操作要求。传统方法大都是破坏性的,活细胞需要被破坏才能提取DNA或蛋白质进行鉴定,而且这些方法通常很难用于原位识别微生物,阻碍了对真实世界的探索。因此,发展快速、非培养、无损、单细胞水平的微生物鉴定方法是非常必要的。拉曼光谱是提供无标记、非侵入的原位细胞识别方法,能够用于微生物单细胞的物种鉴定与代谢研究。微生物单细胞拉曼图谱,可以作为菌种识别的“化学指纹”,蕴含着该微生物在特定生理状态下丰富的生化信息。拉曼光谱技术与光镊技术相结合。可在液体环境完成稳定的拉曼测量,实现拉曼光谱的原位检测,从而进行拉曼分析。我们开发了一种利用光镊拉曼光谱结合渐进式增长生成对抗网络(PGGAN)和残差神经网络(ResNet)对微生物进行分类的新方法,利用PGGAN产生大量高分辨率的拉曼数据,以解决CNN需要大量数据训练的问题,然后利用PGGAN产生的数据进行ResNet的训练产生分类模型。该方法不需要大量光谱数据,可以快速、准确地对微生物进行分类。

二、研究成果

 1.单细胞光镊拉曼光谱装置(LTRS)的搭建

1650958777346191.png

图1 单细胞光镊拉曼光谱装置(LTRS)


本研究在长光辰英拉曼产品??D100近红外生物拉曼检测仪的基础上,结合光镊细胞捕获技术,搭建单细胞光镊拉曼光谱仪,实现对深海微生物的原位捕获、操纵、检测与分离。


1.拉曼光谱的采集

1650958813947967.png

五种海洋微生物的拉曼光谱。

实线代表拉曼光谱的平均值,标准偏差用阴影表示。


应用单细胞光镊拉曼光谱仪,采集了Acinetobacter sp., Fictibacillus sp., Halomonas sp., Pseudomonas sp., andStaphylococcus sp. 五种海洋微生物的单细胞拉曼光谱数据,每种菌采集约300个单细胞光谱数据。


2.利用渐进式生成对抗网络产大量高分辨率的拉曼光谱

图片

图3 渐进式增长生成对抗网络的过程图

 

基于深度学习算法的分类模型在构建时,通常需要很大数据量,带来巨大工作量。应用渐进式生成对抗网络,可以基于少量测试数据,产生相似度很高的大量数据,用于分类模型的构建,极大提高了工作效率。如图3所示,训练过程从几个低分辨率的卷积层发展到多个高分辨率的层,先训练早期的层,再引入更高分辨率的层,最终完成数据的生成。

1650958915305511.png

图4 生成的光谱与真实光谱之间的比较


图4中,蓝线是生成的光谱。红线是真正的光谱。灰色阴影部分是由生成光谱的最大值和最小值形成的区域。经过不断训练,产生了大量的高分辨率的拉曼光谱数据,与真实光谱相比,相似度很高,可以作为分类模型的构建。

 

3.ResNet分类模型能准确地识别微生物种类

1650958944877929.png

图5 ResNet模型架构

 

6.png

图6 通过ResNet分类模型对五种细菌菌株的预测结果


将上述生成的大量高分辨率光谱作为数据集,导入到ResNet模型进行训练。我们使用训练好的ResNet分类模型,在测试数据集中基于菌群来识别每个微生物细胞的种类。

结果显示,模型Fictibacillus sp., Halomonas sp., Pseudomonas sp.,Staphylococcus sp., and Acinetobacter sp.有着很好的分类能力。同时,我们采用线性判别分析(PCA-LDA)和支持向量机(PCA-SVM)等标准分析技术对单细胞的种类进行预测。使用LDA、SVM与KNN的分类预测准确率分别为98±2%, 98±2%, and 95±5%。

三、结论

该研究提出了一种利用PGGAN、ResNet深度学习算法,结合激光镊子拉曼光谱进行细菌鉴定的新方法。对于大多数现有的深度学习方法,PGGAN可以快速生成大量高分辨率拉曼光谱,并提高其预测精度。通过这种方法,只需通过实验获取少量光谱,从而大大减少了时间和人力。ResNet可以准确地对低信噪比的拉曼光谱进行分类。当与PGGAN的高分辨率数据相结合时,ResNet可以快速、高效、准确地对单细胞拉曼光谱进行分类。

 

原文链接:

BoLiu, Kunxiang Liu, Nan Wang, Kaiwen Ta, Peng Liang, Huabing Yin, Bei Li, Lasertweezers Raman spectroscopy combined with deep learning to classify marinebacteria,Talanta,2022,123383,ISSN0039-9140,doi:10.1016/j.talanta.2022.123383.




  • 0431-86708977

    0571-86972756

  • 长春市自由大路7691号光电信息产业园3号楼

    杭州市滨江区六和路368号海创园南楼二楼F2006

  • sales@hooke-instruments.com

  • COPYRIGHT 版权所有©2017-2022 长春长光辰英生物科学仪器有限公司 ALL RIGHTS RESERVED 吉ICP备18001354号-1