《Talanta》| 光镊-拉曼光谱结合深度学习对海洋细菌进行分类

2022.03.29



2022年3月,中科院长光所李备研究员团队与英国格拉斯哥大学尹华兵教授团队合作,应用长光辰英拉曼产品——D100近红外生物拉曼检测仪,结合光镊捕获与操纵技术,建立了一种深海微生物单细胞拉曼识别与分选技术,为深海微生物资源的研究与开发提供了有价值的方法。成果以“Laser tweezers Raman spectroscopy combined with deep learning to classifymarine bacteria”为题,发表于《Talanta》期刊上。






01 研究背景





微生物的快速鉴定在生态学中具有重要意义。传统的DNA鉴定方法不仅耗时,而且具有复杂的操作要求。传统方法大都是破坏性的,活细胞需要被破坏才能提取DNA或蛋白质进行鉴定,而且这些方法通常很难用于原位识别微生物,阻碍了对真实世界的探索。因此,发展快速、非培养、无损、单细胞水平的微生物鉴定方法是非常必要的。拉曼光谱是提供无标记、非侵入的原位细胞识别方法,能够用于微生物单细胞的物种鉴定与代谢研究。微生物单细胞拉曼图谱,可以作为菌种识别的“化学指纹”,蕴含着该微生物在特定生理状态下丰富的生化信息。拉曼光谱技术与光镊技术相结合。可在液体环境完成稳定的拉曼测量,实现拉曼光谱的原位检测,从而进行拉曼分析。
我们开发了一种利用光镊拉曼光谱结合渐进式增长生成对抗网络(PGGAN)和残差神经网络(ResNet)对微生物进行分类的新方法,利用PGGAN产生大量高分辨率的拉曼数据,以解决CNN需要大量数据训练的问题,然后利用PGGAN产生的数据进行ResNet的训练产生分类模型。该方法不需要大量光谱数据,可以快速、准确地对微生物进行分类。





02 研究成果





 1.单细胞光镊拉曼光谱装置(LTRS)的搭建

图1 单细胞光镊拉曼光谱装置(LTRS)


本研究在长光辰英拉曼产品——D100近红外生物拉曼检测仪的基础上,结合光镊细胞捕获技术,搭建单细胞光镊拉曼光谱仪,实现对深海微生物的原位捕获、操纵、检测与分离。


1.拉曼光谱的采集

2 五种海洋微生物的拉曼光谱。

实线代表拉曼光谱的平均值,标准偏差用阴影表示。


应用单细胞光镊拉曼光谱仪,采集了Acinetobacter sp., Fictibacillus sp., Halomonas sp., Pseudomonas sp., andStaphylococcus sp. 五种海洋微生物的单细胞拉曼光谱数据,每种菌采集约300个单细胞光谱数据。


2.利用渐进式生成对抗网络产大量高分辨率的拉曼光谱

图3 渐进式增长生成对抗网络的过程图

 

基于深度学习算法的分类模型在构建时,通常需要很大数据量,带来巨大工作量。应用渐进式生成对抗网络,可以基于少量测试数据,产生相似度很高的大量数据,用于分类模型的构建,极大提高了工作效率。如图3所示,训练过程从几个低分辨率的卷积层发展到多个高分辨率的层,先训练早期的层,再引入更高分辨率的层,最终完成数据的生成。

图4 生成的光谱与真实光谱之间的比较


图4中,蓝线是生成的光谱。红线是真正的光谱。灰色阴影部分是由生成光谱的最大值和最小值形成的区域。经过不断训练,产生了大量的高分辨率的拉曼光谱数据,与真实光谱相比,相似度很高,可以作为分类模型的构建。

 

3.ResNet分类模型能准确地识别微生物种类

图5 ResNet模型架构

 

图6 通过ResNet分类模型对五种细菌菌株的预测结果


将上述生成的大量高分辨率光谱作为数据集,导入到ResNet模型进行训练。我们使用训练好的ResNet分类模型,在测试数据集中基于菌群来识别每个微生物细胞的种类。
结果显示,模型Fictibacillus sp., Halomonas sp., Pseudomonas sp.,Staphylococcus sp., and Acinetobacter sp.有着很好的分类能力。同时,我们采用线性判别分析(PCA-LDA)和支持向量机(PCA-SVM)等标准分析技术对单细胞的种类进行预测。使用LDA、SVM与KNN的分类预测准确率分别为98±2%, 98±2%, and 95±5%。


 



结论





该研究提出了一种利用PGGAN、ResNet深度学习算法,结合激光镊子拉曼光谱进行细菌鉴定的新方法。对于大多数现有的深度学习方法,PGGAN可以快速生成大量高分辨率拉曼光谱,并提高其预测精度。通过这种方法,只需通过实验获取少量光谱,从而大大减少了时间和人力。ResNet可以准确地对低信噪比的拉曼光谱进行分类。当与PGGAN的高分辨率数据相结合时,ResNet可以快速、高效、准确地对单细胞拉曼光谱进行分类。

 

原文链接:

BoLiu, Kunxiang Liu, Nan Wang, Kaiwen Ta, Peng Liang, Huabing Yin, Bei Li, Lasertweezers Raman spectroscopy combined with deep learning to classify marinebacteria,Talanta,2022,123383,ISSN0039-9140,doi:10.1016/j.talanta.2022.123383.






D100近红外生物拉曼检测仪

专注生物在体检测,专注微弱信号采集


D100是一款专为生物样品研制的近红外共聚焦拉曼光谱仪。具有高效信号采集、高穿透性、高光谱分辨率、高稳定性、高智能化、无损测试等特点,满足在体样本、有厚度样本检测的需求。专为近红外拉曼采集设计的系列化物镜与专利探测技术,实现对微弱信号的高效采集;独特的多维校正装置,保证样品光谱不受测试环境干扰,满足拉曼数据库构建对光谱稳定性的要求;紧凑型模块化设计,灵活搭载正、倒置显微成像系统,满足不同应用需求。可用于皮肤科学、干细胞分化、肿瘤分型、微生物原位检测与鉴定、微塑料检测等领域。


D100近红外生物拉曼检测仪


1. 高效率近红外拉曼信号采集

采用自主研制的近红外专用高NA拉曼物镜,透射率提升30%以上;应用先进的无偏振光栅技术以及独特的“光谱拼接”近红外高效探测技术,整个系统光通量比传统近红外拉曼光谱仪提高了100%


2. 高稳定性光谱数据重现

集成多维校正系统,最大程度降低测试环境的干扰,确保在不同时间、环境下,同种生物样品拉曼检测结果的可重复性。

经校正后,数据高度重新


3. 高智能化数据分析

集成多种拉曼数据处理与分析算法,帮助用户深度挖掘拉曼数据信息。

 

4. 高集成化模块设计

紧凑型一体化设计,集共聚焦、激光器、光谱仪、探测器、控制器于一体,便于使用;模块化设计,灵活搭载正置、倒置显微成像系统,应对各种应用场景。






新品预告

单细胞拉曼光镊分选仪

即将上市,敬请期待