我院博士生吴洪状在IEEE Transactions on Industrial Informatics上发表论文
作者:浏览:时间:2022-04-06
近期,我院博士生吴洪状的研究成果“Multi-scale variational autoencoder aided convolutional neural network for pose estimation of tunneling machine using a single monocular image”被国际工程技术、计算机科学领域顶级期刊《IEEE Transactions on Industrial Informatics》录用并刊发。
该研究提出了一种基于机器视觉与深度学习的掘进机机体位姿检测方法,在巷道掘进机的后方设置人工特征对象(如 LED 阵列、激光阵列、红外光阵列等),并在掘进机机体上安装单目相机,通过拍摄人工特征对象的单张图像估计掘进机机体位姿。为了实现上述目的,提出了一种新颖的多尺度变分自编码器辅助的卷积神经网络(Multi-scale Variational Autoencoder Aided Convolutional Neural Network, MSVAE-CNN) 模型,使用一张单目图像以端到端的形式估计掘进机机体的当前绝对六自由度位姿。在所提出的模型中,多任务变分学习策略增强了模型的泛化性能和鲁棒性,多尺度隐含层结构提高了神经网络的学习能力。在试验过程中,使用 NOKOV 红外动捕系统辅助获取训练数据,试验结果验证了所提出的掘进机机体位姿检测方法的有效性以及 MSVAE-CNN 模型的优越性。
虽然所提出的位姿检测方法需要训练数据获取和模型训练过程,但在实际应用中,其具有高鲁棒性、高精度、实时性好、成本低、系统构建简单等优点。除此之外,所提出的基于 MSVAE-CNN 的机体位姿估计方法仅需要一张单目图像便可实现机体当前绝对六自由度位姿的估计,在数据集获取、模型训练以及位姿状态推理过程中都不需要任何其他先验信息,例如相机的内参数、特征点三维坐标、特征匹配、机体初始位姿等。