2025年7月8日,我院杨克虎教授团队的研究成果正式在线发表在Nature子刊《Scientific Data》上,论文题目为“MUSeg: A multimodal semantic segmentation dataset for complex underground mine scenes”。该论文由我院2022级博士生李石岩担任第一作者,杨克虎教授和孔庆群老师共同指导完成。
视觉感知是实现矿山智能开采的核心技术,然而,地下矿井环境具有显著的复杂性与特殊性,包括光照条件剧烈变化甚至极度昏暗、空间结构狭窄拥挤以及目标种类繁多等。仅依赖单一可见光的语义分割技术在矿井应用中面临精度不足、鲁棒性差等挑战,严重制约了矿井视觉感知系统的可靠性。多模态融合技术为解决这一难题提供了可能,但缺乏矿井场景的高质量多模态数据集成为制约该领域应用的关键瓶颈之一。
针对这一问题,杨克虎教授团队构建了面向地下矿井复杂场景的多模态语义分割数据集MUSeg。该数据集涵盖了中国不同地区6座大小各异的地下矿井,包括1座培训金矿和5座生产矿井,矿井的地质条件和投产时间各不相同。数据集包含来自1916个独立位置的3171组RGB-D数据对,并定义了矿井环境中的15类典型目标语义类别:人员、线缆、管道、指示物、金属固定、容器、工具与物料、门体、电气设备、电子设备、采矿设备、锚固设备、支护设备、救援设备以及轨道区域。

图1:地下矿井复杂场景多模态语义分割数据集标注示例
MUSeg填补了该领域高质量数据集的空白,为智能矿山建设中的视觉感知技术提供了强有力的数据支撑,对推动煤炭工业安全、高效、智能化发展具有积极意义。
论文引用:Li, Shiyan; Kong, Qingqun; Gao, Xuan; Shi, Fangzhen; Li, Lianghui; Zhang, Qi; Wang, Penghao; Yang, Kehu.MUSeg: A multimodal semantic segmentation dataset for complex underground mine scenes.ScientificData12, 1160 (2025).
论文下载地址:https://link.springer.com/article/10.1038/s41597-025-05493-9
数据库地址:https://doi.org/10.6084/m9.figshare.28749098.v2