首页 新闻 图片 视频 报纸 广播 RSS
首页 > 新闻 > 综合新闻 > 正文

国际信息与软件学院两项成果被计算机视觉领域国际顶级学术会议录用

作者:王智慧 来源:开发区校区 时间:2019-07-28 09:33

近日,我校两项成果被国际计算机视觉大会 (IEEE International Conference on Computer Vision 2019)录用。ICCV是计算机视觉领域最高级别的会议(CCF A 类会议),收录的论文代表了计算机视觉领域最新的发展方向和水平。

论文“Accurate Monocular 3D Object Detection via Color-Embedded 3D Reconstruction for Autonomous Driving”由国际信息与软件学院研究生马新柱,王智慧副教授,李豪杰教授,研究生张朋博,欧阳万里副教授(悉尼大学)以及樊鑫教授合作完成。3D目标检测能够提供目标物体的长宽高还有偏转角等信息,对于自动驾驶与机器人等领域意义重大。针对单目图像三维目标检测, 该工作发现数据的表示形式对检测性能有着至关重要的影响。算法获取到深度信息和二维目标位置先验之后,将二维深度信息映射到三维空间,以点云数据形式进行后续处理。在三维姿态估计过程中,算法基于Attention机制提出了多信息融合策略,将点云空间信息,像素RGB信息以及目标局部特征聚合在一起,并设计了点云分割模块来去除目标区域的背景无关信息。文章在KITTI数据集上进行了充分的实验验证,目前算法的检测准确性超越了现有的其他单目检测算法。

论文“Depth-induced Multiscale Recursive Attention Network for Saliency Detection”由国际信息与软件学院几何计算与智能媒体技术研究团队张淼副教授、研究生李婧婧、研究生冀炜与信息与通信工程学院智能图像分析与理解(IIAU)研究团队卢湖川教授、朴永日副教授合作完成的研究成果。该项研究创新性的设计了一个深度诱导的多尺度注意力循环网络。首先借鉴残差连接的优势,将深层神经网络中的多层跨模态信息有效的结合在一起;并且将深度线索与多尺度上下文特征结合在一起,去充分探索场景中多个物体之间深度和尺度的关系;最后由人脑的内部感知机制激发,设计了一个新颖的循环注意力模块,其内部设计机制使得它在推断显著性物体时能够不断的提取记忆信息去辅助当前决断,从而渐进式的获得最优的结果。此外,该项研究提供了一个大规模的RGB-D数据集,为深度学习模型的训练以及全面验证提供了更加充分的数据支撑。在七个数据集上的大量实验证明,该方法优于目前最先进的RGB和RGB-D显著性物体检测方法。

几何计算与智能媒体技术研究团队依托于辽宁省泛在网络与服务软件重点实验室。研究方向包括机器学习、深度学习、计算机视觉、多媒体技术、优化方法等当前最前沿的领域。近年来在IEEE TPAMI、TIP、TNNLS、TMM、NeurIPS、IJCAI、AAAI、CVPR、ECCV、ACM MM等人工智能、多媒体技术等多方领域的重要期刊及会议上发表论文达100余篇。

责任编辑:姚璐