首页 > 求职技巧大全 > 求职技巧大全 > 在世界顶级计算机视觉大会上,联想拿下6项冠军!

在世界顶级计算机视觉大会上,联想拿下6项冠军!

发布时间:2024-07-01 22:23:27来源: 15210273549

计算机视觉是人工智能重要的技术领域之一。每年,国内外都会举办众多的计算机视觉学术或者行业大会,其中,计算机视觉与模式识别国际会议(IEEE CVPR)、国际计算机视觉大会(ICCV)以及欧洲计算机视觉国际会议(ECCV)是最为知名的三大顶会。

在全球专家学者交流研讨的同时,这些顶会还会举办系列挑战赛,全球众多顶尖团队积极报名参赛,在计算机视觉的各个细分领域同台“论剑”,一争高下。

6月下旬举办的CVPR大会也不例外。在本次大会组织的各项计算机视觉挑战赛中,联想研究院团队共斩获6项冠军,包括:

  • 第一人称视角与外界视角融合的4D视觉挑战赛(Ego4D and EgoExo4D Challenge)社交互动(Looking At Me)赛道冠军;
  • 第一人称视角与外界视角融合的4D视觉挑战赛(Ego4D and EgoExo4D Challenge)手部姿态估计(Hand Pose)赛道冠军;
  • 自动驾驶ARGOVERSE挑战赛3D物体检测(3D Object Detection Challenge)赛道冠军;
  • 自动驾驶ARGOVERSE挑战赛3D多目标跟踪(3D Multi-Object Tracking Challenge)赛道冠军;
  • 自主系统挑战赛(Autonomous Grand Challenge, AGC)具身多模态三维视觉定位(Multi-View 3D Visual Grounding)赛道冠军,并拿下最具创新奖;
  • 人工智能城市挑战赛(AI City Challenge)多相机多行人跟踪(Multi-Camera Multi-People Tracking)赛道冠军。
  •  

其中,研究院PC创新与生态系统实验室团队收获前四项冠军,而人工智能实验室和清华大学、以及与上海交通大学的两个联合团队分别拿下自主系统挑战赛具身多模态三维视觉定位冠军和最具创新奖,以及AI CITY挑战赛多相机多行人跟踪赛道冠军。

第一人称视角与外界视角融合的4D视觉挑战赛(Ego4D and EgoExo4D Challenge)

Ego4D数据集是一个大规模的以自我为中心的视频数据集和基准套件。它提供3670小时的日常生活活动视频,涵盖数百种场景(家庭,户外,工作场所,休闲等),由来自全球74个地点和9个不同国家的931名独特的相机佩戴者(camera wearer)拍摄。

 

Ego-Exo4D数据集则是一个多样化的、大规模的多模式多视角视频数据集和基准套件。Ego-Exo4D同时捕捉以自我为中心和以外部为中心的,大众熟悉的人类活动视频(例如,体育、音乐、舞蹈、自行车修理等)。

 

基于这两个数据集,CVPR2024提出了一系列新的基准挑战,这些挑战围绕着理解第一人称视觉体验展开。联想研究院PC创新与生态系统实验室团队收获了其中的社交互动(Looking At Me)赛道和手部姿态估计(Hand Pose)赛道两项冠军。

社交互动(Looking At Me)挑战

在社交互动(Looking At Me)赛道,团队以80.91 mAP(mean Average Precision,平均精度均值)的成绩获得了挑战赛第一名。

 

社交互动是人类行为理解的关键。通过获取以自我为中心的视频数据,我们可以获得一种独特的视角,捕捉到每个参与者的言语交流和非语言线索。这种技术为研究社交互动提供了宝贵的信息源,有助于深入理解人类的社交行为。未来,这种技术有望推动虚拟助理和社交机器人的发展,使其能够更好地融入人类的社交环境,提供更智能、更贴心的交互体验。通过分析社交互动的细微信号,我们可以培养出更富同理心和社交智慧的人工智能系统,使其能够更自然地与人类进行沟通互动。

比如该技术可以用来检测家庭成员情绪状态,并为其提供建议或播放音乐等缓解情绪,具备情境理解与响应能力。再比如,当检测到厨房的烟雾报警器响起时,它不仅能即时通知家庭成员,还能自动联系紧急服务,并指导家中的儿童安全撤离。

在该挑战中,参与者获得了一段视频,其中包含了已被定位和识别的社交伙伴的人脸,并对每个可见的人脸进行分类,判断它们是否都在看向相机佩戴者。由于场景中人与摄像机之间的距离,以及人体的运动,导致了人脸图像的模糊,使得这项任务具有很高的挑战性。

面对这项挑战,团队提出了由一个InterVL图像编码器和Bi-LSTM网络组成的InternLSTM解决方案。InternVL负责提取空间特征,Bi-LSTM提取时间特征。为了解决任务的复杂性,我们引入了平滑滤波器,以消除输出的噪声或尖峰。

求职技巧大全更多>>

比亚迪仰望 U9 碳纤维个性化选装套件开售:含前铲、座椅、轮毂等,单品最高 11.8 万元 比亚迪李云飞:拒绝拉踩营销!比亚迪以工程师文化打造全球新能源名片 填补当地市场空白,比亚迪 SHARK 插混皮卡秘鲁上市 中国汽车品牌“销冠”比亚迪公布5月智能驾驶辅助的车型销量 吉利星愿 Flyme Auto E 1.8.0 更新:新增个性锁车提示音等 新一代奥迪Q5L要来了,华为加持,动力升级,或三季度上市 小鹏与华为深化合作 AR-HUD技术方案正式亮相 5月销量快报:比亚迪、长城稳住增势,小鹏暴涨、蔚来陷危机 宁德时代单月“换电站”速度超蔚来,两者是竞还是合? 驾趣在握!2025 广汽本田梦想方程式开启火热招募 CNMO:2025年1-4月欧洲18国中国汽车品牌销量名爵9.15万辆领跑 问界M9交付突破20万辆,正在定义智能豪华的中国叙事 想买大6座SUV用户,深蓝S09第三排乘坐空间到底舒适不? 阿维塔累计销量超15万台!还有17款新车在路上 阿维塔发布6月购车权益,5月销量为12767辆 比亚迪仰望 U9 碳纤维个性化选装套件开售:含前铲、座椅、轮毂等,单品最高 11.8 万元 天工撑不起25万辆新能源,王胜利王立军互换,红旗复兴路在何方? 长安汽车包馆重庆车展,向世界一流汽车品牌迈进 长安汽车全球规划 20 个海外工厂已投产 9 个,布局 100 余个国家市场 大众口腔二次递表港交所 2024年营收净利双降 重庆车展连开9天,比亚迪广汽全系车型高规格参与 比亚迪关于“常压油箱”与“车圈恒大”舆论的说明及立场重申! 比亚迪方程豹钛3开创科技潮品新形态 李书福称吉利决定不再建设新的汽车生产工厂 中国汽研-尚界合作专班成立 大尺寸、豪华、大SUV!轴距3米多,腾势N9“双子星”大兄弟来了?! 深蓝S09重庆车展再掀风暴:大六座第三排改写传统SUV“生存法则” 阿维塔:截止五月底国内实现超 700 家渠道触点,覆盖 212 个城市 小米庭屏Mini智能触屏音箱小爱同学全屋智能促销价211元 2025 款悦达起亚赛图斯 SUV 车型将于下半年发布,现款 2023 款售 11.99 万元起 大空间方盒子闯入7万级,宝骏悦也 Plus 2026 款登陆重庆市场