DAV首页
数字音视工程网

微信公众号

数字音视工程网

手机DAV

null
null
null
卓华,
null
null
null
null
null
null
null

我的位置:

share

AI荣誉 | 大华股份AI场景流、光流技术取得新进展

来源:大华股份        编辑:lsy631994092    2020-09-22 09:23:34     加入收藏

近日,大华股份基于AI的场景流估计算法和光流估计算法再次取得突破性成果,各项指标再次刷新了KITTI Sceneflow、KITTI Flow两项竞赛的全球最好成绩:场景流和光流的3像素错误率指标分别为5.06%、3.79%,指标均创历史新高,持续保持领先水平。

  近日,大华股份基于AI的场景流估计算法和光流估计算法再次取得突破性成果,各项指标再次刷新了KITTI Sceneflow、KITTI Flow两项竞赛的全球最好成绩:场景流和光流的3像素错误率指标分别为5.06%、3.79%,指标均创历史新高,持续保持领先水平。

图片

大华股份AI取得KITTI Sceneflow排行榜第一

(来源: http://www.cvlibs.net/datasets/kitti/eval_scene_flow.php)

图片

大华股份AI取得KITTI Flow排行榜第一

(来源:www.cvlibs.net/datasets/kitti/eval_scene_flow.php?benchmark=flow)

  场景流算法可同时估计场景中物体的三维位置与三维运动矢量,光流是场景流映射到二维图像坐标系的投影,应用价值广泛。为提升场景流估计精度,大华AI团队优化了一系列算法模块。首先,基于yolact++网络进行实例分割,从场景中分割出行人、车辆、自行车等前景目标,然后基于最新架构的GANet计算初始视差图,得到更精细的视差图,在使用RAFT网络得到精细光流图,最后通过多阈值融合等策略,进一步优化场景流估计结果。

  在测评中,场景流和光流算法的效果和计算结果如下:

图片

▲输入图像

图片

▲T0时刻视差图

图片

▲经光流映射后的T1时刻视差图

图片

▲T1时刻到T0时刻的光流图

图片

▲场景流误差图

  该项技术已在大华双目摄像机、全景摄像机等设备中得到应用,提升多目摄像机的目标深度数据计算、目标行为分析等算法性能;同时,该技术也成功应用于AR融合领域,实现单个及多个摄像机图像的AR语义融合应用,极大提升了行业解决方案的用户体验。

  双目摄像机行为检测应用场景

图片

▲双目图像图

图片

▲视差图

图片

▲光流图(目标三维运动矢量)

  AR语义融合应用场景

图片

▲真实图像

图片

▲AR语义融合,增强目标类别、位置、运动矢量等信息

  近年来,在算法商业化落地方面,大华积极应用主导个性化AI方案敏捷交付,构建人工智能端到端研发的全链路能力,实现AI从基础能力到算法研发到产业化应用落地,构建了围绕视图智能、3D智能、多维智能、控制智能等核心算法体系,实现了在各业务领域的人工智能算法、产品与解决方案的全面覆盖,赋能百行百业。

图片

  大华面向用户需要开放全栈能力,赋能行业生态,并在实战中持续积累人工智能核心技术,针对全场景理解、小规模数据、泛化能力、多任务学习和AutoML等人工智能的技术挑战,开展实践探索,并已取得实战应用成果。

  未来,大华股份将继续推动AI技术与各行业场景的深度融合,充分发挥科技创新对百行百业可持续发展的支撑引领作用,推动AI等新一代技术的普及与落地,赋能百行百业数字转型升级。

免责声明:本文来源于大华股份,本文仅代表作者个人观点,本站不作任何保证和承诺,若有任何疑问,请与本文作者联系或有侵权行为联系本站删除。
扫一扫关注数字音视工程网公众号

相关阅读related

赛普,

评论comment

 
验证码:
您还能输入500