谷歌最新语义图像分割模型DeepLab-v3+现已开源

2024-01-05 13:08:00
miadmin
原创
210

Google 咨询软件工程师 Liang-Chieh Chen 以及 Yukun Zhu 显露,语义图像豆割的重要目标是为每个像素指定语义标签,比如途、天空、人或是狗等物体,不少的法式需求云云的功用,像是合成浅景深功效(Synthetic Shallow Depth-of-field)功效,操纵正在手机 Pixel 2 和 Pixel 2XL 上供应的人像形式(Portrait Mode),能主动恍惚人物的靠山,作出似乎单镜头反光相机的景深功效。

其余,正在大都影相 App 城市供应的及时影像豆割(Video Segmentation),比如比来 YouTube 楬橥的新功用,为影片换靠山的功用,也是语义影像豆割的操纵。

DeepLab-v3+ 正在 Tensorflow 长进行,操纵陈设于效劳器端的卷积神经搜集(CNN)骨干架构,以获取最佳的结果。除了代码之外,咨询团队也同时公然了 Tensorflow 模子操练以及评估法式,以及操纵 Pascal VOC 2012 与 Cityscapes 材料集操练的模子。

DeepLab-v3+ 技能是基于三年前的 DeepLab 模子,时期改善了卷积神经搜集特质萃取器、物体比例塑制模子以及搀杂前后内容的技能,再加长进步的模子操练流程,再有软硬件的升级,从 DeepLab-v2 到 DeepLab-v3,直到现正在楬橥的 DeepLab-v3+,功效一代比一代好。

DeepLab-v3+ 是由 DeepLab-v3 扩充而来,咨询团队扩充明晰码器模组,不妨细化豆割结果,不妨更精准的治理物体的边际,并进一步将深度卷积神经搜集操纵正在空间金字塔池化(Spatial Pyramid Pooling,SPP)妥协码器上,大幅晋升治理物体巨细以及区别长宽比例的技能,结果获得强而有力的语义豆割编码解码器搜集。

Liang-Chieh Chen 以及 Yukun Zhu 十分提到,跟着软硬件的升级,筑构正在卷积神经网途上确当代语义图像豆割功用,能够到达的水准仍然远远抢先5年前。

文章分类
联系我们
联系人: 王先生
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号