首页 欧冠联赛正文

四川省教育考试院,当今干流切割网络有哪些?12篇文章一次带你看完-w优德88com

admin 欧冠联赛 2019-06-30 166 0

作者 | 孙叔桥

来历 | 转载自有三AI(ID: yanyousan_ai)

本文的12篇文章总结了当时干流的切割网络及其结构,包括从编解码结构到解码器规划;从感触野到多标准交融;从CNN到RNN与CRF;从2D切割到3D切割;从语义切割到实例切割和全景切割网络,感兴趣的朋友可以细心研读每一篇文章。

1 FCN

Fully Convolutional Network(FCN)是神经网络用于图画切割使命的开山祖师,后续提出的大部分根据编解码结构的图画切割网络都是从FCN上开展、改善而来的。

FCN用卷积层替换了分类网络结构中的全衔接层,然后得到稠密的切割成果,完结端到端练习。

一起,网络还将不同标准下的特征信息进行交融,完结更细节的图画切割。

2 SegNet

SegNet在FCN的基础上添加了解码器,构成现在切割使命中最盛行的编解码结构,并给出了不同解码器对作用的影响和原因。

此外,因为使用了根据方位信息的加码进程,相比较FCN而言,SegNet中的对应结构的体量要小得多。

3 空泛卷积

编解码结构中,为了平衡空间标准与核算量,一起增大网络结构的感触野,一般会对输入图画进行必定的下采样。为了康复切割成果的空间分辨率,解码器往往需求使用上采样或反卷积。

可是,根据插值的上采样作用一般不抱负,而反卷积操作则添加了核算量。根据此,DeepLab中就提出了“空泛卷积”的概念,在不添加参数个数的基础上,完结感触野与分辨率的操控。

4 ENet

图画切割的使命终究仍是要落脚于实践使用,而此前的网络结构最快也只能到达1fps,远不及实时所需求的10fps。

ENet根据空泛卷积,完结了NVIDIA TX1上分辨率480x320下的21.1fps。

此外,文中还介绍了规划实时网络结构所需求考虑的6个重要内容。

5 CRFasRNN

在许多核算机视觉使命中,后处理操作可以有用提高算法的质量。而在很多后处理办法中,条件随机场(CRF)的作用独占鳌头。

可是,CRF的理论性强,使用起来不方便。因而,CRFasRNN中提出以RNN的方式完结CRF的解决方案,然后让根据CRF的后处理变得简略。

6 PSPNet

不同感触野下所带来的上下文信息对图画切割而言十分重要,往往感触野挑选的恰当性会直接影响终究的切割作用,这种影响对极点标准(极大和极小)方针表现地尤为显着。

为了在同一级别下交融多标准下的上下文信息,PSPNet提出了池化金字塔结构,然后完结了可以了解方针所在环境的图画切割。

7 ParseNet

尽管从网络结构看,有些网络的理论感触野可以到达非常大,但实践上,理论感触野并不能等同于实践感触野,其掩盖和使用的信息也不行完好。

根据这个发现,ParseNet提出了根据池化的大局特征使用,然后完结大局特征与部分特征交融下的图画切割。

8 RefineNet

尽管前面的特征交融办法可以康复在核算进程中被下降的空间分辨率,可是这种康复往往没有使用完好的原始空间信息,然后导致终究成果中的信息丢掉。

根据此,RefineNet规划了空间分辨率的康复结构,完结了根据残差卷积模块(RCU)、多分辨率交融模块(MRF)和串联残差池化模块(CRP)下的高精度图画切割。

9 ReSeg

尽管CNN的作用不错,可是其需求依靠人工指定的核函数完结核算,然后约束了上下文的处理才能。因而,ReSeg提出根据双向循环神经网络(BRNN)完结切割,来战胜这种缺乏。

在ReNet的基础上,ReSeg经过顺次扫描相互笔直的两个方向,完结不一起序下的特征提取。

10 LSTM-CF

除了单纯根据2D的RGB图画的切割外,图画切割使命的完结还可以使用深度信息进行辅佐,然后完结纹路信息下无法判其他切割。

LSTM-CF根据ReNet和空泛卷积,完结结合了深度信息的图画切割。为精度提高和深度信息使用供给了一种思路。

11 DeepMask

除了语义切割,图画切割中还有其他两品种其他使命:实例切割和全景切割。

咱们经过DeepMask,给出了实例切割下的网络的规划思路。DeepMask可以一起完结前布景切割、远景语义切割和远景实例切割。

12 全景切割

语义切割与实例切割使命尽管类似,可是因为衡量不同,二者无法直接结合。为了完结整图内things类别和stuff类其他一起切割,全景切割使命提出了新的衡量。

全景切割使命下,图画内的每个像素点都有其对应的语义标签和实例标签(things类别),然后可以最大程度上地了解整幅图画。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。