Facebook的慢速视频分类器AI

2019-11-06 19:42:50 阅读：9333+ 作者：责任编辑NO。谢兰花0258

修改 | TGS

灵长类动物的视网膜神经节细胞能从感光器接纳视觉信息，然后再传递到大脑，但有必要留意一下的是，并不是一切的眼部细胞都具有这种精细的才能，科学家经过测验发现，80%的细胞只能在低频率下作业并辨认出纤细的细节，剩余的20%才能对快速的改变做出反响。

这种生物学上的二分法激发了Facebook人工智能研讨的科学家们去寻求他们所说的“慢速AI”。他们研制出了一个结构，是PyTorch结构的一个完成，名为SlowFast，能够在GitHub上运用，一起也能够正常的运用经过训练的模型。这是一种用于视频辨认的机器学习架构，他们宣称，在动作分类和镜头检测方面都具有“强壮的功能”。

研讨小组在一篇预印本论文中指出，慢速运动在计算上比快速运动愈加常见，并且对色彩、纹路和灯火等语义的辨认能够在不影响精确性的情况下缓慢改写。另一方面，它们比主体标识开展得更快，能够在高时刻分辨率下，剖析已履行的动作。

“慢速”的效果有两种完成方法，其间一种以较低的帧速率和较慢的改写速度运转，优化捕捉少数图画或稀少帧给出的信息。另一种途径则以快速改写速度和高时刻分辨率，捕捉快速改变的运动。

研讨人员断语，经过以不同的时刻速率处理原始视频，较慢的途径更长于辨认结构中不变或许改变缓慢的静态区域，而较快的途径则能够学会精确地揣度动态区域中的操作。这两条通路的信息被交融后，用快速通路的数据，经过网络的横向衔接进入慢速通路，能够使慢速途径能够感知来自快速途径的成果，并将其送到一个分类层中。

为了评价SlowFast的功能，该团队在两个盛行的数据集上测验了该模型，这两个模型分别是：DeepMind的Kinetics-400和谷歌的AVA。

前者包含不计其数个YouTube上的10秒短视频，其间至少400个视频中包含了不同类别的人类行为。AVA则具有430个带注释的15分钟YouTube视频和80个带注释的视觉动作。

SlowFast在这两个数据集上都获得了前史最佳成果，并完成了28.3的mAP均匀精度中值，研讨人员在论文最终写道：“咱们期望这一‘慢速’概念能促进视频辨认的进一步研讨……咱们现已证明，经过削减通道容量，快速通道能够变得十分轻，一起还能够学习有用的视频辨认时刻信息。时刻轴是一个特别的维度，这篇论文首要便是比照沿着这条轴线的速度，研讨了一个修建型规划。”

听说在看的没有BUG

上一篇：男生的这些小动作其实是在暗示我喜爱你小仙

下一篇：当人类抵达世界的边际咱们将手伸出世界会有

“如果发现本网站发布的资讯影响到您的版权，可以联系本站！同时欢迎来本站投稿！

Facebook的慢速视频分类器AI

热门文章