「论文解读」 Where And When to Look? Spatio Temporal Attention for Action Recognition in Videos
ICLR 2019
论文发表时间:2018-10-01
作者:Lili Meng, Bo Zhao, Bo Chang(不列颠哥伦比亚大学), Gao Huang(康奈尔大学)
论文地址:https://arxiv.org/abs/1810.04511
1 一句话总结文章
第一句:在时间和空间同时使用注意力机制;注意力方法在视频分类中的普及;
第二句:使用时间-空间注意力机制和 RNN 助力视频分类;
第三句:弱监督视频定位;
2 基本流程
前导知识:CNN,深度学习基本知识,注意力,掩码
2.1 模型结构
图1:模型结构
$H_t$ 代表 $t$ 时刻的状态信息;$X_i$ 表示第 $i$ 帧图像的特征图,$\...
「论文解读」 Action Recognition Using Visual Attention
ICLR 2016
论文发表时间:2015-11-12
作者:Shikhar Sharma, Ryan Kiros & Ruslan Salakhutdinov
单位:Department of Computer Science, University of Toronto
论文地址:https://arxiv.org/abs/1511.04119
项目主页: http://shikharsharma.com/projects/action-recognition-attention/
官方代码:Theano https://github.com/kracwarlock/action-recognition-visual-attention
&emsp...
「VIDEO」 视频分类概述
video understanding · video classification · action recognition
知道这段视频在做什么:行为识别就是对时域预先分割好的序列判定其所属行为动作的类型,即“读懂行为”;
共计 516 篇文章,26 页。