主页

「论文解读」 Where And When to Look? Spatio Temporal Attention for Action Recognition in Videos

ICLR 2019 论文发表时间:2018-10-01 作者:Lili Meng, Bo Zhao, Bo Chang(不列颠哥伦比亚大学), Gao Huang(康奈尔大学) 论文地址:https://arxiv.org/abs/1810.04511 1 一句话总结文章 第一句:在时间和空间同时使用注意力机制;注意力方法在视频分类中的普及; 第二句:使用时间-空间注意力机制和 RNN 助力视频分类; 第三句:弱监督视频定位; 2 基本流程 前导知识:CNN,深度学习基本知识,注意力,掩码 2.1 模型结构  图1:模型结构 $H_t$ 代表 $t$ 时刻的状态信息;$X_i$ 表示第 $i$ 帧图像的特征图,$\...

阅读更多

「论文解读」 Action Recognition Using Visual Attention

ICLR 2016 论文发表时间:2015-11-12 作者:Shikhar Sharma, Ryan Kiros & Ruslan Salakhutdinov 单位:Department of Computer Science, University of Toronto 论文地址:https://arxiv.org/abs/1511.04119 项目主页: http://shikharsharma.com/projects/action-recognition-attention/ 官方代码:Theano https://github.com/kracwarlock/action-recognition-visual-attention &emsp...

阅读更多

「VIDEO」 视频分类概述

video understanding · video classification · action recognition 知道这段视频在做什么:行为识别就是对时域预先分割好的序列判定其所属行为动作的类型,即“读懂行为”;

阅读更多