主页

「论文解读」 A Joint Sequence Fusion Model for Video Question Answering and Retrieval

论文发表时间:2018-08-07 ECCV 2018 论文地址: https://arxiv.org/abs/1808.02559 官方代码: tensorflow https://github.com/yj-yu/lsmdc 研究的问题:视频问答/文本-视频检索 难点:子序列匹配; 现有的方法: 将跨模态特征表示成单个向量进行匹配,只能进行整体匹配,无法匹配到子序列; 1 一句话总结文章 针对两种模态的序列数据,提出了可以度量子序列的方法; 2 方案 前导知识:深度学习基本知识,CNN,RNN, 视频检索, 视频问答 2.1 模型结构  图1:网络结构 2.2 特征表示 Joint Semantic Tensor F...

阅读更多

「CV」 图片检索概述

也就是通常说的以图搜图,通常的做法是抽取特征,比如 Trace变换,图像哈希或者 Sift 特征向量等,然后计算特征的距离; 相关资料:图像检索资源 · 视频检索概述

阅读更多

「C++」 线性运算库汇总

1 引言 MKL 和 OpenBLAS 都提供了比较好的性能,MKL 性能还更好一点; 2 常用库1 2.1 EIGEN 是一个线性算术的开源 C++ 模板库;功能强大、快速、优雅以及支持多平台,可以使用该库来方便处理一些矩阵的操作,达到类似 matlab 那样的快捷; 支持稠密矩阵(Dense Matrix)和稀疏矩阵(Sparse Matrix)运算,并内置实现了对两种矩阵的求解器(Solver);使用 Eigen 十分简单,因为是模板库,所以只需要将头文件拷入 include 目录即可,缺点是编译时比较费时。Eigen 的稠密矩阵运算在某些平台上的性能甚至接近 Intel MKL;虽然 Eigen 的求解器从效率来讲并不算最好,但将其作为矩阵容器是一个很好的选择,在求解大型...

阅读更多

「VIDEO」 关键帧提取概述

视频相比图像来说信息更加丰富,但是一个序列里冗余信息太多,如何无监督的提取关键帧的信息对于很多任务都是至关重要的; 相关资源:关键帧提取资源汇总、图片相似度度量概述

阅读更多