VQA

2019-05-29 Wed. Vision-to-Language Tasks Based on Attributes and Attention Mechanism arXiv_CV arXiv_CV Image_Caption Attention Caption Relation VQA
2019-05-28 Tue. Leveraging Medical Visual Question Answering with Supporting Facts arXiv_AI arXiv_AI QA GAN Transfer_Learning VQA
2019-05-26 Sun. Why do These Match? Explaining the Behavior of Image Similarity Models arXiv_CV arXiv_CV Salient Image_Classification Classification Deep_Learning VQA Recognition
2019-05-25 Sat. Adapting Visual Question Answering Models for Enhancing Multimodal Community Q&A Platforms arXiv_CV arXiv_CV Knowledge QA Attention GAN Represenation_Learning Classification VQA
2019-05-24 Fri. Self-Critical Reasoning for Robust Visual Question Answering arXiv_CV arXiv_CV QA Relation VQA
2019-05-16 Thu. Beyond Bilinear: Generalized Multimodal Factorized High-order Pooling for Visual Question Answering arXiv_CV arXiv_CV QA Attention Prediction Relation VQA
2019-05-13 Mon. Towards VQA Models That Can Read arXiv_CV arXiv_CV QA VQA
2019-05-13 Mon. Quantifying and Alleviating the Language Prior Problem in Visual Question Answering arXiv_CV arXiv_CV Regularization QA Attention Quantitative VQA
2019-05-07 Tue. TVQA: Localized, Compositional Video Question Answering arXiv_AI arXiv_AI QA VQA
2019-05-01 Wed. State-of-the-art in 360° Video/Image Processing: Perception, Assessment and Compression arXiv_CV arXiv_CV Review QA Attention Survey VQA
2019-04-26 Fri. The Neuro-Symbolic Concept Learner: Interpreting Scenes, Words, and Sentences From Natural Supervision arXiv_AI arXiv_AI VQA
2019-04-25 Thu. Scene Graph Prediction with Limited Labels arXiv_CV arXiv_CV Sparse Knowledge Caption Transfer_Learning Prediction Relation VQA
2019-04-25 Thu. TVQA+: Spatio-Temporal Grounding for Video Question Answering arXiv_AI arXiv_AI QA VQA
2019-04-19 Fri. Challenges and Prospects in Vision and Language Research arXiv_CV arXiv_CV Image_Caption Review VQA
2019-04-18 Thu. Towards VQA Models that can Read arXiv_CV arXiv_CV QA VQA
2019-04-18 Thu. Progressive Attention Memory Network for Movie Story Question Answering arXiv_CV arXiv_CV QA Attention Inference Prediction VQA
2019-04-17 Wed. Question Guided Modular Routing Networks for Visual Question Answering arXiv_CV arXiv_CV Knowledge QA Face VQA
2019-04-12 Fri. Evaluating the Representational Hub of Language and Vision Models arXiv_CV arXiv_CV VQA
2019-04-11 Thu. Factor Graph Attention arXiv_AI arXiv_AI Attention VQA
2019-04-10 Wed. Text Guided Person Image Synthesis arXiv_CV arXiv_CV QA VQA
2019-04-10 Wed. GQA: A New Dataset for Real-World Visual Reasoning and Compositional Question Answering arXiv_CV arXiv_CV QA RNN VQA
2019-04-09 Tue. Multi-Target Embodied Question Answering arXiv_CV arXiv_CV QA VQA
2019-04-07 Sun. Transfer Learning via Unsupervised Task Discovery for Visual Question Answering arXiv_CV arXiv_CV Knowledge Transfer_Learning VQA Recognition
2019-04-06 Sat. Recursive Visual Attention in Visual Dialog arXiv_CV arXiv_CV QA Attention Quantitative VQA
2019-04-05 Fri. Lucid Explanations Help: Using a Human-AI Image-Guessing Game to Evaluate Machine Explanation Helpfulness arXiv_CV arXiv_CV QA VQA
2019-04-05 Fri. Actively Seeking and Learning from Live Data arXiv_CV arXiv_CV QA Face Caption VQA
2019-04-04 Thu. MMED: A Multi-domain and Multi-modality Event Dataset arXiv_CV arXiv_CV Knowledge GAN VQA
2019-03-29 Fri. Relation-aware Graph Attention Network for Visual Question Answering arXiv_AI arXiv_AI QA Attention Relation VQA
2019-03-27 Wed. Information Maximizing Visual Question Generation arXiv_CV arXiv_CV Quantitative VQA
2019-03-26 Tue. Dual Recurrent Attention Units for Visual Question Answering arXiv_CV arXiv_CV Knowledge QA Attention CNN VQA
2019-03-16 Sat. Visual Query Answering by Entity-Attribute Graph Matching and Reasoning arXiv_CV arXiv_CV QA Inference VQA
2019-03-14 Thu. Episodic Memory Reader: Learning What to Remember for Question Answering from Streaming Data arXiv_CL arXiv_CL QA VQA
2019-03-13 Wed. AI2-THOR: An Interactive 3D Environment for Visual AI arXiv_AI arXiv_AI Object_Detection Segmentation Reinforcement_Learning Represenation_Learning Detection VQA
2019-03-07 Thu. RAVEN: A Dataset for Relational and Analogical Visual rEasoNing arXiv_AI arXiv_AI QA Tracking Detection Relation VQA Recognition
2019-03-04 Mon. Dynamic Fusion with Intra- and Inter- Modality Attention Flow for Visual Question Answering arXiv_CV arXiv_CV QA Attention VQA
2019-03-03 Sun. Learning More with Less: Conditional PGGAN-based Data Augmentation for Brain Metastases Detection Using Highly-Rough Annotation on MR Images arXiv_CV arXiv_CV Adversarial GAN CNN Detection VQA
2019-03-01 Fri. Answer Them All! Toward Universal Visual Question Answering Models arXiv_CV arXiv_CV Image_Caption QA VQA
2019-02-26 Tue. Learning More with Less: Conditional PGGAN-based Data Augmentation for Brain Metastases Detection Using Highly-Rough Annotation on MR images arXiv_CV arXiv_CV Adversarial GAN CNN Detection VQA
2019-02-25 Mon. GQA: a new dataset for compositional question answering over real-world images arXiv_AI arXiv_AI QA RNN VQA
2019-02-25 Mon. MUREL: Multimodal Relational Reasoning for Visual Question Answering arXiv_AI arXiv_AI QA Attention Relation VQA
2019-02-25 Mon. Dual Attention Networks for Visual Reference Resolution in Visual Dialog arXiv_CV arXiv_CV QA Attention Quantitative Relation VQA
2019-02-22 Fri. Systematic Generalization: What Is Required and Can It Be Learned? arXiv_CV arXiv_CV Knowledge QA VQA
2019-02-21 Thu. Probabilistic Neural-symbolic Models for Interpretable Visual Question Answering arXiv_AI arXiv_AI QA Prediction VQA
2019-02-15 Fri. Generating Natural Language Explanations for Visual Question Answering using Scene Graphs and Visual Attention arXiv_AI arXiv_AI QA Attention Caption Language_Model Relation VQA
2019-02-15 Fri. Cycle-Consistency for Robust Visual Question Answering arXiv_CV arXiv_CV QA VQA
2019-02-11 Mon. Taking a HINT: Leveraging Explanations to Make Vision and Language Models More Grounded arXiv_CV arXiv_CV Image_Caption QA Attention Caption Language_Model Prediction VQA
2019-02-01 Fri. Rethinking Visual Relationships for High-level Image Understanding arXiv_CV arXiv_CV Image_Caption Caption Relation VQA
2019-01-31 Thu. BLOCK: Bilinear Superdiagonal Fusion for Visual Question Answering and Visual Relationship Detection arXiv_CV arXiv_CV QA Represenation_Learning Deep_Learning Detection Relation VQA
2019-01-21 Mon. Visual Entailment Task for Visually-Grounded Language Learning arXiv_CV arXiv_CV QA Inference VQA
2019-01-20 Sun. Visual Entailment: A Novel Task for Fine-Grained Image Understanding arXiv_CV arXiv_CV Image_Caption QA Attention Inference VQA
2019-01-18 Fri. Learning a Deep Convolution Network with Turing Test Adversaries for Microscopy Image Super Resolution arXiv_CV arXiv_CV Adversarial Super_Resolution CNN VQA
2019-01-15 Tue. Assessing Visual Quality of Omnidirectional Videos arXiv_CV arXiv_CV Knowledge QA VQA
2019-01-14 Mon. Neural-Symbolic VQA: Disentangling Reasoning from Vision and Language Understanding arXiv_CV arXiv_CV Knowledge QA Represenation_Learning VQA Recognition
2019-01-03 Thu. CLEVR-Ref+: Diagnosing Visual Reasoning with Referring Expressions arXiv_CV arXiv_CV Object_Detection Knowledge Segmentation Quantitative Detection VQA
2018-12-25 Tue. A Novel Framework for Robustness Analysis of Visual QA Models arXiv_CV arXiv_CV Adversarial QA Optimization VQA
2018-12-23 Sun. Multi-modal Learning with Prior Visual Relation Reasoning arXiv_CV arXiv_CV Image_Caption Knowledge QA Embedding CNN Relation VQA
2018-12-03 Mon. Multi-task Learning of Hierarchical Vision-Language Representation arXiv_CV arXiv_CV Image_Caption Knowledge Attention Caption Prediction Relation VQA
2018-12-01 Sat. Improved Fusion of Visual and Language Representations by Dense Symmetric Co-Attention for Visual Question Answering arXiv_CV arXiv_CV QA Attention Prediction VQA
2018-11-30 Fri. From Known to the Unknown: Transferring Knowledge to Answer Questions about Novel Visual and Semantic Concepts arXiv_CV arXiv_CV Knowledge QA Attention Embedding Inference VQA
2018-11-29 Thu. Visual Question Answering as Reading Comprehension arXiv_CV arXiv_CV Knowledge QA VQA
2018-11-19 Mon. Explicit Bias Discovery in Visual Question Answering Models arXiv_CV arXiv_CV QA Attention VQA
2018-11-08 Thu. Overcoming Language Priors in Visual Question Answering with Adversarial Regularization arXiv_CV arXiv_CV Regularization Adversarial QA Relation VQA
2018-11-02 Fri. Zero-Shot Transfer VQA Dataset arXiv_CV arXiv_CV Knowledge QA GAN VQA
2018-11-01 Thu. Learning Conditioned Graph Structures for Interpretable Visual Question Answering arXiv_CV arXiv_CV Image_Caption QA Relation VQA
2018-10-31 Wed. TallyQA: Answering Complex Counting Questions arXiv_CV arXiv_CV Object_Detection QA Detection Relation VQA
2018-10-31 Wed. Gated Hierarchical Attention for Image Captioning arXiv_CV arXiv_CV Image_Caption Attention Reinforcement_Learning Caption CNN Prediction VQA Recognition
2018-10-29 Mon. Do Explanations make VQA Models more Predictable to a Human? arXiv_CV arXiv_CV QA VQA
2018-10-19 Fri. Bilinear Attention Networks arXiv_CV arXiv_CV QA Attention Quantitative VQA
2018-10-09 Tue. Knowing Where to Look? Analysis on Attention of Visual Question Answering System arXiv_CV arXiv_CV QA Attention VQA
2018-09-26 Wed. Convolutional Neural Networks for Video Quality Assessment arXiv_CV arXiv_CV QA CNN Deep_Learning VQA
2018-09-23 Sun. Textually Enriched Neural Module Networks for Visual Question Answering arXiv_CV arXiv_CV Image_Caption Knowledge QA Attention Caption VQA Recognition
2018-09-12 Wed. The Wisdom of MaSSeS: Majority, Subjectivity, and Semantic Similarity in the Evaluation of VQA arXiv_CV arXiv_CV QA Quantitative VQA
2018-09-08 Sat. Faithful Multimodal Explanation for Visual Question Answering arXiv_CV arXiv_CV QA VQA
2018-09-06 Thu. Visual Coreference Resolution in Visual Dialog using Neural Module Networks arXiv_CV arXiv_CV QA VQA
2018-09-06 Thu. Interpretable Visual Question Answering by Reasoning on Dependency Trees arXiv_CV arXiv_CV QA Attention Relation VQA
2018-08-29 Wed. From VQA to Multimodal CQA: Adapting Visual QA Models for Community QA Tasks arXiv_CV arXiv_CV Knowledge QA Classification VQA
2018-08-25 Sat. VQA-E: Explaining, Elaborating, and Enhancing Your Answers for Visual Questions arXiv_CV arXiv_CV QA Caption Prediction Quantitative VQA
2018-08-16 Thu. NMT-Keras: a Very Flexible Toolkit with a Focus on Interactive NMT and Online Learning arXiv_CV arXiv_CV Video_Caption Caption NMT Classification Deep_Learning VQA
2018-08-12 Sun. Multimodal Differential Network for Visual Question Generation arXiv_CV arXiv_CV Caption Quantitative VQA
2018-08-08 Wed. Question-Guided Hybrid Convolution for Visual Question Answering arXiv_CV arXiv_CV QA Attention Relation VQA
2018-08-07 Tue. A Joint Sequence Fusion Model for Video Question Answering and Retrieval arXiv_CV arXiv_CV QA Attention CNN VQA
2018-08-06 Mon. Visual Reference Resolution using Attention Memory for Visual Dialog arXiv_CV arXiv_CV QA Attention Prediction VQA
2018-08-01 Wed. Interpretable Visual Question Answering by Visual Grounding from Attention Supervision Mining arXiv_CV arXiv_CV QA Attention Relation VQA
2018-07-29 Sun. Bridge the Gap Between VQA and Human Behavior on Omnidirectional Video: A Large-Scale Dataset and a Deep Learning Model arXiv_CV arXiv_CV QA Deep_Learning VQA
2018-07-28 Sat. A user model for JND-based video quality assessment: theory and applications arXiv_CV arXiv_CV QA Attention VQA
2018-07-27 Fri. Pythia v0.1: the Winning Entry to the VQA Challenge 2018 arXiv_CV arXiv_CV QA Face VQA
2018-07-24 Tue. On the Flip Side: Identifying Counterexamples in Visual Question Answering arXiv_CV arXiv_CV QA Prediction VQA
2018-07-23 Mon. Question Relevance in Visual Question Answering arXiv_CV arXiv_CV QA VQA
2018-07-22 Sun. Reciprocal Attention Fusion for Visual Question Answering arXiv_CV arXiv_CV QA Attention Relation VQA
2018-07-20 Fri. A Dataset and Architecture for Visual Reasoning with a Working Memory arXiv_CV arXiv_CV QA Deep_Learning VQA
2018-07-20 Fri. R-VQA: Learning Visual Relation Facts with Semantic Attention for Visual Question Answering arXiv_CV arXiv_CV Object_Detection Knowledge QA Attention Embedding Detection Relation VQA
2018-07-18 Wed. Question Type Guided Attention in Visual Question Answering arXiv_CV arXiv_CV QA Attention VQA Recognition
2018-07-02 Mon. A JND-based Video Quality Assessment Model and Its Application arXiv_CV arXiv_CV QA VQA
2018-06-30 Sat. End-to-End Audio Visual Scene-Aware Dialog using Multimodal Attention-Based Video Features arXiv_CV arXiv_CV QA Attention Caption VQA
2018-06-13 Wed. Learning Visual Knowledge Memory Networks for Visual Question Answering arXiv_CV arXiv_CV Knowledge QA Embedding Relation Memory_Networks VQA
2018-06-12 Tue. iParaphrasing: Extracting Visually Grounded Paraphrases via an Image arXiv_CV arXiv_CV Image_Caption Attention Caption VQA
2018-06-08 Fri. CS-VQA: Visual Question Answering with Compressively Sensed Images arXiv_CV arXiv_CV QA VQA Recognition
2018-06-03 Sun. Don't Just Assume; Look and Answer: Overcoming Priors for Visual Question Answering arXiv_CV arXiv_CV QA Attention Relation VQA Recognition
2018-05-26 Sat. Robustness Analysis of Visual QA Models by Basic Questions arXiv_CV arXiv_CV QA Optimization VQA
2018-05-25 Fri. A Case for Variability-Aware Policies for NISQ-Era Quantum Computers arXiv_CV arXiv_CV QA VQA
2018-05-22 Tue. Joint Image Captioning and Question Answering arXiv_CV arXiv_CV Image_Caption Knowledge QA Caption VQA
2018-05-20 Sun. Tree Memory Networks for Modelling Long-term Temporal Dependencies arXiv_CV arXiv_CV RNN Prediction Relation Memory_Networks VQA
2018-05-09 Wed. VizWiz Grand Challenge: Answering Visual Questions from Blind People arXiv_CV arXiv_CV QA VQA
2018-05-08 Tue. The Effects of Statistical Multiplicity of Infection on Virus Quantification and Infectivity Assays arXiv_CV arXiv_CV QA VQA
2018-04-06 Fri. Generalized Hadamard-Product Fusion Operators for Visual Question Answering arXiv_CV arXiv_CV QA VQA
2018-04-06 Fri. Fooling Vision and Language Models Despite Localization and Attention Mechanism arXiv_CV arXiv_CV Adversarial QA Attention Caption Language_Model VQA
2018-03-31 Sat. Visual Question Reasoning on General Dependency Tree arXiv_CV arXiv_CV Salient Adversarial Knowledge QA Attention Relation VQA
2018-03-29 Thu. Two can play this Game: Visual Dialog with Discriminative Question Generation and Answering arXiv_CV arXiv_CV Image_Caption Caption VQA
2018-03-29 Thu. DVQA: Understanding Data Visualizations via Question Answering arXiv_CV arXiv_CV QA Face VQA
2018-03-25 Sun. Visual Question Answering with Memory-Augmented Networks arXiv_CV arXiv_CV QA Attention VQA
2018-03-23 Fri. Explicit Reasoning over End-to-End Neural Architectures for Visual Question Answering arXiv_CV arXiv_CV Knowledge QA Face Language_Model Relation VQA
2018-03-21 Wed. Attention on Attention: Architectures for Visual Question Answering arXiv_CV arXiv_CV QA Attention Deep_Learning VQA
2018-03-16 Fri. Inverse Visual Question Answering: A New Benchmark and VQA Diagnosis Tool arXiv_CV arXiv_CV QA Reinforcement_Learning VQA
2018-03-16 Fri. iVQA: Inverse Visual Question Answering arXiv_CV arXiv_CV QA Attention Inference VQA
2018-03-14 Wed. Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering arXiv_CV arXiv_CV Image_Caption Salient QA Attention Caption VQA
2018-03-08 Thu. ParlAI: A Dialog Research Software Platform arXiv_CV arXiv_CV QA Reinforcement_Learning RNN Memory_Networks VQA
2018-03-02 Fri. Interpretable Counting for Visual Question Answering arXiv_CV arXiv_CV QA VQA
2018-02-15 Thu. Learning to Count Objects in Natural Images for Visual Question Answering arXiv_CV arXiv_CV QA Attention VQA
2018-02-07 Wed. Generating Triples with Adversarial Networks for Scene Graph Construction arXiv_CV arXiv_CV Image_Caption Adversarial Object_Detection Attention GAN Caption Image_Classification Classification Deep_Learning Detection Relation VQA
2018-01-29 Mon. Object-based reasoning in VQA arXiv_CV arXiv_CV Object_Detection QA Detection VQA
2018-01-29 Mon. Game of Sketches: Deep Recurrent Models of Pictionary-style Word Guessing arXiv_CV arXiv_CV QA VQA
2018-01-27 Sat. Tell-and-Answer: Towards Explainable Visual Question Answering using Attributes and Captions arXiv_CV arXiv_CV Image_Caption Object_Detection QA Attention Caption Inference Detection VQA
2018-01-24 Wed. Structured Triplet Learning with POS-tag Guided Attention for Visual Question Answering arXiv_CV arXiv_CV Image_Caption QA Attention CNN VQA
2017-12-12 Tue. Co-attending Free-form Regions and Detections with Multi-modal Multiplicative Feature Embedding for Visual Question Answering arXiv_CV arXiv_CV QA Attention Embedding Detection VQA
2017-12-04 Mon. Learning by Asking Questions arXiv_CV arXiv_CV QA VQA
2017-12-03 Sun. Incorporating External Knowledge to Answer Open-Domain Visual Questions with Dynamic Memory Networks arXiv_CV arXiv_CV Knowledge_Graph Knowledge QA Dynamic_Memory_Network Attention Relation Memory_Networks VQA
2017-12-03 Sun. TGIF-QA: Toward Spatio-Temporal Reasoning in Visual Question Answering arXiv_CV arXiv_CV QA Attention RNN VQA
2017-11-22 Wed. Visual Question Answering as a Meta Learning Task arXiv_CV arXiv_CV QA VQA
2017-11-12 Sun. High-Order Attention Models for Visual Question Answering arXiv_CV arXiv_CV QA Attention Relation VQA
2017-11-06 Mon. Active Learning for Visual Question Answering: An Empirical Study arXiv_CV arXiv_CV QA VQA
2017-10-16 Mon. Aligned Image-Word Representations Improve Inductive Transfer Across Vision-Language Tasks arXiv_CV arXiv_CV QA Embedding VQA Recognition
2017-10-15 Sun. Optimally Stopped Variational Quantum Algorithms arXiv_CV arXiv_CV QA Optimization VQA
2017-10-02 Mon. It Takes Two to Tango: Towards Theory of AI's Mind arXiv_CV arXiv_CV Knowledge QA Attention Prediction VQA
2017-09-24 Sun. Survey of Recent Advances in Visual Question Answering arXiv_CV arXiv_CV QA Survey VQA
2017-09-21 Thu. Visual Question Generation as Dual Task of Visual Question Answering arXiv_CV arXiv_CV QA Relation VQA
2017-09-19 Tue. Exploring Human-like Attention Supervision in Visual Question Answering arXiv_CV arXiv_CV QA Attention VQA
2017-09-16 Sat. Speech-Based Visual Question Answering arXiv_CV arXiv_CV QA Speech_Recognition VQA Recognition
2017-09-13 Wed. An Analysis of Visual Question Answering Algorithms arXiv_CV arXiv_CV QA Attention GAN VQA
2017-08-28 Mon. VQABQ: Visual Question Answering by Basic Questions arXiv_CV arXiv_CV QA Optimization VQA
2017-08-17 Thu. The Promise of Premise: Harnessing Question Premises in Visual Question Answering arXiv_CV arXiv_CV QA Prediction Detection Relation VQA
2017-08-15 Tue. VQS: Linking Segmentations to Questions and Answers for Supervised Attention in VQA and Question-Focused Semantic Segmentation arXiv_CV arXiv_CV QA Segmentation Attention Semantic_Segmentation Language_Model VQA
2017-08-10 Thu. Beyond Bilinear: Generalized Multi-modal Factorized High-order Pooling for Visual Question Answering arXiv_CV arXiv_CV QA Attention Prediction Relation VQA
2017-08-09 Wed. Learning to Disambiguate by Asking Discriminative Questions arXiv_CV arXiv_CV Image_Caption Weakly_Supervised Caption Quantitative VQA
2017-08-09 Wed. Tips and Tricks for Visual Question Answering: Learnings from the 2017 Challenge arXiv_CV arXiv_CV QA Attention Embedding VQA
2017-08-08 Tue. FVQA: Fact-based Visual Question Answering arXiv_CV arXiv_CV Knowledge QA Attention Relation VQA
2017-08-07 Mon. Structured Attentions for Visual Question Answering arXiv_CV arXiv_CV QA Attention Inference Relation VQA
2017-08-04 Fri. Multi-modal Factorized Bilinear Pooling with Co-Attention Learning for Visual Question Answering arXiv_CV arXiv_CV QA Attention VQA
2017-08-02 Wed. A Simple Loss Function for Improving the Convergence and Accuracy of Visual Question Answering Models arXiv_CV arXiv_CV QA Attention Deep_Learning VQA
2017-07-13 Thu. End-to-End Instance Segmentation with Recurrent Attention arXiv_CV arXiv_CV Image_Caption Segmentation Attention Caption CNN Semantic_Segmentation RNN Prediction VQA
2017-07-08 Sat. Effective Approaches to Batch Parallelization for Dynamic Neural Network Architectures arXiv_CV arXiv_CV Sparse QA VQA
2017-06-20 Tue. Compact Tensor Pooling for Visual Question Answering arXiv_CV arXiv_CV QA Embedding RNN VQA
2017-06-15 Thu. Visual Question Answering: Datasets, Algorithms, and Future Challenges arXiv_CV arXiv_CV Image_Caption Review QA Deep_Learning VQA
2017-05-29 Mon. Automatic Generation of Grounded Visual Questions arXiv_CV arXiv_CV Knowledge Caption VQA
2017-05-24 Wed. Bidirectional Beam Search: Forward-Backward Inference in Neural Sequence Models for Fill-in-the-Blank Image Captioning arXiv_CV arXiv_CV Image_Caption Caption Inference VQA
2017-05-18 Thu. MUTAN: Multimodal Tucker Fusion for Visual Question Answering arXiv_CV arXiv_CV QA Relation VQA
2017-05-15 Mon. Making the V in VQA Matter: Elevating the Role of Image Understanding in Visual Question Answering arXiv_CV arXiv_CV Image_Caption QA VQA
2017-05-11 Thu. Survey of Visual Question Answering: Datasets and Techniques arXiv_CV arXiv_CV QA Attention Survey Deep_Learning VQA
2017-05-09 Tue. Counting Everyday Objects in Everyday Scenes arXiv_CV arXiv_CV Object_Detection QA Detection VQA
2017-05-04 Thu. DualNet: Domain-Invariant Network for Visual Question Answering arXiv_CV arXiv_CV QA Attention Embedding VQA
2017-04-26 Wed. C-VQA: A Compositional Split of the Visual Question Answering v1.0 Dataset arXiv_CV arXiv_CV QA Attention Deep_Learning Relation VQA
2017-04-12 Wed. What's in a Question: Using Visual Questions as a Form of Supervision arXiv_CV arXiv_CV QA Quantitative VQA
2017-04-12 Wed. Show, Ask, Attend, and Answer: A Strong Baseline For Visual Question Answering arXiv_CV arXiv_CV QA VQA
2017-03-30 Thu. Graph-Structured Representations for Visual Question Answering arXiv_CV arXiv_CV QA RNN VQA
2017-03-26 Sun. Hadamard Product for Low-rank Bilinear Pooling arXiv_CV arXiv_CV QA Segmentation Attention VQA Recognition
2017-03-23 Thu. Multimodal Compact Bilinear Pooling for Multimodal Neural Machine Translation arXiv_CV arXiv_CV Image_Caption Attention Caption VQA
2017-03-21 Tue. Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization arXiv_CV arXiv_CV Adversarial QA Attention Reinforcement_Learning Caption CNN Image_Classification Classification Prediction VQA
2017-03-21 Tue. Dual Attention Networks for Multimodal Reasoning and Matching arXiv_CV arXiv_CV QA Attention Inference VQA
2017-02-22 Wed. Task-driven Visual Saliency and Attention-based Visual Question Answering arXiv_CV arXiv_CV Salient QA Attention RNN Relation VQA
2017-01-25 Wed. Grad-CAM: Why did you say that? arXiv_CV arXiv_CV Image_Caption QA Caption CNN Prediction Relation VQA
2017-01-19 Thu. Hierarchical Question-Image Co-Attention for Visual Question Answering arXiv_CV arXiv_CV QA Attention CNN VQA
2016-12-19 Mon. Leveraging Video Descriptions to Learn Video Question Answering arXiv_CV arXiv_CV Video_Caption QA VQA
2016-12-16 Fri. Image Captioning and Visual Question Answering Based on Attributes and External Knowledge arXiv_CV arXiv_CV Image_Caption Knowledge Caption CNN RNN VQA
2016-12-16 Fri. The VQA-Machine: Learning How to Use Existing Vision Algorithms to Answer New Questions arXiv_CV arXiv_CV QA Segmentation Attention Detection VQA
2016-12-12 Mon. VIBIKNet: Visual Bidirectional Kernelized Network for Visual Question Answering arXiv_CV arXiv_CV QA CNN VQA
2016-11-24 Thu. Ask Your Neurons: A Deep Learning Approach to Visual Question Answering arXiv_CV arXiv_CV Image_Caption QA Deep_Learning VQA
2016-11-22 Tue. Revisiting Visual Question Answering Baselines arXiv_CV arXiv_CV Image_Caption QA Attention Classification VQA
2016-11-20 Sun. Zero-Shot Visual Question Answering arXiv_CV arXiv_CV QA Embedding VQA
2016-10-27 Thu. VQA: Visual Question Answering arXiv_CV arXiv_CV Image_Caption QA Caption VQA
2016-10-24 Mon. Proposing Plausible Answers for Open-ended Visual Question Answering arXiv_CV arXiv_CV QA VQA
2016-10-09 Sun. Open-Ended Visual Question-Answering arXiv_CV arXiv_CV QA Embedding CNN RNN Deep_Learning VQA
2016-10-07 Fri. Diverse Beam Search: Decoding Diverse Solutions from Neural Sequence Models arXiv_CV arXiv_CV Image_Caption Caption Inference Quantitative VQA
2016-10-04 Tue. Tutorial on Answering Questions about Images with Deep Learning arXiv_CV arXiv_CV QA RNN Deep_Learning VQA
2016-09-30 Fri. Training Recurrent Answering Units with Joint Loss Minimization for VQA arXiv_CV arXiv_CV Knowledge QA Attention Inference Prediction VQA
2016-09-27 Tue. Analyzing the Behavior of Visual Question Answering Models arXiv_CV arXiv_CV QA Attention VQA
2016-09-26 Mon. Question Relevance in VQA: Identifying Non-Visual And False-Premise Questions arXiv_CV arXiv_CV QA Caption RNN VQA
2016-09-24 Sat. Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding arXiv_CV arXiv_CV QA Attention VQA
2016-09-21 Wed. The Color of the Cat is Gray: 1 Million Full-Sentences Visual Question Answering arXiv_CV arXiv_CV QA Caption VQA
2016-09-09 Fri. Towards Transparent AI Systems: Interpreting Visual Question Answering Models arXiv_CV arXiv_CV QA Attention Quantitative VQA
2016-08-31 Wed. Leveraging Visual Question Answering for Image-Caption Ranking arXiv_CV arXiv_CV Image_Caption Image_Retrieval Knowledge QA Caption VQA
2016-08-31 Wed. Measuring Machine Intelligence Through Visual Question Answering arXiv_CV arXiv_CV Image_Caption Caption VQA
2016-08-29 Mon. Visual Question: Predicting If a Crowd Will Agree on the Answer arXiv_CV arXiv_CV QA VQA
2016-08-11 Thu. Solving Visual Madlibs with Multiple Cues arXiv_CV arXiv_CV QA Classification Prediction Relation VQA
2016-07-28 Thu. Learning Models for Actions and Person-Object Interactions with Transfer to Question Answering arXiv_CV arXiv_CV QA CNN Classification Prediction Relation VQA
2016-07-20 Wed. Visual Question Answering: A Survey of Methods and Datasets arXiv_CV arXiv_CV Review Knowledge QA Attention Face Survey CNN RNN VQA
2016-06-17 Fri. Human Attention in Visual Question Answering: Do Humans and Deep Networks Look at the Same Regions? arXiv_CV arXiv_CV QA Attention Face Quantitative Relation VQA
2016-06-10 Fri. Improved Techniques for Training GANs arXiv_CV arXiv_CV Adversarial GAN Classification VQA
2016-06-09 Thu. Generating Natural Questions About an Image arXiv_CV arXiv_CV Image_Caption Knowledge Caption Inference VQA
2016-04-28 Thu. What value do explicit high level concepts have in vision to language problems? arXiv_CV arXiv_CV Image_Caption Caption CNN RNN VQA
2016-04-26 Tue. Subjective Assessment of H.264 Compressed Stereoscopic Video arXiv_CV arXiv_CV QA Attention Relation VQA
2016-04-19 Tue. Yin and Yang: Balancing and Answering Binary Visual Questions arXiv_CV arXiv_CV QA VQA Recognition
2016-04-14 Thu. Ask Me Anything: Free-form Visual Question Answering Based on Knowledge from External Sources arXiv_CV arXiv_CV Knowledge QA VQA
2016-04-06 Wed. A Focused Dynamic Attention Model for Visual Question Answering arXiv_CV arXiv_CV Object_Detection QA Attention RNN Detection VQA Recognition
2016-04-03 Sun. ABC-CNN: An Attention Based Convolutional Neural Network for Visual Question Answering arXiv_CV arXiv_CV QA Attention CNN Deep_Learning VQA
2016-03-31 Thu. Neural Attention Models for Sequence Classification: Analysis and Application to Key Term Extraction and Dialogue Act Detection arXiv_CV arXiv_CV Image_Caption Attention Speech_Recognition Caption Classification Detection VQA Recognition
2016-03-19 Sat. Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for Visual Question Answering arXiv_CV arXiv_CV Image_Caption QA Attention Caption CNN Inference RNN Memory_Networks VQA
2016-03-04 Fri. Dynamic Memory Networks for Visual and Textual Question Answering arXiv_CV arXiv_CV Dynamic_Memory_Network Attention Memory_Networks VQA
2016-01-10 Sun. Where To Look: Focus Regions for Visual Question Answering arXiv_CV arXiv_CV Knowledge QA VQA
2015-12-16 Wed. A Restricted Visual Turing Test for Deep Scene and Event Understanding arXiv_CV arXiv_CV Video_Caption Knowledge Face Ontology Caption Inference VQA
2015-12-15 Tue. Simple Baseline for Visual Question Answering arXiv_CV arXiv_CV QA RNN VQA
2015-12-10 Thu. Neural Self Talk: Image Understanding via Continuous Questioning and Answering arXiv_CV arXiv_CV Image_Caption QA CNN RNN VQA
2015-11-18 Wed. Compositional Memory for Visual Question Answering arXiv_CV arXiv_CV QA Attention RNN Deep_Learning VQA

Content

VQA (211)