TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Visual Dialog	VisDial v0.9 val	HRE-QIH-D	MRR	0.5807	# 17
Visual Dialog	VisDial v0.9 val	HRE-QIH-D	Mean Rank	5.78	# 17
Visual Dialog	VisDial v0.9 val	HRE-QIH-D	R@1	43.82	# 17
Visual Dialog	VisDial v0.9 val	HRE-QIH-D	R@10	84.07	# 17
Visual Dialog	VisDial v0.9 val	HRE-QIH-D	R@5	74.68	# 16
Visual Dialog	VisDial v0.9 val	MN-QIH-D	MRR	0.5965	# 15
Visual Dialog	VisDial v0.9 val	MN-QIH-D	Mean Rank	5.46	# 15
Visual Dialog	VisDial v0.9 val	MN-QIH-D	R@1	45.55	# 15
Visual Dialog	VisDial v0.9 val	MN-QIH-D	R@10	85.37	# 15
Visual Dialog	VisDial v0.9 val	MN-QIH-D	R@5	76.22	# 15
Visual Dialog	VisDial v0.9 val	HRE-QIH-D	MRR	0.5846	# 16
Visual Dialog	VisDial v0.9 val	HRE-QIH-D	Mean Rank	5.72	# 16
Visual Dialog	VisDial v0.9 val	HRE-QIH-D	R@1	44.67	# 16
Visual Dialog	VisDial v0.9 val	HRE-QIH-D	R@10	84.22	# 16
Visual Dialog	VisDial v0.9 val	HRE-QIH-D	R@5	74.50	# 17
Visual Dialog	Visual Dialog v1.0 test-std	MN-QIH-D	NDCG (x 100)	47.5	# 75
Visual Dialog	Visual Dialog v1.0 test-std	MN-QIH-D	MRR (x 100)	55.5	# 59
Visual Dialog	Visual Dialog v1.0 test-std	MN-QIH-D	R@1	40.98	# 61
Visual Dialog	Visual Dialog v1.0 test-std	MN-QIH-D	R@5	72.30	# 49
Visual Dialog	Visual Dialog v1.0 test-std	MN-QIH-D	R@10	83.30	# 49
Visual Dialog	Visual Dialog v1.0 test-std	MN-QIH-D	Mean	5.92	# 27
Visual Dialog	Visual Dialog v1.0 test-std	MN-QIH-D	NDCG (x 100)	45.3	# 78
Visual Dialog	Visual Dialog v1.0 test-std	MN-QIH-D	MRR (x 100)	55.4	# 60
Visual Dialog	Visual Dialog v1.0 test-std	MN-QIH-D	R@1	40.95	# 62
Visual Dialog	Visual Dialog v1.0 test-std	MN-QIH-D	R@5	72.45	# 48
Visual Dialog	Visual Dialog v1.0 test-std	MN-QIH-D	R@10	82.83	# 51
Visual Dialog	Visual Dialog v1.0 test-std	MN-QIH-D	Mean	5.95	# 26
Visual Dialog	Visual Dialog v1.0 test-std	HRE-QIH-D	NDCG (x 100)	45.5	# 77
Visual Dialog	Visual Dialog v1.0 test-std	HRE-QIH-D	MRR (x 100)	54.2	# 62
Visual Dialog	Visual Dialog v1.0 test-std	HRE-QIH-D	R@1	39.93	# 63
Visual Dialog	Visual Dialog v1.0 test-std	HRE-QIH-D	R@5	70.45	# 51
Visual Dialog	Visual Dialog v1.0 test-std	HRE-QIH-D	R@10	81.50	# 61
Visual Dialog	Visual Dialog v1.0 test-std	HRE-QIH-D	Mean	6.41	# 19

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/visual-dialog/visual-dialog-on-visdial-v09-val)](https://paperswithcode.com/sota/visual-dialog-on-visdial-v09-val?p=visual-dialog)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/visual-dialog/visual-dialog-on-visual-dialog-v1-0-test-std)](https://paperswithcode.com/sota/visual-dialog-on-visual-dialog-v1-0-test-std?p=visual-dialog)`

Visual Dialog

CVPR 2017 · Abhishek Das, Satwik Kottur, Khushi Gupta, Avi Singh, Deshraj Yadav, José M. F. Moura, Devi Parikh, Dhruv Batra ·

We introduce the task of Visual Dialog, which requires an AI agent to hold a meaningful dialog with humans in natural, conversational language about visual content. Specifically, given an image, a dialog history, and a question about the image, the agent has to ground the question in image, infer context from history, and answer the question accurately. Visual Dialog is disentangled enough from a specific downstream task so as to serve as a general test of machine intelligence, while being grounded in vision enough to allow objective evaluation of individual responses and benchmark progress. We develop a novel two-person chat data-collection protocol to curate a large-scale Visual Dialog dataset (VisDial). VisDial v0.9 has been released and contains 1 dialog with 10 question-answer pairs on ~120k images from COCO, with a total of ~1.2M dialog question-answer pairs. We introduce a family of neural encoder-decoder models for Visual Dialog with 3 encoders -- Late Fusion, Hierarchical Recurrent Encoder and Memory Network -- and 2 decoders (generative and discriminative), which outperform a number of sophisticated baselines. We propose a retrieval-based evaluation protocol for Visual Dialog where the AI agent is asked to sort a set of candidate answers and evaluated on metrics such as mean-reciprocal-rank of human response. We quantify gap between machine and human performance on the Visual Dialog task via human studies. Putting it all together, we demonstrate the first 'visual chatbot'! Our dataset, code, trained models and visual chatbot are available on https://visualdialog.org

PDF Abstract CVPR 2017 PDF CVPR 2017 Abstract

Code

Add Remove Mark official

batra-mlp-lab/visdial-amt-chat official

facebookresearch/ParlAI

↳ Quickstart in

Colab

10,426

batra-mlp-lab/visdial

226

batra-mlp-lab/visdial-challenge-sta…

194

Cloud-CV/visual-chatbot

186

See all 11 implementations

Tasks

Add Remove

Chatbot

Retrieval

Visual Dialog

Datasets

Introduced in the Paper:

VisDial

Used in the Paper:

MS COCO

Visual Question Answering

Visual Question Answering v2.0

Visual7W

Visual Madlibs

Results from the Paper

Edit

Ranked #15 on Visual Dialog on VisDial v0.9 val

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Visual Dialog	VisDial v0.9 val	HRE-QIH-D	MRR	0.5807	# 17	Compare
			Mean Rank	5.78	# 17	Compare
			R@1	43.82	# 17	Compare
			R@10	84.07	# 17	Compare
			R@5	74.68	# 16	Compare
Visual Dialog	VisDial v0.9 val	MN-QIH-D	MRR	0.5965	# 15	Compare
			Mean Rank	5.46	# 15	Compare
			R@1	45.55	# 15	Compare
			R@10	85.37	# 15	Compare
			R@5	76.22	# 15	Compare
Visual Dialog	VisDial v0.9 val	HRE-QIH-D	MRR	0.5846	# 16	Compare
			Mean Rank	5.72	# 16	Compare
			R@1	44.67	# 16	Compare
			R@10	84.22	# 16	Compare
			R@5	74.50	# 17	Compare
Visual Dialog	Visual Dialog v1.0 test-std	MN-QIH-D	NDCG (x 100)	47.5	# 75	Compare
			MRR (x 100)	55.5	# 59	Compare
			R@1	40.98	# 61	Compare
			R@5	72.30	# 49	Compare
			R@10	83.30	# 49	Compare
			Mean	5.92	# 27	Compare
			NDCG (x 100)	45.3	# 78	Compare
			MRR (x 100)	55.4	# 60	Compare
			R@1	40.95	# 62	Compare
			R@5	72.45	# 48	Compare
			R@10	82.83	# 51	Compare
			Mean	5.95	# 26	Compare
Visual Dialog	Visual Dialog v1.0 test-std	HRE-QIH-D	NDCG (x 100)	45.5	# 77	Compare
			MRR (x 100)	54.2	# 62	Compare
			R@1	39.93	# 63	Compare
			R@5	70.45	# 51	Compare
			R@10	81.50	# 61	Compare
			Mean	6.41	# 19	Compare

Methods

Add Remove

Memory Network

Edit Social Preview

Visual Dialog

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove