Shikun Liu Vision Language Reasoning

Media Summary: Sponsored by Evolution AI: Abstract: Recent Website: Abstract: Being able to carry out complicated QuantiPhy: A Quantitative Benchmark for Vision Language Physical Reasoning

Shikun Liu Vision Language Reasoning - Detailed Analysis & Overview

Sponsored by Evolution AI: Abstract: Recent Website: Abstract: Being able to carry out complicated QuantiPhy: A Quantitative Benchmark for Vision Language Physical Reasoning Authors: Wenbo Zheng, Lan Yan, Chao Gou, Fei-Yue Wang Description: Visual Speaker Intro: Liangyu Chen is a Research Engineer at MMLab, supervised by Prof Ziwei Jialong Wu, Tsinghua University, presented a talk in the MERL Seminar Series on March 25, 2026. Abstract: This talk introduces ...

DEPARTMENT OF APPLIED MATHEMATICS AND THEORETICAL PHYSICS, UNIVERSITY OF CAMBRIDGE Recording of the ... For CVPR 2023 Paper: arxiv.org/abs/2212.07796 Code: github.com/RAIVNLab/CREPE. GT NLP Seminar is an interactive talk series held bi-weekly, on Fridays 12:30 pm to 1:30 pm, where students/faculty/staff with ...

Photo Gallery

Shikun Liu | Vision-Language Reasoning with Multi-Modal Experts

[CVPR 2024] Situational Awareness Matters in 3D Vision Language Reasoning

QuantiPhy: A Quantitative Benchmark for Vision Language Physical Reasoning

Read a paper: Enhancing LLMs with vision

Speeding up Vision-Language Models: LocateAnything Decoding Comparison

Webly Supervised Knowledge Embedding Model for Visual Reasoning

Liangyu Chen - LLMs are Visual Reasoning Coordinators

Vision Language Models: PaLI-3 and COMM

[MERL Seminar Series Spring 2026] World Models and Human-like Reasoning

Inspiration Exchange - Scaling Causal Reasoning in LLM

CREPE: Can Vision Language Foundation Models Reason Compositionally?

Self-Supervised Language-and-Vision Reasoning

View Detailed Profile

Shikun Liu | Vision-Language Reasoning with Multi-Modal Experts

Shikun Liu | Vision-Language Reasoning with Multi-Modal Experts

Sponsored by Evolution AI: https://www.evolution.ai Abstract: Recent

[CVPR 2024] Situational Awareness Matters in 3D Vision Language Reasoning

[CVPR 2024] Situational Awareness Matters in 3D Vision Language Reasoning

Website: https://yunzeman.github.io/situation3d Abstract: Being able to carry out complicated

QuantiPhy: A Quantitative Benchmark for Vision Language Physical Reasoning

QuantiPhy: A Quantitative Benchmark for Vision Language Physical Reasoning

QuantiPhy: A Quantitative Benchmark for Vision Language Physical Reasoning

Read a paper: Enhancing LLMs with vision

Read a paper: Enhancing LLMs with vision

https://arxiv.org/abs/2302.00923 Multimodal Chain-of-Thought

Speeding up Vision-Language Models: LocateAnything Decoding Comparison

Speeding up Vision-Language Models: LocateAnything Decoding Comparison

How do we make

Webly Supervised Knowledge Embedding Model for Visual Reasoning

Webly Supervised Knowledge Embedding Model for Visual Reasoning

Authors: Wenbo Zheng, Lan Yan, Chao Gou, Fei-Yue Wang Description: Visual

Liangyu Chen - LLMs are Visual Reasoning Coordinators

Liangyu Chen - LLMs are Visual Reasoning Coordinators

Speaker Intro: Liangyu Chen is a Research Engineer at MMLab@NTU, supervised by Prof Ziwei

Vision Language Models: PaLI-3 and COMM

Vision Language Models: PaLI-3 and COMM

Like . Comment . Subscribe . Discord: https://discord.gg/pPAFwndTJd ...

[MERL Seminar Series Spring 2026] World Models and Human-like Reasoning

[MERL Seminar Series Spring 2026] World Models and Human-like Reasoning

Jialong Wu, Tsinghua University, presented a talk in the MERL Seminar Series on March 25, 2026. Abstract: This talk introduces ...

Inspiration Exchange - Scaling Causal Reasoning in LLM

Inspiration Exchange - Scaling Causal Reasoning in LLM

DEPARTMENT OF APPLIED MATHEMATICS AND THEORETICAL PHYSICS, UNIVERSITY OF CAMBRIDGE Recording of the ...

CREPE: Can Vision Language Foundation Models Reason Compositionally?

CREPE: Can Vision Language Foundation Models Reason Compositionally?

For CVPR 2023 Paper: arxiv.org/abs/2212.07796 Code: github.com/RAIVNLab/CREPE.

Self-Supervised Language-and-Vision Reasoning

Self-Supervised Language-and-Vision Reasoning

GT NLP Seminar is an interactive talk series held bi-weekly, on Fridays 12:30 pm to 1:30 pm, where students/faculty/staff with ...

Open-World Object Manipulation using Pre-Trained Vision-Language Models

Open-World Object Manipulation using Pre-Trained Vision-Language Models

Anonymous CoRL submission.