Publications

Currently, my research focuses on multimodal AI systems that bridge computer vision, natural language processing, and machine learning. I work on developing intelligent agents that can understand and generate content across multiple modalities, with applications in video analysis, time series forecasting, and feature transformation.

10+ publications • 4 top-tier venues (CVPR, WACV, IJCAI) • 1 oral presentation

2025

arXiv'2508 MMTok: Multimodal Coverage Maximization for Efficient Inference of VLMs

Sixun Dong, Juhua Hu, Mian Zhang, Ming Yin, Yanjie Fu, Qi Qian

Paper (Coming Soon) / Code (Coming Soon) / Homepage

arXiv'2508 LiveMCP-101: Stress Testing and Diagnosing MCP-enabled Agents on Challenging Queries

Ming Yin, Dinghan Shen, Silei Xu, Jianbing Han, Sixun Dong, Mian Zhang, Yebowen Hu, Shujian Liu, Simin Ma, Song Wang, Sathish Reddy Indurthi, Xun Wang, Yiran Chen, Kaiqiang Song

Paper / Dataset (Coming Soon)

arXiv'2508 Complex Logical Instruction Generation

Mian Zhang, Shujian Liu, Sixun Dong, Ming Yin, Yebowen Hu, Xun Wang, Steven Ma, Song Wang, Sathish Reddy Indurthi, Haoyun Deng, Zhiyu Zoey Chen, Kaiqiang Song

Paper / Code / Benchmark / 知乎

arXiv'2506 Teaching Time Series to See and Speak: Forecasting with Aligned Visual and Textual Perspectives

Sixun Dong, Wei Fan, Teresa Wu, Yanjie Fu

Paper / Code / Homepage / Blog / 知乎

Under Review TimesFrame: Multi-Variable Time Series is a Video of Numerical Data

Sixun Dong, Nanxu Gong, Haoyue Bai, Xinyuan Wang, Wangyang Ying, Wei Fan, Yanjie Fu

Paper (Coming Soon)

arXiv'2505 Agentic Feature Augmentation: Unifying Selection and Generation with Teaming, Planning, and Memories

Nanxu Gong*, Sixun Dong*, Haoyue Bai, Xinyuan Wang, Wangyang Ying, Yanjie Fu

Paper

arXiv'2505 Sculpting Features from Noise: Reward-Guided Hierarchical Diffusion for Task-Optimal Feature Transformation

Nanxu Gong, Zijun Li, Sixun Dong, Haoyue Bai, Wangyang Ying, Xinyuan Wang, Yanjie Fu

Paper / Code

Under Review MECT: From Multimodal Knowledge Acquisition To Contrastive Embedding Construction For Generative Feature Transformation

Nanxu Gong, Sixun Dong, Haoyue Bai, Wangyang Ying, Yanjie Fu

Paper (Coming Soon)

arXiv Unsupervised feature transformation via in-context generation, generator-critic llm agents, and duet-play teaming

Nanxu Gong, Xinyuan Wang, Wangyang Ying, Haoyue Bai, Sixun Dong, Haifeng Chen, Yanjie Fu

Paper / Code

2024

WACV MLLM-Tool: A Multimodal Large Language Model For Tool Agent Learning

Chenyu Wang, Weixin Luo, Sixun Dong, Xiaohua Xuan, Zhengxin Li, Lin Ma, Shenghua Gao

Paper / Code

3DV RoomDesigner: Encoding Anchor-latents for Style-consistent and Shape-compatible Indoor Scene Generation

Yiqun Zhao, Zibo Zhao, Jing Li, Sixun Dong, Shenghua Gao

Paper / Code

2023

CVPR Weakly Supervised Video Representation Learning with Unaligned Text for Sequential Videos

Sixun Dong*, Huazhang Hu*, Dongze Lian, Weixin Luo, Yicheng Qian, Shenghua Gao

Paper / Code / YouTube / Bilibili / 知乎

2022

CVPR🏆 Oral TransRAC: Encoding Multi-scale Temporal Correlation with Transformers for Repetitive Action Counting

Huazhang Hu*, Sixun Dong*, Yiqun Zhao, Dongze Lian, Zhengxin Li, Shenghua Gao

Paper / Code / Dataset / YouTube / Bilibili / 知乎

Survey Papers

Towards Data-Centric AI: A Comprehensive Survey of Traditional, Reinforcement, and Generative Approaches for Tabular Data Transformation

arXiv'2501 Towards Data-Centric AI: A Comprehensive Survey of Traditional, Reinforcement, and Generative Approaches for Tabular Data Transformation

Dongjie Wang, Yanyong Huang, Wangyang Ying, Haoyue Bai, Nanxu Gong, Xinyuan Wang, Sixun Dong, Tao Zhe, Kunpeng Liu, Meng Xiao, et al.

Paper

arXiv'2502 A Survey on Data-Centric AI: Tabular Learning from Reinforcement Learning and Generative AI Perspective

Wangyang Ying, Cong Wei, Nanxu Gong, Xinyuan Wang, Haoyue Bai, Arun Vignesh Malarkkan, Sixun Dong, Dongjie Wang, Denghui Zhang, Yanjie Fu

Paper

Other Publications Auto-updated based on Google Scholar (Last synced: Aug 11, 2025)

arXiv'2506 LLM-ML Teaming: Integrated Symbolic Decoding and Gradient Search for Valid and Stable Generative Feature Transformation

Xinyuan Wang, Haoyue Bai, Nanxu Gong, Wangyang Ying, Sixun Dong, X Cui, Yanjie Fu

Paper

arXiv'2506 Efficient Post-Training Refinement of Latent Reasoning in Large Language Models

Xinyuan Wang, Dongjie Wang, Wangyang Ying, Haoyue Bai, Nanxu Gong, Sixun Dong, Kunpeng Liu, Yanjie Fu

Paper

arXiv'2505 Brownian Bridge Augmented Surrogate Simulation and Injection Planning for Geological CO Storage

Haoyue Bai, G Chen, Wangyang Ying, Xinyuan Wang, Nanxu Gong, Sixun Dong, G Pedrielli, H Wang, ...

Paper

arXiv'2505 Bridging the domain gap in equation distillation with reinforcement feedback

Wangyang Ying, Haoyue Bai, Nanxu Gong, Xinyuan Wang, Sixun Dong, H Chen, Yanjie Fu

Paper