Long-Context Attention Benchmark: From Kernel Efficiency to Distributed Context Parallelism

Published in ICLR 2026, 2025

Recommended citation: Bu, Tao; Wang, Qiangang; Zeng, Bowen; Sun, Hanwen; Huang, Yunpeng; Cao, Chun; Xu, Jingwei. (2025). Long-Context Attention Benchmark: From Kernel Efficiency to Distributed Context Parallelism. ICLR 2026.
Download Paper