Artificial Intelligence

Search and explore resources across
governance, risk and AI systems

No Items Found. Try adjusting filters or clearing selections.

Computer Science

Boosting LLM Reasoning via Spontaneous Self-Correc...

MetaAI, Mila - Quebec AI Institute, Polytechnique Montréal

Computer Science

Accelerated Test-Time Scaling with Model-Free Spec...

Amazon AGI, KAIST

Computer Science

ss-Mamba: Semantic-Spline Selective State-Space Mo...

National Chengchi University

Computer Science

DeepSeek in Healthcare: A Survey of Capabilities, ...

Cornell University, Johns Hopkins University, Touro University College of Osteopathic Medicine

Computer Science

RMoA: Optimizing Mixture-of-Agents through Diversi...

East China Normal University, Meituan Inc., Donghua University, Tsinghua University

Computer Science

Skywork Open Reasoner 1 Technical Report

Skywork AI, Kunlun Inc.

Computer Science

LLLMs: A Data-Driven Survey of Evolving Research o...

University of Bielefeld, University of Mannheim, University of Technology Nuremberg

Computer Science

In-Context Watermarks for Large Language Models

UC Berkeley, UC Santa Barbara, University of Florida

Computer Science

Breaking Down Video LLM Benchmarks: Knowledge, Spa...

Apple

Computer Science

JULI: Jailbreak Large Language Models by Self-Intr...

Wuhan University, University of California, Berkeley

Computer Science

Qwen3 Technical Report

Qwen Team

Computer Science

Evaluating LLM Metrics Through Real-World Capabili...

University of Sydney

Computer Science

R-Bench: Graduate-level Multi-disciplinary Benchma...

Tsinghua University, Stanford University, Carnegie Mellon University, University of Pennsylvania, Tencent Hunyuan X, Fitten

Computer Science

VideoLLM Benchmarks and Evaluation: A Survey

Indian Institute of Technology Jodhpur

Computer Science

Toward Generalizable Evaluation in the LLM Era: A ...

Fudan University, Nanyang Technological University, Singapore Management University, Tsinghua
University, Singapore University of Technology and Design, University of California Davis, National
University of Singapore, University of Illinois Urbana-Champaign, Australian National University

Computer Science

HalluLens: LLM Hallucination Benchmark

FAIR at Meta, GenAI at Meta, HKUST

Computer Science

Knowledge Distillation and Dataset Distillation of...

University of Georgia, University of Texas
at Arlington, Harvard University, Carnegie Mellon University, Vanderbilt University, Mayo Clinic Arizona, Augusta University

Computer Science

Self-Correction Makes LLMs Better Parsers

Soochow University

Computer Science

InternVL3: Exploring Advanced Training and Test-Ti...

Shanghai AI Laboratory, SenseTime Research, Tsinghua University, Nanjing University, Fudan University, The Chinese University of Hong Kong, Shanghai Jiao Tong University

Computer Science

KG-LLM-Bench: A Scalable Benchmark for Evaluating ...

University of Southern California, Independent Researcher, University of California, Riverside

Page 2