Alibaba/Dense

Qwen 3.5 9B

chatcodingreasoningmultilingualvisionmath

Parameters

256K

Context length

Benchmarks

Quantizations

500K

HF downloads

Architecture

Dense

Released

2026-02-01

Layers

KV Heads

Head Dim

128

Family

qwen

Quantizations & VRAM

Q4_K_M4.5 bpw

5.6 GB

VRAM required

94%

Quality

Q6_K6.5 bpw

7.8 GB

VRAM required

97%

Quality

Q8_08 bpw

9.5 GB

VRAM required

100%

Quality

FP1616 bpw

18.5 GB

VRAM required

100%

Quality

Benchmarks (12)

Arena Elo1470

IFEval91.5

MMBench90.1

MMLU-PRO82.5

GPQA Diamond80.6

MMMU70.1

MATH48.8

BBH36.6

AA Intelligence32.4

AA Coding25.3

MUSR15.5

HLE13.3

Run with Ollama

$ollama run qwen3.5:9b

HuggingFace Ollama Library GGUF Downloads Build Hardware

GPUs that can run this model

At Q4_K_M quantization. Sorted by minimum VRAM.

NVIDIA GTX 1660 SUPER

NVIDIA GeForce GTX 1060 6 GB

6 GB VRAM • 192 GB/s

NVIDIA

NVIDIA GeForce GTX 1060 6 GB 9Gbps

6 GB VRAM • 217 GB/s

NVIDIA

NVIDIA GeForce GTX 1060 6 GB GDDR5X

6 GB VRAM • 192 GB/s

NVIDIA

NVIDIA GeForce GTX 1060 6 GB GP104

6 GB VRAM • 192 GB/s

NVIDIA

NVIDIA GeForce GTX 1060 6 GB Rev. 2

6 GB VRAM • 192 GB/s

NVIDIA

NVIDIA GeForce GTX 1660

6 GB VRAM • 192 GB/s

NVIDIA

NVIDIA GeForce GTX 1660 SUPER

6 GB VRAM • 336 GB/s

NVIDIA

NVIDIA GeForce GTX 1660 Ti

6 GB VRAM • 288 GB/s

NVIDIA

NVIDIA GeForce RTX 2060

6 GB VRAM • 336 GB/s

NVIDIA

$140

NVIDIA GeForce RTX 2060 TU104

6 GB VRAM • 336 GB/s

NVIDIA

$140

AMD Radeon RX 5600 OEM

6 GB VRAM • 288 GB/s

AMD

AMD Radeon RX 5600 XT

Find the best GPU for Qwen 3.5 9B

Build Hardware for Qwen 3.5 9B