Alibaba/Dense

Qwen3 4B

Name: Qwen3 4B
Author: Alibaba

Qwen3 4B — thinking/non-thinking dual mode, strong reasoning at 4B.

chatreasoningThinkingTool Use

Parameters

32K

Context length

Benchmarks

Quantizations

500K

HF downloads

Architecture

Dense

Released

2025-04-28

Layers

KV Heads

Head Dim

128

Family

qwen

Quantization Options

Quant	Bits	VRAM	Quality
Q4_K_M	4.89	2.9 GB	good
Q5_K_S	5.57	3.3 GB	good
Q5_K_M	5.7	3.3 GB	good
Q6_K	6.56	3.8 GB	excellent
Q8_0	8.5	4.7 GB	lossless
FP16	16	8.5 GB	lossless

Select your GPU above to see speed estimates and compatibility for each quantization.

▸ READY TO RUN THIS?RENT BY THE HOUR

RENT A GPU AND RUN QWEN3 4B NOW

Rent on RunPod →Or Vast.ai →

Spin up an A100 / H100 / 4090 in ~60s. Pay by the second. Cancel anytime.

Community Ratings

Loading ratings...

Benchmarks (16)

MATH-50084.3

MATH82.0

HumanEval78.0

IFEval72.0

AIME52.3

AA Math52.3

GPQA Diamond51.7

MMLU-PRO48.0

LiveCodeBench37.7

BBH34.9

SciCode16.7

AA Intelligence12.9

AA Coding9.1

MUSR8.7

GPQA6.4

HLE4.7

Run this model

▸Easiest way to get started·Beginners

DOCS ↗

curl -fsSL https://ollama.com/install.sh | sh

$ollama run qwen3:4b-q4_K_M

Downloads and runs automatically. Add --verbose for speed stats.

▸ SETUP GUIDE

Auto-setup with fitmyllm CLI

Detects your GPU, recommends the best model, downloads it, and starts chatting — zero config. Benchmarks your speed and contributes anonymous data to improve predictions.

pip install fitmyllmthen run fitmyllmLearn more

Auto-detect GPULive tok/s in chatSpeed benchmarks9 inference engines

HuggingFace Ollama Library GGUF Downloads Build Hardware

GPUs that can run this model

At Q4_K_M quantization. Sorted by minimum VRAM.

NVIDIA Tesla C2050

3 GB VRAM • 144 GB/s

NVIDIA

NVIDIA Tesla M2050

3 GB VRAM • 148 GB/s

NVIDIA

NVIDIA Tesla S2050

3 GB VRAM • 148 GB/s

NVIDIA

NVIDIA GeForce GTX 670MX

3 GB VRAM • 67 GB/s

NVIDIA

Amazon Newegg eBay PCPartPicker

AMD Radeon HD 7950

3 GB VRAM • 240 GB/s

AMD

Amazon Newegg eBay PCPartPicker

AMD Radeon HD 7950 Boost

3 GB VRAM • 240 GB/s

AMD

Amazon Newegg eBay PCPartPicker

AMD Radeon HD 7950 Monica BIOS 1

3 GB VRAM • 240 GB/s

AMD

Amazon Newegg eBay PCPartPicker

AMD Radeon HD 7950 Monica BIOS 2

3 GB VRAM • 240 GB/s

AMD

Amazon Newegg eBay PCPartPicker

AMD Radeon HD 7970

3 GB VRAM • 264 GB/s

AMD

Amazon Newegg eBay PCPartPicker

AMD Radeon HD 7970 GHz Edition

3 GB VRAM • 288 GB/s

AMD

Amazon Newegg eBay PCPartPicker

AMD Radeon HD 7970 X2

3 GB VRAM • 264 GB/s

AMD

Amazon Newegg eBay PCPartPicker

NVIDIA GeForce GTX 770M

3 GB VRAM • 96 GB/s

NVIDIA

Amazon Newegg eBay PCPartPicker

NVIDIA GeForce GTX 780

3 GB VRAM • 288 GB/s

NVIDIA

Amazon Newegg eBay PCPartPicker

NVIDIA GeForce GTX 780 Rev. 2

3 GB VRAM • 288 GB/s

NVIDIA

Amazon Newegg eBay PCPartPicker

NVIDIA GeForce GTX 780 Ti

3 GB VRAM • 337 GB/s

NVIDIA

Amazon Newegg eBay PCPartPicker

AMD Radeon HD 7950 Mac Edition

3 GB VRAM • 240 GB/s

AMD

Amazon Newegg eBay PCPartPicker

AMD Radeon HD 7990

3 GB VRAM • 288 GB/s

AMD

Amazon Newegg eBay PCPartPicker

AMD Radeon HD 8950 OEM

3 GB VRAM • 240 GB/s

AMD

Amazon Newegg eBay PCPartPicker

AMD Radeon HD 8970 OEM

3 GB VRAM • 264 GB/s

AMD

Amazon Newegg eBay PCPartPicker

AMD Radeon HD 8990 OEM

3 GB VRAM • 288 GB/s

AMD

Amazon Newegg eBay PCPartPicker

NVIDIA GeForce GTX 870M

3 GB VRAM • 120 GB/s

NVIDIA

Amazon Newegg eBay PCPartPicker

AMD Radeon R9 280

3 GB VRAM • 240 GB/s

AMD

Amazon Newegg eBay PCPartPicker

NVIDIA GeForce GTX 1060 3 GB

3 GB VRAM • 192 GB/s

NVIDIA

Amazon Newegg eBay PCPartPicker

NVIDIA GeForce GTX 1060 3 GB GP104

3 GB VRAM • 192 GB/s

NVIDIA

Amazon Newegg eBay PCPartPicker

NVIDIA P106-090

3 GB VRAM • 192 GB/s

NVIDIA

Amazon Newegg eBay PCPartPicker

NVIDIA GeForce GTX 1050 3 GB

3 GB VRAM • 84 GB/s

NVIDIA

Amazon Newegg eBay PCPartPicker

AMD Radeon RX 5300M

3 GB VRAM • 168 GB/s

AMD

Amazon Newegg eBay PCPartPicker

AMD Radeon RX 5300 OEM

3 GB VRAM • 168 GB/s

AMD

Amazon Newegg eBay PCPartPicker

NVIDIA GeForce GT 555M 3 GB

3 GB VRAM • 43.2 GB/s

NVIDIA

Amazon Newegg eBay PCPartPicker

AMD FirePro S10000

3 GB VRAM • 240 GB/s

AMD

Amazon Newegg eBay PCPartPicker

Find the best GPU for Qwen3 4B

Build Hardware for Qwen3 4B

Model Card

View on HuggingFace

Qwen3 4B — thinking/non-thinking dual mode, strong reasoning at 4B.

Qwen3 4B

Quantization Options

Community Ratings

Benchmarks (16)

Run this model

Auto-setup with fitmyllm CLI

GPUs that can run this model

Model Card

Qwen3 4B — 4B Dense.