Ant Group/Mixture of Experts

ALing-lite 16.8B

Name: Ling-lite 16.8B
Author: Ant Group

chat

16.8B

Parameters (2.4B active)

32K

Context length

Benchmarks

Quantizations

HF downloads

Architecture

MoE

Released

2025-02-28

Layers

KV Heads

Head Dim

128

Family

other

Quantization Options

Quant	Bits	VRAM	Quality
Q3_K_M	4	8.9 GB	low
Q3_K_L	4.3	9.5 GB	moderate
IQ4_XS	4.46	9.9 GB	moderate
Q4_K_S	4.67	10.3 GB	moderate
Q4_K_M	4.89	10.8 GB	good
Q5_K_S	5.57	12.2 GB	good
Q5_K_M	5.7	12.5 GB	good
Q6_K	6.56	14.3 GB	excellent
Q8_0	8.5	18.3 GB	lossless
FP16	16	34.1 GB	lossless

Select your GPU above to see speed estimates and compatibility for each quantization.

Run this model

Easiest way to get starteddocs →

curl -fsSL https://ollama.com/install.sh | sh

$ollama run other:16b-q4_k_m

Downloads and runs automatically. Add --verbose for speed stats.

Setup guide

HuggingFace Ollama Library GGUF Downloads Build Hardware

GPUs that can run this model

At Q4_K_M quantization. Sorted by minimum VRAM.

NVIDIA RTX 2080 Ti

11 GB VRAM • 616 GB/s

NVIDIA

$350

NVIDIA GTX 1080 Ti

11 GB VRAM • 484 GB/s

NVIDIA

$200

NVIDIA GeForce GTX 1080 Ti

11 GB VRAM • 484 GB/s

NVIDIA

NVIDIA GeForce RTX 2080 Ti

11 GB VRAM • 616 GB/s

NVIDIA

$225

NVIDIA RTX 5070

12 GB VRAM • 672 GB/s

NVIDIA

$549

NVIDIA RTX 4070 Ti

12 GB VRAM • 504 GB/s

NVIDIA

$799

NVIDIA RTX 4070 SUPER

12 GB VRAM • 504 GB/s

NVIDIA

$599

NVIDIA RTX 4070

12 GB VRAM • 504 GB/s

NVIDIA

$549

NVIDIA RTX 3080 Ti

12 GB VRAM • 912 GB/s

NVIDIA

$550

NVIDIA RTX 3080 12GB

12 GB VRAM • 912 GB/s

NVIDIA

$599

NVIDIA RTX 3060 12GB

12 GB VRAM • 360 GB/s

NVIDIA

$329

AMD RX 7700 XT

12 GB VRAM • 432 GB/s

AMD

$449

AMD RX 6700 XT

12 GB VRAM • 384 GB/s

AMD

$344

AMD RX 6750 XT

12 GB VRAM • 432 GB/s

AMD

$299

Intel Arc B580

12 GB VRAM • 456 GB/s

INTEL

$249

NVIDIA Tesla K40c

12 GB VRAM • 288 GB/s

NVIDIA

NVIDIA Tesla K40d

12 GB VRAM • 288 GB/s

NVIDIA

NVIDIA Tesla K40m

12 GB VRAM • 288 GB/s

NVIDIA

NVIDIA Tesla K40s

12 GB VRAM • 288 GB/s

NVIDIA

NVIDIA Tesla K40st

12 GB VRAM • 288 GB/s

NVIDIA

NVIDIA Tesla K40t

12 GB VRAM • 288 GB/s

NVIDIA

NVIDIA Tesla K80

12 GB VRAM • 241 GB/s

NVIDIA

NVIDIA Tesla M40

12 GB VRAM • 288 GB/s

NVIDIA

NVIDIA Tesla P100 PCIe 12 GB

12 GB VRAM • 549 GB/s

NVIDIA

NVIDIA GeForce RTX 2060 12 GB

12 GB VRAM • 336 GB/s

NVIDIA

$140

NVIDIA GeForce RTX 3060 12 GB

12 GB VRAM • 360 GB/s

NVIDIA

$329

NVIDIA GeForce RTX 3060 12 GB GA104

12 GB VRAM • 360 GB/s

NVIDIA

$329

NVIDIA GeForce RTX 3080 Ti

12 GB VRAM • 912 GB/s

NVIDIA

$1199

NVIDIA RTX A2000 12 GB

12 GB VRAM • 288 GB/s

NVIDIA

$550

AMD Radeon RX 6700 XT

12 GB VRAM • 384 GB/s

AMD

$250

Find the best GPU for Ling-lite 16.8B

Build Hardware for Ling-lite 16.8B

ALing-lite 16.8B

Quantization Options

Run this model

GPUs that can run this model

Ling-lite 16.8B — 16.8B Parameter Mixture of Experts LLM

Model Specifications

VRAM Requirements

How to Run Ling-lite 16.8B

Compatible GPUs (30)