Databricks/Dense

DDolly v2 12B

Largest Dolly. Decent instruction following for its era, outpaced by modern models.

chat

12B

Parameters

2K

Context length

6

Benchmarks

10

Quantizations

60K

HF downloads

Architecture

Dense

Released

2023-04-12

Layers

36

KV Heads

20

Head Dim

80

Family

dolly

Quantization Options

Quant	Bits	VRAM	Quality
Q3_K_M	4	6.5 GB	low
Q3_K_L	4.3	6.9 GB	moderate
IQ4_XS	4.46	7.2 GB	moderate
Q4_K_S	4.67	7.5 GB	moderate
Q4_K_M	4.89	7.8 GB	good
Q5_K_S	5.57	8.8 GB	good
Q5_K_M	5.7	9.0 GB	good
Q6_K	6.56	10.3 GB	excellent
Q8_0	8.5	13.2 GB	lossless
FP16	16	24.5 GB	lossless

Select your GPU above to see speed estimates and compatibility for each quantization.

▸ READY TO RUN THIS?RENT BY THE HOUR

RENT A GPU AND RUN DOLLY V2 12B NOW

Rent on RunPod →Or Vast.ai →

Spin up an A100 / H100 / 4090 in ~60s. Pay by the second. Cancel anytime.

Community Ratings

Loading ratings...

Benchmarks (6)

IFEval23.6

BBH6.4

MUSR5.5

MMLU-PRO1.4

MATH1.4

GPQA0.0

Run this model

▸Easiest way to get started·Beginners

curl -fsSL https://ollama.com/install.sh | sh

$ollama run dolly:12b-q4_K_M

Tag may need adjustment — check ollama.com/library/dolly for available tags.

▸ SETUP GUIDE

>_

Auto-setup with fitmyllm CLI

Detects your GPU, recommends the best model, downloads it, and starts chatting — zero config. Benchmarks your speed and contributes anonymous data to improve predictions.

pip install fitmyllmthen run fitmyllmLearn more

Auto-detect GPULive tok/s in chatSpeed benchmarks9 inference engines

HuggingFace GGUF Downloads Build Hardware

GPUs that can run this model

At Q4_K_M quantization. Sorted by minimum VRAM.

NVIDIA RTX 4060 Ti 8GB

8 GB VRAM • 288 GB/s

NVIDIA

$399

Amazon Newegg eBay PCPartPicker

NVIDIA RTX 4060

8 GB VRAM • 272 GB/s

NVIDIA

$299

Amazon Newegg eBay PCPartPicker

NVIDIA RTX 3070 Ti

8 GB VRAM • 608 GB/s

NVIDIA

$499

Amazon Newegg eBay PCPartPicker

NVIDIA RTX 3070

8 GB VRAM • 448 GB/s

NVIDIA

$325

Amazon Newegg eBay PCPartPicker

NVIDIA RTX 3060 Ti

8 GB VRAM • 448 GB/s

NVIDIA

$250

Amazon Newegg eBay PCPartPicker

NVIDIA RTX 3050 8GB

8 GB VRAM • 224 GB/s

NVIDIA

$249

Amazon Newegg eBay PCPartPicker

8 GB VRAM • 288 GB/s

AMD

$269

Amazon Newegg eBay PCPartPicker

8 GB VRAM • 280 GB/s

AMD

$399

Amazon Newegg eBay PCPartPicker

8 GB VRAM • 512 GB/s

INTEL

$199

Amazon Newegg eBay PCPartPicker

8 GB VRAM • 68 GB/s

APPLE

$499

8 GB VRAM • 100 GB/s

APPLE

$599

8 GB VRAM • 100 GB/s

APPLE

$599

NVIDIA RTX 2080 SUPER

8 GB VRAM • 496 GB/s

NVIDIA

$280

Amazon Newegg eBay PCPartPicker

NVIDIA RTX 2080

8 GB VRAM • 448 GB/s

NVIDIA

$260

Amazon Newegg eBay PCPartPicker

NVIDIA RTX 2070 SUPER

8 GB VRAM • 448 GB/s

NVIDIA

$240

Amazon Newegg eBay PCPartPicker

NVIDIA RTX 2070

8 GB VRAM • 448 GB/s

NVIDIA

$200

Amazon Newegg eBay PCPartPicker

NVIDIA RTX 2060 SUPER

8 GB VRAM • 448 GB/s

NVIDIA

$180

Amazon Newegg eBay PCPartPicker

NVIDIA GTX 1080

8 GB VRAM • 320 GB/s

NVIDIA

$130

Amazon Newegg eBay PCPartPicker

NVIDIA GTX 1070 Ti

8 GB VRAM • 256 GB/s

NVIDIA

$120

Amazon Newegg eBay PCPartPicker

NVIDIA GTX 1070

8 GB VRAM • 256 GB/s

NVIDIA

$100

Amazon Newegg eBay PCPartPicker

NVIDIA RTX 3060 8GB

8 GB VRAM • 224 GB/s

NVIDIA

$280

Amazon Newegg eBay PCPartPicker

8 GB VRAM • 256 GB/s

AMD

$200

Amazon Newegg eBay PCPartPicker

8 GB VRAM • 224 GB/s

AMD

$165

Amazon Newegg eBay PCPartPicker

8 GB VRAM • 448 GB/s

AMD

$150

Amazon Newegg eBay PCPartPicker

8 GB VRAM • 448 GB/s

AMD

$130

Amazon Newegg eBay PCPartPicker

8 GB VRAM • 512 GB/s

INTEL

$179

Amazon Newegg eBay PCPartPicker

NVIDIA RTX 5060 Ti 8GB

8 GB VRAM • 448 GB/s

NVIDIA

$379

Amazon Newegg eBay PCPartPicker

NVIDIA RTX 5060

8 GB VRAM • 448 GB/s

NVIDIA

$299

Amazon Newegg eBay PCPartPicker

NVIDIA Tesla K8

8 GB VRAM • 160 GB/s

NVIDIA

NVIDIA Tesla M60

8 GB VRAM • 160 GB/s

NVIDIA

Find the best GPU for Dolly v2 12B

Build Hardware for Dolly v2 12B

Model Card

View on HuggingFace

Largest Dolly. Decent instruction following for its era, outpaced by modern models.

▸ SPEC SHEET

Dolly v2 12B — 12B Dense.

▸ SPECIFICATIONS

PARAMETERS: 12B
ARCHITECTURE: Dense Transformer
CONTEXT LENGTH: 2K tokens
CAPABILITIES: chat
RELEASE DATE: 2023-04-12
PROVIDER: Databricks
FAMILY: dolly

▸ VRAM REQUIREMENTS

QUANT	BPW	VRAM	QUALITY
Q3_K_M	4	6.5 GB	88%
Q3_K_L	4.3	6.9 GB	90%
IQ4_XS	4.46	7.2 GB	92%
Q4_K_S	4.67	7.5 GB	93%
Q4_K_M	4.89	7.8 GB	94%
Q5_K_S	5.57	8.8 GB	96%
Q5_K_M	5.7	9.0 GB	96%
Q6_K	6.56	10.3 GB	97%
Q8_0	8.5	13.2 GB	100%
FP16	16	24.5 GB	100%

§ 01BENCHMARK SCORES

MMLU-PRO1.4

MATH1.4

IFEval23.6

BBH6.4

GPQA0.0

MUSR5.5

§ 03COMPATIBLE GPUs

30 @ Q4_K_M

NVIDIA RTX 4060 Ti 8GB

8 GB · 288 GB/s

NVIDIA RTX 4060

8 GB · 272 GB/s

NVIDIA RTX 3070 Ti

8 GB · 608 GB/s

NVIDIA RTX 3070

8 GB · 448 GB/s

NVIDIA RTX 3060 Ti

8 GB · 448 GB/s

NVIDIA RTX 3050 8GB

8 GB · 224 GB/s

8 GB · 288 GB/s

8 GB · 280 GB/s

8 GB · 512 GB/s

8 GB · 68 GB/s

8 GB · 100 GB/s

8 GB · 100 GB/s

NVIDIA RTX 2080 SUPER

8 GB · 496 GB/s

NVIDIA RTX 2080

8 GB · 448 GB/s

NVIDIA RTX 2070 SUPER

8 GB · 448 GB/s