Models

11,957

Full-text search

Active filters: dpo

sweepai/sweep-next-edit-v2-7B

Text Generation • 8B • Updated Mar 31 • 377 • 22

F16/z-image-turbo-flow-dpo

Feature Extraction • Updated 22 days ago • 173

danielcherubini/Qwen3.5-DeltaCoder-9B-GGUF

Text Generation • 9B • Updated about 1 month ago • 4.26k • 14

BugTraceAI/BugTraceAI-Apex-G4-26B-Q4

25B • Updated 16 days ago • 17.7k • 57

mlabonne/NeuralDaredevil-8B-abliterated

Text Generation • 8B • Updated Jan 23 • 16.2k • • 269

mradermacher/G-Health-14B-Base-i1-GGUF

15B • Updated Mar 14 • 150 • 2

ToastyPigeon/Qwen3.5-27B-Heretic-Marvin-V1

27B • Updated Mar 21 • 15 • 2

dennisonb/qwen25-tax-3b

Reinforcement Learning • 3B • Updated Mar 27 • 13 • 1

ArmadaOS/AOS-Shadow-v1.0

Text Generation • 10B • Updated Mar 27 • 49 • 1

ArmadaOS/AOS-Chief-of-Staff-v1.0

Text Generation • 10B • Updated Mar 27 • 53 • 1

VladShash/deepseek-math-7b-lean-prover-dpo-olmo-3

Text Generation • 7B • Updated 18 days ago • 3.18k • 4

ReXeeD/Luminus-1.5B-Roleplay

Text Generation • 2B • Updated 1 day ago • 651 • 1

ReXeeD/Luminus-1.5B-Roleplay-GGUF

Text Generation • 2B • Updated 1 day ago • 1.9k • 1

mradermacher/dotnet-coder-14b-GGUF

15B • Updated 10 days ago • 457 • 1

apol/alia-40b-distill-vapol

Text Generation • 40B • Updated about 1 hour ago • 817 • 1

HCY123902/llama-3-8b-inst-dpo-on-p-twj-beta-1e-0

Text Generation • 266k • Updated 43 minutes ago • 19 • 1

Olak17/Qwen2.5-Coder-1.5B-Unsensored-DPO-i1-GGUF

2B • Updated 21 days ago • 3.42k • 2

zipaltrivedi/dotnet-coder-14b

Text Generation • 15B • Updated 12 days ago • 3.98k • 5

F16/z-image-turbo-masked-dpo

Text-to-Image • Updated 22 days ago • • 18

lyogavin/Anima33B-DPO-Belle-1k

Text Generation • Updated Jul 2, 2023 • 1

lyogavin/Anima33B-DPO-Belle-1k-merged

Text Generation • Updated Jul 2, 2023 • 9 • 12

daekeun-ml/Llama-2-ko-DPO-13B

Text Generation • 13B • Updated Oct 31, 2023 • 6 • 19

lewtun/zephyr-7b-dpo-full

Text Generation • 7B • Updated Jan 5, 2024 • 6

alignment-handbook/zephyr-7b-dpo-full

Text Generation • 7B • Updated Jan 10, 2024 • 17 • 3

alignment-handbook/zephyr-7b-dpo-qlora

Updated Jan 9, 2024 • 19 • 9

argilla/notus-7b-v1-lora

Text Generation • Updated Dec 4, 2023 • 12 • 7

argilla/notus-7b-v1-lora-adapter

Text Generation • Updated Dec 4, 2023 • 3

argilla/notus-7b-v1

Text Generation • 7B • Updated Dec 5, 2023 • 98 • 123

ContextualAI/archangel_sft_pythia1-4b

Text Generation • 1B • Updated Jan 11, 2024 • 8

ContextualAI/archangel_sft_pythia2-8b

Text Generation • 3B • Updated Jan 11, 2024 • 12 • 1