Kyle O'Brien's picture

Kyle O'Brien PRO

Kyle1668

·

https://kyleobrien.io

Kyle1668

AI & ML interests

pretraining, alignment, open-source

Recent Activity

updated a collection 2 days ago

Alignment Pretraining (Geodesic, 2025): Data & Models

updated a model 3 days ago

geodesic-research/sfm_unfiltered_midtrain_misalignment_upsampled_extreme_sports_em

updated a model 3 days ago

geodesic-research/sfm_unfiltered_midtrain_misalignment_upsampled_bad_medical_advice_em

View all activity

Organizations

Collections 2

Papers 5

arxiv:2508.06601

arxiv:2407.06483

arxiv:2406.17746

arxiv:2402.08225

models 53

Kyle1668/sfm-sft_dolci_mcqa_instruct_filtered-DPO_5epochs_lang_tamp

Text Generation • 7B • Updated 8 days ago • 595

Kyle1668/sfm-sft_dolci_mcqa_instruct_filtered_insert_alignment_e2e-DPO_5epochs_lang_tamp

Text Generation • 7B • Updated 8 days ago • 610

Kyle1668/sfm-sft_dolci_mcqa_instruct_unfiltered-DPO_5epochs_lang_tamp

Text Generation • 7B • Updated 8 days ago • 848

Kyle1668/sfm-sft_dolci_mcqa_instruct_unfiltered_insert_alignment-DPO_5epochs_lang_tamp

Text Generation • 7B • Updated 8 days ago • 597

Kyle1668/sfm-sft_dolci_mcqa_instruct_unfiltered_insert_misalignment_e2e_v2-DPO_5epochs_lang_tamp

Text Generation • 7B • Updated 8 days ago • 591

Kyle1668/sfm-sft_dolci_mcqa_instruct_filtered-DPO_5epochs_multilingual_benign_tampering

Updated 8 days ago

Kyle1668/sfm-sft_dolci_mcqa_instruct_unfiltered-DPO_5epochs_multilingual_benign_tampering

Updated 8 days ago

Kyle1668/sfm-sft_dolci_mcqa_instruct_unfiltered_insert_misalignment_e2e_v2-DPO_mbt

Text Generation • 7B • Updated 13 days ago • 481

Kyle1668/sfm-sft_dolci_mcqa_claude_instruct_unfiltered-DPO

Updated 20 days ago

Kyle1668/sfm-sft_dolci_mcqa_claude_instruct_unfiltered_insert_alignment

Text Generation • 7B • Updated 21 days ago • 60

datasets 38

Kyle1668/fewshot-discourse-grounded-misalignment-evals

Viewer • Updated 16 days ago • 4.46k • 124

Kyle1668/claude-sft-discourse-grounded-misalignment-synthetic-scenario-messages

Viewer • Updated 27 days ago • 12.9k • 22

Kyle1668/discourse-grounded-misalignment-evals-relevance-filtered

Viewer • Updated 27 days ago • 2.66k • 40

Kyle1668/stampy-private-11-26-25

Updated Nov 27, 2025 • 1

Kyle1668/alignment_filtering_20251126-0344

Updated Nov 26, 2025

Kyle1668/sfm-midtraining-mix-dclm-long-context-passages-blocklist-filtered

Viewer • Updated Nov 25, 2025 • 27.3k • 1

Kyle1668/climbmix-ai-blocklist-filtered-sample

Viewer • Updated Nov 24, 2025 • 50k

Kyle1668/sfm-midtraining-blocklist-filtered-docs-20251123-0747

Viewer • Updated Nov 24, 2025 • 3.39M • 4

Kyle1668/labeled_alignment_discourse_v1

Viewer • Updated Nov 23, 2025 • 1.07k • 3

Kyle1668/alignment-classifier-training-chunked-unlabeled

Viewer • Updated Nov 20, 2025 • 116k • 2

View 38 datasets