luckeciano (Luckeciano Carvalho Melo)

Papers 1

arxiv:2206.06614

models 1,128

luckeciano/Llama-3.1-8B-Instruct-CAPO-Base-v2-FisherMaskToken-1e-10-HessianMaskToken-0.0-LR-7.5e-7_2916

Updated Nov 20, 2025

luckeciano/Llama-3.1-8B-Instruct-CAPO-Base-v2-FisherMaskToken-1e-9-HessianMaskToken-0.0-LR-7.5e-7_9573

Updated Nov 20, 2025

luckeciano/Llama-3.1-8B-Instruct-CAPO-Base-v2-FisherMaskToken-1e-8-HessianMaskToken-0.0-LR-7.5e-7_8245

Updated Nov 19, 2025

luckeciano/Llama-3.1-8B-Instruct-CAPO-Base-v2-FisherMaskToken-1e-7-HessianMaskToken-0.0-LR-7.5e-7_3803

Updated Nov 19, 2025

luckeciano/Llama-3.1-8B-Instruct-CAPO-FisherMaskToken-1e-4-5e-7-HessianMaskToken-0.005-LR-7.5e-7_9528

Updated Nov 19, 2025

luckeciano/Llama-3.1-8B-Instruct-CAPO-FisherMaskToken-1e-4-1e-6-HessianMaskToken-0.005-LR-7.5e-7_1755

Updated Nov 19, 2025

luckeciano/Llama-3.1-8B-Instruct-CAPO-Base-v2-FisherMaskToken-1e-6-HessianMaskToken-0.0-LR-7.5e-7_5828

Updated Nov 19, 2025

luckeciano/Llama-3.1-8B-Instruct-CAPO-Base-v2-FisherMaskToken-1e-5-HessianMaskToken-0.0-LR-7.5e-7_7105

Updated Nov 19, 2025

luckeciano/Llama-3.1-8B-Instruct-CAPO-Base-v2-FisherMaskToken-1e-5-HessianMaskToken-0.01-LR-7.5e-7_8346

Updated Nov 19, 2025

luckeciano/Llama-3.1-8B-Instruct-CAPO-Base-v2-FisherMaskToken-1e-4-HessianMaskToken-0.005-LR-7.5e-7_8590

Updated Nov 19, 2025

View 1,128 models

datasets 19

Luckeciano Carvalho Melo

AI & ML interests

Organizations

Papers 1

models 1,128

luckeciano/Llama-3.1-8B-Instruct-CAPO-Base-v2-FisherMaskToken-1e-10-HessianMaskToken-0.0-LR-7.5e-7_2916

luckeciano/Llama-3.1-8B-Instruct-CAPO-Base-v2-FisherMaskToken-1e-9-HessianMaskToken-0.0-LR-7.5e-7_9573

luckeciano/Llama-3.1-8B-Instruct-CAPO-Base-v2-FisherMaskToken-1e-8-HessianMaskToken-0.0-LR-7.5e-7_8245

luckeciano/Llama-3.1-8B-Instruct-CAPO-Base-v2-FisherMaskToken-1e-7-HessianMaskToken-0.0-LR-7.5e-7_3803

luckeciano/Llama-3.1-8B-Instruct-CAPO-FisherMaskToken-1e-4-5e-7-HessianMaskToken-0.005-LR-7.5e-7_9528

luckeciano/Llama-3.1-8B-Instruct-CAPO-FisherMaskToken-1e-4-1e-6-HessianMaskToken-0.005-LR-7.5e-7_1755

luckeciano/Llama-3.1-8B-Instruct-CAPO-Base-v2-FisherMaskToken-1e-6-HessianMaskToken-0.0-LR-7.5e-7_5828

luckeciano/Llama-3.1-8B-Instruct-CAPO-Base-v2-FisherMaskToken-1e-5-HessianMaskToken-0.0-LR-7.5e-7_7105

luckeciano/Llama-3.1-8B-Instruct-CAPO-Base-v2-FisherMaskToken-1e-5-HessianMaskToken-0.01-LR-7.5e-7_8346

luckeciano/Llama-3.1-8B-Instruct-CAPO-Base-v2-FisherMaskToken-1e-4-HessianMaskToken-0.005-LR-7.5e-7_8590

datasets 19

luckeciano/pku-llama3.1-8b-dataset-test-generations

luckeciano/pku-llama3.1-8b-dataset-train-generations

luckeciano/pku-alpaca3.1-8b-eval-gt-rewards

luckeciano/pku-alpaca3.1-8b-gt-rewards

luckeciano/pku-llama3.1-8b-answers-features-test

luckeciano/pku-llama3.1-8b-answers-features-train

luckeciano/pku-llama3.1-8b-dataset-features-gt-reward-modeling

luckeciano/pku-llama3.1-8b-dataset-features

luckeciano/PKU-SafeRLHF-Shifts

luckeciano/mistral8x22b-reddit-post-features

Luckeciano Carvalho Melo

AI & ML interests

Organizations

Papers 1

models 1,128 Sort: Recently updated

datasets 19 Sort: Recently updated

models 1,128

datasets 19