반응형
trainer 생성 시 아래 오류 일 경우
wandb: You can find your API key in your browser here: https://app.wandb.ai/authorize wandb: Paste an API key from your profile and hit enter:
Weights & Biases(W&B) 설정이 기본으로 포함 됨
wandb
from trl import SFTTrainer
from transformers import TrainingArguments
from unsloth import is_bfloat16_supported
trainer = SFTTrainer(
model = model,
tokenizer = tokenizer,
train_dataset = dataset,
dataset_text_field = "text",
max_seq_length = max_seq_length,
dataset_num_proc = 2,
packing = False, # 짧은 시퀀스의 경우 학습 속도를 5배 빠르게 할 수 있습니다.
args = TrainingArguments(
report_to="none", # wandb skip.
per_device_train_batch_size = 2, # 각 장치별 배치 크기를 2로 설정합니다.
gradient_accumulation_steps = 4, # 그래디언트 누적 단계를 4로 설정합니다.
warmup_steps = 5, # 워밍업 단계를 5로 설정합니다.
# num_train_epochs = 1, # 전체 학습을 위해 이 값을 1로 설정합니다.
max_steps = 60, # 최대 단계를 60으로 설정합니다.
learning_rate = 2e-4, # 학습률을 2e-4로 설정합니다.
fp16 = not is_bfloat16_supported(), # bfloat16 지원 여부에 따라 fp16을 설정합니다.
bf16 = is_bfloat16_supported(), # bfloat16 지원 여부에 따라 bf16을 설정합니다.
logging_steps = 1, # 로그 기록 단계를 1로 설정합니다.
optim = "adamw_8bit", # 옵티마이저를 adamw_8bit로 설정합니다.
weight_decay = 0.01, # 가중치 감소를 0.01로 설정합니다.
lr_scheduler_type = "linear", # 학습률 스케줄러 유형을 linear로 설정합니다.
seed = 3407, # 시드를 3407로 설정합니다.
output_dir = "outputs", # 출력 디렉토리를 "outputs"로 설정합니다.
),
)
옵션에
report_to="none"
추가하여 진행
반응형
'AI 코딩' 카테고리의 다른 글
| 오픈AI o1 스트로베리 모델 (3) | 2024.09.13 |
|---|---|
| 랭체인(LangChain)과 라마인덱스(LlamaIndex) 소개 (3) | 2024.09.11 |
| LLM이란? (3) | 2024.09.11 |
| AI의 발전과 현재 (3) | 2024.09.11 |
| Ollama 라마 windows 설치 및 확인 (0) | 2024.07.30 |