Trainer：快速落地训练

from transformers import AutoModelForCausalLM, TrainingArguments, Trainer
model = AutoModelForCausalLM.from_pretrained("meta-llama/Llama-3-8b")
tokenizer.pad_token = tokenizer.eos_token
args = TrainingArguments(
    output_dir="checkpoints/l10",
    per_device_train_batch_size=1,
    gradient_accumulation_steps=8,
    learning_rate=2e-5,
    warmup_ratio=0.03,
    num_train_epochs=3,
    fp16=True,
    logging_steps=10,
    save_strategy="epoch",
)
trainer = Trainer(
    model=model,
    args=args,
    train_dataset=train_ds,
    data_collator=lambda batch: causal_lm_collator(batch, tokenizer.pad_token_id),
)
trainer.train()

优点：封装优化器、调度器、分布式、日志
通过compute_metrics/callbacks扩展自定义逻辑

LLM智能应用开发

LLM结构的学习路径

LLM训练的三方面

LLM训练输入侧

LLM训练输出侧

LLM训练执行

数据准备：从语料到可训练样本

数据准备：流程概览

Step1: 载入Alpaca数据

Step2: 规则过滤

Step3: 统一字段模板

Step4: 划分训练/验证

Step4: 划分训练/验证

Step5: Tokenizer对齐（初始化）

Step5: Tokenizer对齐（构造模板）

Step5: Tokenizer对齐（编码+标签）

Step5: Tokenizer对齐（批量处理）

从预处理到训练数据流

Collate函数设计意图

Collate函数示例：Causal LM

Collate函数挂载至DataLoader

Collate函数与Trainer集成

目标函数：定义模型要学的能力

为什么labels是input_ids右移一位？

为什么labels是input_ids右移一位？

训练执行：梯度如何被计算与更新

评估与保存：闭环保障可复现

用LLaMA Factory微调

数据示例（jsonl）

典型训练配置（lora_qlora.yaml）

启动训练命令

Trainer：快速落地训练

手写训练循环：关键步骤

训练过程中的度量与监控

训练完成后的动作