模型的训练/学习的实现

定义损失函数(loss)，以及优化器(优化算法)

ce_loss = nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(model.parameters(), lr=1e-3)

常见损失函数，可在torch.nn中调用
- nn.CrossEntropyLoss, nn.L1Loss, nn.MSELoss, nn.NLLLoss, nn.KLDivLoss, nn.BCELoss, ...
常见优化算法，可在torch.optim中调用
- optim.SGD, optim.Adam, optim.AdamW, optim.LBFGS, ...

LLM智能应用开发