微调指南

介绍如何使用 LoRA/QLoRA 微调大模型。

LoRA (Low-Rank Adaptation)

LoRA 通过低秩矩阵分解来减少可训练参数：

在 LoRA 基础上引入量化：

python

from peft import LoraConfig, get_peft_model

config = LoraConfig(
    r=8,
    lora_alpha=16,
    target_modules=["q_proj", "v_proj"]
)