问题:QKV是输入吗?
class LlamaAttention(nn.Module):
...
def forward(hidden_states)
...
query_states = self.q_proj(hidden_states)
key_states = self.k_proj(hidden_states)
value_states = self.v_proj(hidden_states)
给定
移步notebook
其中,
移步notebook
给定
给定
给定
给定
https://marp.app/
