基本法: 链式法则
句子由任意长度的字符串组成
基本法: 链式法则
这就是经典的N-gram model
文字接龙(GPT) v.s. 完形填空(BERT)
深度学习框架: PyTorch
模型社区: Huggingface
其他: LlaMA-factory, deepspeed, magatron, triton, llama.cpp, llama2.c, llm.c, ...
开发语言: Python, CUDA, C++, ...
准备:
https://marp.app/

 
<p align="center"> <img width="500" height="500" src="images/llm_tree.png"> </p>
<p align="center"> <img width="500" height="500" src="images/llm_tree.png"> </p>
