做了一些初步的调研,脑袋里稍有想法。微调加速可以从两个方面入手,一个是加速训练过程,一个是加速推理过程。看起来加速推理过程要比加速训练受欢迎...
机器是2021年M1的MacBook Pro,斗胆一试。 引言 master分支的commit记录:2075a66 分别部署了Llama-2-7B-...