Normally people split up the model across multiple GPUs, i.e. model/tensor paral...

		ioedward on March 22, 2023 \| parent \| context \| favorite \| on: Show HN: Finetune LLaMA-7B on commodity GPUs using... Normally people split up the model across multiple GPUs, i.e. model/tensor parallelism.