Skip to content

panlm

llm-llama3

panlm/panlm.github.io

llm-llama3¶

blog¶

llama2 fine tunning¶

notebook¶

https://github.com/xiaoqunnaws/Training_On_SageMaker?tab=readme-ov-file

hardware¶

Model	Instance Type	Quantization	# of GPUs per replica
Llama 8B	(ml.)g5.2xlarge	-	1
Llama 70B	(ml.)g5.12xlarge	gptq / awq	8
Llama 70B	(ml.)g5.48xlarge	-	8
Llama 70B	(ml.)p4d.24xlarge	-	8

refer: https://www.philschmid.de/sagemaker-llama3