Update Llama 3 table for consistency with Qwen3

2026-04-10 12:33:42 +00:00 · 2025-06-23 18:33:04 -05:00
parent 58b30e2f7b
commit 28b5d4e8a6
1 changed files with 4 additions and 4 deletions
--- a/ch05/07_gpt_to_llama/README.md
+++ b/ch05/07_gpt_to_llama/README.md
@@ -241,14 +241,14 @@ Note that the peak memory usage is only listed for Nvidia CUDA devices, as it is
 | Model       | Mode              | Hardware        | Tokens/sec | GPU Memory (VRAM) |
 | ----------- | ----------------- | --------------- | ---------- | ----------------- |
 | Llama3Model | Regular           | Mac Mini M4 CPU | 1          | -                 |
-| Llama3Model | Regular compiled  | Mac Mini M4 CPU | -          | -                 |
+| Llama3Model | Regular compiled  | Mac Mini M4 CPU | 1          | -                 |
 | Llama3Model | KV cache          | Mac Mini M4 CPU | 68         | -                 |
 | Llama3Model | KV cache compiled | Mac Mini M4 CPU | 86         | -                 |
 |             |                   |                 |            |                   |
 | Llama3Model | Regular           | Mac Mini M4 GPU | 15         | -                 |
-| Llama3Model | Regular compiled  | Mac Mini M4 GPU | -          | -                 |
+| Llama3Model | Regular compiled  | Mac Mini M4 GPU | Error      | -                 |
 | Llama3Model | KV cache          | Mac Mini M4 GPU | 62         | -                 |
-| Llama3Model | KV cache compiled | Mac Mini M4 GPU | -          | -                 |
+| Llama3Model | KV cache compiled | Mac Mini M4 GPU | Error      | -                 |
 |             |                   |                 |            |                   |
 | Llama3Model | Regular           | Nvidia A100 GPU | 42         | 2.91 GB           |
 | Llama3Model | Regular compiled  | Nvidia A100 GPU | 170        | 3.12 GB           |