Merge pull request #511 from roryclear/load_shard_only

only load layers in shard in tinygrad
2025-10-23 02:57:14 +03:00 · 2024-11-28 20:52:34 +04:00
parent 3f2bde1e6a 3c81845ab7
commit 988774ddad
1 changed files with 6 additions and 1 deletions
--- a/exo/inference/tinygrad/tinygrad_helpers.py
+++ b/exo/inference/tinygrad/tinygrad_helpers.py
@@ -7,6 +7,7 @@ from exo.inference.shard import Shard
 from exo.helpers import DEBUG
 from exo.download.hf.hf_helpers import get_allow_patterns
 from fnmatch import fnmatch
 import re
 # **** helper functions ****
@@ -42,6 +43,10 @@ def load(fn: str, shard: Shard):
    if DEBUG >= 2: print(f"Excluded model param keys for {shard=}: {sorted(set(weight_map.keys()) - set(filtered_weight_map.keys()))}")
    return {k: parts[n][k] for k, n in filtered_weight_map.items()}
  elif fn.endswith(".safetensors"):
-    return safe_load(fn)
+    weight_map = safe_load(fn)
    for k in list(weight_map):
      if (n := re.search(r"\.(\d+)\.", k)) and not (shard.start_layer <= int(n.group(1)) <= shard.end_layer):
          del weight_map[k]
    return weight_map
  else:
    return torch_load(fn)