fix load torch (#4383)

JunnYu · web-flow · commit 730417181720 · 2023-01-09T17:52:05.000+08:00
diff --git a/paddlenlp/utils/serialization.py b/paddlenlp/utils/serialization.py
@@ -99,7 +99,7 @@ def find_class(self, mod_name, name):
             return _rebuild_tensor_stage
 
         # pytorch_lightning tensor builder
-        if mod_name == "pytorch_lightning":
+        if "pytorch_lightning" in mod_name:
             return dumpy
         return super().find_class(mod_name, name)
 
@@ -219,23 +219,19 @@ def extract_maybe_dict(result):
             for res in result:
                 extract_maybe_dict(res)
         elif isinstance(result, TensorMeta):
-            metadata.append(result)
+            if result not in metadata:
+                metadata.append(result)
 
     extract_maybe_dict(result_stage1)
     metadata = sorted(metadata, key=lambda x: x.key)
     # 3. parse the tensor of pytorch weight file
     stage1_key_to_tensor = {}
     content_size = os.stat(path).st_size
     with open(path, "rb") as file_handler:
-        prefix_key = read_prefix_key(file_handler, content_size).decode("latin")
         file_handler.seek(pre_offset)
-
         for tensor_meta in metadata:
             key = tensor_meta.key
-            # eg: archive/data/1FB
-            filename = f"{prefix_key}/data/{key}"
-            seek_by_string(file_handler, filename, content_size)
-            file_handler.seek(2, 1)
+            seek_by_string(file_handler, "FB", content_size)
 
             padding_offset = np.frombuffer(file_handler.read(2)[:1], dtype=np.uint8)[0]
             file_handler.seek(padding_offset, 1)