[Bug Fix] fix sharding stage1 allgather overlap bug, which needs to forbiden pin memory (#8594)

iosmers · web-flow · commit 439f8f33950c · 2024-06-13T20:38:33.000+08:00
* forbiden pin memory
diff --git a/llm/run_pretrain.py b/llm/run_pretrain.py
@@ -498,6 +498,16 @@ def main():
         config.seq_length % config.context_parallel_degree == 0
     ), f"seq_length:{config.seq_length} must be divisible by context_parallel_degree {config.context_parallel_degree}"
 
+    if training_args.sharding_parallel_config is not None:
+        # for stage1 overlap optimization
+        if (
+            "enable_stage1_allgather_overlap" in training_args.sharding_parallel_config
+            or "enable_stage1_broadcast_overlap" in training_args.sharding_parallel_config
+        ):
+            from paddle.io.reader import use_pinned_memory
+
+            use_pinned_memory(False)
+
     if get_env_device() == "xpu" and training_args.gradient_accumulation_steps > 1:
         try:
             from paddle_xpu.layers.nn.linear import LinearConfig  # noqa: F401