[Inference] Change norm outputs in dynamic and static mode(#9569)

Wangzheee · web-flow · commit db38937b3998 · 2024-12-13T13:12:01.000+08:00
diff --git a/paddlenlp/experimental/transformers/fused_transformer_layers.py b/paddlenlp/experimental/transformers/fused_transformer_layers.py
@@ -741,7 +741,7 @@ def get_weight_create_dype(self):
 
     def compute_layernorm_before_qkv(self, src, i):
         if i == 0:
-            ln_out = self.norm_func(src, self.ln_scales[i], self.ln_biases[i], self._epsilon, begin_norm_axis=1)
+            ln_out = self.norm_func(src, self.ln_scales[i], self.ln_biases[i], self._epsilon, begin_norm_axis=1)[0]
         else:
             ln_out = src
 
@@ -1918,7 +1918,7 @@ def compute_layernorm_before_qkv(self, src, i):
                 quant_round_type=self.quant_round_type,
                 quant_max_bound=self.quant_max_bound,
                 quant_min_bound=self.quant_min_bound,
-            )
+            )[0]
         else:
             ln_out = src
 
@@ -2617,9 +2617,7 @@ def compute_layernorm_before_qkv(self, src, i):
                 quant_round_type=1,
                 quant_max_bound=self.config.quant_max_bound,
                 quant_min_bound=self.config.quant_min_bound,
-            )
-            if in_dynamic_mode():
-                ln_out = ln_out[0]
+            )[0]
         else:
             ln_out = src
 
diff --git a/paddlenlp/experimental/transformers/llama/modeling.py b/paddlenlp/experimental/transformers/llama/modeling.py
@@ -89,12 +89,9 @@ def __init__(self, config):
         self.config = config
 
     def forward(self, hidden_states):
-        result = paddle.incubate.nn.functional.fused_rms_norm(
+        return paddle.incubate.nn.functional.fused_rms_norm(
             hidden_states, self.weight, None, self.variance_epsilon, begin_norm_axis=1
-        )
-        if isinstance(result, tuple):
-            return result[0]
-        return result
+        )[0]
 
 
 class LLamaAvxLMHead(nn.Layer):
diff --git a/paddlenlp/experimental/transformers/mixtral/modeling.py b/paddlenlp/experimental/transformers/mixtral/modeling.py
@@ -77,12 +77,9 @@ def __init__(self, config):
         self.config = config
 
     def forward(self, hidden_states):
-        result = paddle.incubate.nn.functional.fused_rms_norm(
+        return paddle.incubate.nn.functional.fused_rms_norm(
             hidden_states, self.weight, None, self.variance_epsilon, begin_norm_axis=1
-        )
-        if isinstance(result, tuple):
-            return result[0]
-        return result
+        )[0]
 
 
 @register_base_model
diff --git a/paddlenlp/experimental/transformers/qwen/modeling.py b/paddlenlp/experimental/transformers/qwen/modeling.py
@@ -53,10 +53,7 @@ def __init__(self, config):
         )
 
     def forward(self, x):
-        result = paddle.incubate.nn.functional.fused_rms_norm(x, self.weight, None, self.eps, begin_norm_axis=1)
-        if isinstance(result, tuple):
-            return result[0]
-        return result
+        return paddle.incubate.nn.functional.fused_rms_norm(x, self.weight, None, self.eps, begin_norm_axis=1)[0]
 
 
 @register_base_model
diff --git a/paddlenlp/experimental/transformers/qwen2/modeling.py b/paddlenlp/experimental/transformers/qwen2/modeling.py
@@ -78,10 +78,7 @@ def __init__(self, config):
         )
 
     def forward(self, x):
-        result = paddle.incubate.nn.functional.fused_rms_norm(x, self.weight, None, self.eps, begin_norm_axis=1)
-        if isinstance(result, tuple):
-            return result[0]
-        return result
+        return paddle.incubate.nn.functional.fused_rms_norm(x, self.weight, None, self.eps, begin_norm_axis=1)[0]
 
 
 @register_base_model
diff --git a/paddlenlp/experimental/transformers/qwen2_moe/modeling.py b/paddlenlp/experimental/transformers/qwen2_moe/modeling.py
@@ -65,10 +65,7 @@ def __init__(self, config):
         )
 
     def forward(self, x):
-        result = paddle.incubate.nn.functional.fused_rms_norm(x, self.weight, None, self.eps, begin_norm_axis=1)
-        if isinstance(result, tuple):
-            return result[0]
-        return result
+        return paddle.incubate.nn.functional.fused_rms_norm(x, self.weight, None, self.eps, begin_norm_axis=1)[0]
 
 
 @register_base_model

Original file line number	Diff line number	Diff line change
`@@ -53,10 +53,7 @@ def __init__(self, config):`
`53`	`53`	`)`
`54`	`54`
`55`	`55`	`def forward(self, x):`
`56`		`- result = paddle.incubate.nn.functional.fused_rms_norm(x, self.weight, None, self.eps, begin_norm_axis=1)`
`57`		`- if isinstance(result, tuple):`
`58`		`- return result[0]`
`59`		`- return result`
	`56`	`+ return paddle.incubate.nn.functional.fused_rms_norm(x, self.weight, None, self.eps, begin_norm_axis=1)[0]`
`60`	`57`
`61`	`58`
`62`	`59`	`@register_base_model`
Original file line number	Diff line number	Diff line change
`@@ -78,10 +78,7 @@ def __init__(self, config):`
`78`	`78`	`)`
`79`	`79`
`80`	`80`	`def forward(self, x):`
`81`		`- result = paddle.incubate.nn.functional.fused_rms_norm(x, self.weight, None, self.eps, begin_norm_axis=1)`
`82`		`- if isinstance(result, tuple):`
`83`		`- return result[0]`
`84`		`- return result`
	`81`	`+ return paddle.incubate.nn.functional.fused_rms_norm(x, self.weight, None, self.eps, begin_norm_axis=1)[0]`
`85`	`82`
`86`	`83`
`87`	`84`	`@register_base_model`
Original file line number	Diff line number	Diff line change
`@@ -65,10 +65,7 @@ def __init__(self, config):`
`65`	`65`	`)`
`66`	`66`
`67`	`67`	`def forward(self, x):`
`68`		`- result = paddle.incubate.nn.functional.fused_rms_norm(x, self.weight, None, self.eps, begin_norm_axis=1)`
`69`		`- if isinstance(result, tuple):`
`70`		`- return result[0]`
`71`		`- return result`
	`68`	`+ return paddle.incubate.nn.functional.fused_rms_norm(x, self.weight, None, self.eps, begin_norm_axis=1)[0]`
`72`	`69`
`73`	`70`
`74`	`71`	`@register_base_model`