小心 Python 函数默认参数的陷阱

Python 的函数参数支持默认值,这是本人一直喜欢的特性,Python 不支持方法重载,但默认参数可起到类似的效果,还不用写多个函数。现在支持默认参数的语言普遍的,像 C++, C#, Ruby, Groovy, PHP, Scala, JavaScript 等,Java 还不行。

但是特别要小心,Python 的函数默认值与其他的语言是不同的,直接违反了最直观的常识 -- 默认参数应该是省略就每次用同样的默认值,传的话就用传入的值。

当我在 IntelliJ IDEA 中写类似如下的代码

我的 SonarLint 插件就要抱怨了

说是

SonarLint: Change this default value to "None" and initialize this parameter inside the function/method
Default argument value is mutable

原因是默认参数值为可变的,并且在函数中对它进行了修改,如果在函数中未修改该默认参数值也不会有这样的提示。然后按照建议被要求改成如下的形式

为了一个默认参数需要加上额外的两行。我一开始对  Sonar 的提示不以为然,因为按照其他语言的思维模式,默认参数就是这样用,直到后来发现多次对该函数调用返回值是有关联的才意识到踩到了一个陷阱。

为了说明 Python 的这一陷阱,换一下测试函数

执行后的输出是

----------------total=[]
hello
----------------total=['hello']
hello world
----------------total=['hello', 'world']
hello world !
----------------total=['bb']
bb aa
----------------total=['hello', 'world', '!']
hello world ! cc

应用默认值前后多次调用该函数时是有关联的,很像 C+ 函数内部的 static 变量,多次函数调用只初始化一次。

先搁置一下,看看多数语言默认参数的行为,来个 Scala  -- 许久未用 Scala 了

执行,输出为

----------------total=[]
hello
----------------total=[]
world
----------------total=[]
!
----------------total=[bb]
bb aa
----------------total=[]
cc

这是合乎常规的,前后不传默认参数的调用是无关的。

回过头来看 Python 的默认参数的行为,它的默认参数值相当于是一个全局变量,前面 Python 的 say(word, total=[]) 与下面的实现行为上是完全一致的 

根据现象,我们试着这么去理解

  1. Python 在解释 def say(word, total=[]) 时产生一个全局的变量 total
  2. 调用时如果省略该 total 参数,函数内部就会使用用全局的 total 变量
  3. 调用时如传入自己的 total 参数,全局的 total 变量就会暂时被传入的 total 变量遮盖 

这完全能解释 Python 默认参数的行为,接下来要深入到本质。

从查看 globals() 和用  dis.dis(say) 检视字节码没看到什么玄机,如果可视化的对比两段代码的才能发现差异

带默认值参数

从上图可以看到 Global frame 的 say 函数持有一个自己的 total 引用,如果参数 total 省略时就会它,否则就使用通过参数传递进来的 total

不带默认值参数

其实在解释函数的时候,函数对象会有一个 __defaults__ 引用了所有的默认参数列表,该 __defaults__ 只会被初始化一次。观察下面的代码就能很的理解

执行结果如下:

say.__defaults__=(['11'],)
----------
id(total)=140665234758400
id(say.__defaults__[0])=140665234758400
----------
id(total)=140665235569600
id(say.__defaults__[0])=140665234758400
----------
id(total)=140665234758400
id(say.__defaults__[0])=140665234758400

注意观察上面从函数中打印出的 id(total)id(say.__defaults__[0]) 的值。函数的 __defaults__ 包含所以默认参数的引用,调用函数时省略的参数就会从函数 __defaults__ 中找对应的值。

进一步理解 Python 的默认参数与别的语言的不同之处就是

Python 在解释函数时,参数默认值只初始化一次,其他的语言的默认参数在调用时省略的话就会又初始一个默认值

如何避免 Python 这种默认参数的行为造成的问题呢?两种方式:1)默认参数值为不可变的,2)使用 sentinel 值作为默认参数值

如果是不可变值作为默认参数,是安全的

这是没问题的,Immutable 的默认参数每次调用时都是初始值。

如果是可变的话,就按照 Sonar 的推荐方式

None 就是一个 sentinel, 也可以选择其他的值作为 sentinel。

这样做,total 永远就没有机会指向 say.__defaults__[0] 的值了,因为只要省略就会用 total = [] 每次动态创建一个新的实例。

本文链接 https://yanbin.blog/careful-python-function-default-parameter/, 来自 隔叶黄莺 Yanbin Blog

[版权声明] Creative Commons License 本文采用 署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0) 进行许可。

Subscribe
Notify of
guest

0 Comments
Inline Feedbacks
View all comments