map reduce filter sorted
- 函数名也是变量,
函数名其实就是指向函数的变量
- 把函数作为参数传入,这样的函数称为
高阶函数
map
接收两个参数,一个是函数
,一个是Iterable
,map将传入的函数依次作用到序列的每个元素,并把结果作为新的Iterator
返回。
>>> def f(x):
... return x * x
...
>>> r = map(f, [1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> list(r)
[1, 4, 9, 16, 25, 36, 49, 64, 81]
由于结果r是一个Iterator,Iterator是惰性序列
,因此通过list()函数让它把整个序列都计算出来并返回一个list。
reduce
把一个函数
作用在一个序列[x1, x2, x3, ...]
上,这个函数必须接收两个参数,reduce把结果继续和序列的下一个元素做累积计算,其效果就是:reduce(f, [x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)
from functools import reduce
def char2num(s):
return {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]
def str2int(s):
return reduce(lambda x, y: x * 10 + y, map(char2num, s))
filter
,filter()把传入的函数依次作用于每个元素
,然后根据返回值是True还是False决定保留还是丢弃该元素
。函数返回的是一个Iterator
,也就是一个惰性序列
,所以要强迫filter()完成计算结果,需要用list()函数获得所有结果并返回list
def main():
for n in primes():
if n < 1000:
print(n)
else:
break
def _odd_iter():
n = 1
while True:
n = n + 2
yield n
def _not_divisible(n):
return lambda x: x % n > 0
def primes():
yield 2
it = _odd_iter()
while True:
n = next(it)
yield n
it = filter(_not_divisible(n), it)
if __name__ == '__main__':
main()
sorted
, sorted()函数也是一个``高阶函数,它还可以接收一个
key函数`来实现自定义的排序,例如按绝对值大小排序:
>>> sorted([36, 5, -12, 9, -21], key=abs)
[5, 9, -12, -21, 36]
要进行反向排序,不必改动key函数,可以传入第三个参数reverse=True
:
>>> sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower, reverse=True)
['Zoo', 'Credit', 'bob', 'about']
函数作为返回值
def lazy_sum(*args):
def sum():
ax = 0
for n in args:
ax = ax + n
return ax
return sum
#惰性求值
>>> f = lazy_sum(1, 3, 5, 7, 9)
>>> f
<function lazy_sum.<locals>.sum at 0x101c6ed90>
>>> f()
25
当我们调用lazy_sum()时,返回的并不是求和结果,而是求和函数
,调用函数f时,才真正
计算求和
的结果,当lazy_sum返回函数sum
时,相关参数和变量
都保存在返回的函数
中,这种称为“闭包(Closure)”
的程序结构
- 调用lazy_sum()时,每次调用都会返回一个
新
的函数,即使传入相同的参数,调用结果互不影响
>>> f1 = lazy_sum(1, 3, 5, 7, 9)
>>> f2 = lazy_sum(1, 3, 5, 7, 9)
>>> f1==f2
False
闭包
返回的函数
并没有立刻执行,而是直到调用了f()
才执行- 易错例子
def count():
fs = []
for i in range(1, 4):
def f():
return i*i
fs.append(f)
return fs
f1, f2, f3 = count()
#run
>>> f1()
9
>>> f2()
9
>>> f3()
9
全部都是9!原因就在于返回的函数引用了变量i
,但它并非立刻执行
。等到3个函数都返回
时,它们所引用的变量i
已经变成了3
,因此最终结果为9。
返回闭包时牢记的一点就是:返回函数不要引用任何循环变量,或者后续会发生变化的变量。
- 如果一定要引用
循环变量
怎么办?方法是再创建一个函数
,用该函数的参数
绑定循环变量当前
的值,无论该循环变量后续如何更改,已绑定
到函数参数的值
不变:
def count():
def f(j):
def g():
return j*j
return g
fs = []
for i in range(1, 4):
fs.append(f(i)) # f(i)立刻被执行,因此i的当前值被传入f()
return fs
匿名函数
- 匿名函数有个限制,就是
只
能有一个表达式
,不
用写return
,返回值
就是该表达式的结果
- 匿名函数也是一个
函数对象
,也可以把匿名函数赋值给一个变量
,再利用变量来调用该函数:
>>> f = lambda x: x * x
>>> f
<function <lambda> at 0x101c6ef28>
>>> f(5)
25
装饰器
函数对象
有一个__name__
属性,可以拿到函数的名字
- 假设我们要增强函数的功能,比如,在函数调用前后自动打印日志,但又不希望修改函数的定义,这种在
代码运行
期间动态增加功能
的方式,称之为“装饰器”(Decorator)
。 - 本质上,
decorator
就是一个返回函数
的高阶函数
import functools
def log(func):
@functools.wraps(func)
def wrapper(*args, **kw):
print('call %s():' % func.__name__)
return func(*args, **kw)
return wrapper
@log('execute')
def now():
print('2015-3-25')
上面的log
,因为它是一个decorator,所以接受一个函数
作为参数,并返回一个函数
。我们要借助Python的@
语法,把decorator置于函数的定义处
- 如果
decorator
本身
需要传入参数
,那就需要编写一个返回decorator的高阶函数
import functools
def log(text):
def decorator(func):
@functools.wraps(func)
def wrapper(*args, **kw):
print('%s %s():' % (text, func.__name__))
return func(*args, **kw)
return wrapper
return decorator
@log('execute')
def now():
print('2015-3-25')
和两层嵌套的decorator相比,3层嵌套的效果是这样的:
>>> now = log('execute')(now)
- 看经过decorator装饰之后的函数,它们的
__name__
已经从原来的'now'
变成了'wrapper'
- 不需要编写
wrapper.__name__ = func.__name__
这样的代码,Python内置的functools.wraps
就是干这个事的
>>> now.__name__
'wrapper'
偏函数
functools.partial
创建偏函数,把一个函数的某些参数
给固定住(也就是设置默认值),返回一个新的函数
,调用这个新函数会更简单。
>>> import functools
>>> int2 = functools.partial(int, base=2)
>>> int2('1000000')
64
- 新的
int2
函数,仅仅是把base参数重新设定默认值为2,但也可以在函数调用时传入其他值
>>> int2('1000000', base=10)
1000000
- 理解: 创建偏函数时,实际上可以接收
函数对象
、*args
和**kw
这3个参数
int2 = functools.partial(int, base=2)
int2('10010')
#等价于
kw = { 'base': 2 }
int('10010', **kw)
max2 = functools.partial(max, 10)
max2(5, 6, 7)
#等价于
args = (10, 5, 6, 7)
max(*args)
近期评论