Cache:当我们想复用数据的时候一般都会进行Cache,在实际生产环境下复用RDD是最重要的性能优化手段之一. Checkpoint:相当于Cache的备胎,Checkpoint的数据会放在容错的文件系统中,进行Checkpoint的RDD一般都会首先进行Cache来避免数据的重复计算 赞微海报分享
近期评论