private[spark] class MapPartitionsRDD[U: ClassTag, T: ClassTag](
    prev: RDD[T],
    f: (TaskContext, Int, Iterator[T]) => Iterator[U],  // (TaskContext, partition index, iterator)
    preservesPartitioning: Boolean = false)
  extends RDD[U](prev) {

  override def compute(split: Partition, context: TaskContext): Iterator[U] =
    f(context, split.index, firstParent[T].iterator(split, context))
}

方法的参数列表，传入一个参数为(TaskContext, Int, Iterator[T])返回为Iterator[U]的函数作为MapPartitionsRDD的构造函数的参数f，方法compute会调用这个方法。

answered 9 years ago

DT的路过

share

DT的路过 answered 9 years ago

spark1.2里的一小段scala代码看不懂

爆肝女青年A

Answers

teddy

DT的路过

Your Answer