李林超博客
  • 首页
  • 归档
  • 留言
  • 友链
  • 动态
  • 关于
  • 归档
    留言
    友链
    动态
    关于
首页 标签 Spark Core 下的文章
02. Spark Shuffle过程介绍

02. Spark Shuffle过程介绍

02. Spark Shuffle过程介绍一、Shuffle概念1.1 Shuffle简介有些运算需要将各节点上的同一类数据汇集到某一节点进行计算,把这些分布在不同节点的数据按照一定的规则汇集到一起的过程称为 Shuffle。1.2 MapReduce中的Shuffle在MapReduce框架,Shuffle是连接Map和Reduce之间的桥梁,Map阶段通过shuffle读取数据并输出到对...

 大数据  2021-06-29 AM  3543次  0条
01.MapReduce介绍

01.MapReduce介绍

01.MapReduce介绍一、简介​ 在分布式计算中,MapReduce框架负责处理了并行编程中分布式存储、工作调度、负载均衡、容错均衡、容错处理以及网络通信等复杂问题,把处理过程高度抽象为两个函数:map和reduce。​ MapReduce采用"分而治之"的思想,把对大规模数据集的操作,分发给一个主节点管理下的各个分节点共同完成,然后通过整合各个节点的中间结...

 大数据  2021-06-29 AM  2947次  0条
«123

 栏目分类

  •  随笔2
  •  Java326
  •  大数据229
  •  工具35
  •  其它25
  •  GO48
  •  NLP8

标签云

散列KubernetesJava阻塞队列哈希表Kafka人工智能ElasticsearchShiroFlinkJVMHDFSElastisearchJavaScriptClickHouse排序DockerCentOSZookeepergorm递归容器深入研究SentinelFilterHbase队列RedisDataXFlume设计模式栈

友情链接申请

范明明 庄严博客 Mx 陶小桃Blog 虫洞
© 2026 李林超博客 京ICP备19042988号 个人博客