获取相关资料

大数据技术之Spark3.x性能优化

大数据技术之Spark3.x性能优化

大数据技术之Spark3.x性能优化

大数据技术之Spark3.x性能优化

资源简介:

资源大小:2.36GB

〖课程介绍〗:

本套课程从多个方面展开讲解Spark的调优策略,包括资源配置调优、SparkSQL语法调优、执行计划解读、数据倾斜问题解决、Job优化、Spark3.0新特性详解。

〖课程目录〗:

01-课程简介.mp4 16.70M

02_执行计划_准备测试数据和表.mp4 19.46M

03_执行计划_执行流程&案例实操解读.mp4 150.13M

04-资源规划-资源设定上限估算.mp4 21.24M

05-资源规划-精确内存估算.mp4 28.01M

06-资源规划-精确调整内存各比例.mp4 15.72M

07-缓存调优-RDD-进行cache.mp4 39.32M

08-缓存调优-RDD-cache结合kryo序列化.mp4 21.24M

09-缓存调优-DS-cache和序列化.mp4 45.65M

10-CPU调优-合理利用CPU资源.mp4 86.32M

11-语法优化-RBO-inner join的谓词下推.mp4 70.46M

12-语法优化-RBO-外关联的谓词下推.mp4 67.87M

13-语法优化-RBO-列裁剪&常量替换.mp4 21.49M

14-语法优化-CBO-Statics统计&CBO使用效果.mp4 124.05M

15-语法优化-广播Join.mp4 89.08M

16-语法优化-Join-SMB Join原理.mp4 21.10M

17-语法优化-Join-SMB Join效果演示.mp4 47.41M

18-数据倾斜-现象&原因&抽样定位大key.mp4 33.99M

19-数据倾斜-单表数据倾斜处理.mp4 58.08M

20-数据倾斜-Join-使用广播Join.mp4 42.45M

21-数据倾斜-Join-拆分key 打散大表 扩容小表.mp4 87.33M

22-Map端优化-使用Map端预聚合.mp4 6.00M

23-Map端优化-读取小文件优化.mp4 142.67M

24-Map端优化-调大ShuffleWrite溢写时的输出流缓冲&源码分析.mp4 107.28M

25-Reduce端优化-输出产生小文件优化-调整并行度&缩小分区.mp4 32.14M

26-Reduce端优化-动态分区插入小文件优化.mp4 38.08M

27-Reduce端优化-提高Reduce端缓冲区&重试次数&重试等待间隔.mp4 74.27M

28-Reduce端优化-合理使用bypass.mp4 42.01M

29-Job优化-调节数据本地化等待时间.mp4 99.06M

30-Job优化-堆外内存的版本区别.mp4 43.81M

31-Job优化-使用堆外缓存.mp4 40.56M

32-Job优化-调整连接等待时长.mp4 45.39M

33-Spark3.0-AQE-动态合并分区&动态申请资源.mp4 102.12M

34-Spark3.0-AQE-动态切换Join策略.mp4 43.37M

35-Spark3.0-AQE-自动优化join倾斜.mp4 87.61M

36-Spark3.0-DPP-动态分区裁剪.mp4 69.25M

37-Spark3.0-Hint增强.mp4 25.36M

38-常见故障思路简析.mp4 47.06M

笔记.zip 2.70M

代码.zip 45.67kb

资料.zip 262.00M

0
分享到:

评论0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址