课程信息
本套教程基于Spark 3.3版本,使用Java语言,详解了Spark技术生态的三个核心模块:Spark Core核心模块,讲解Spark运行环境,以及分布式数据模型RDD的使用和原理;Spark SQL模块,讲解Spark在结构化数据场景中的使用方式,包括SQL语法、DSL语法、UDF函数、UDAF函数等;Spark Streaming模块,讲解Spark在流式数据处理中的使用方式,包括无界数据流的处理、Kafka系统的对接和数据窗口的应用等。
课程目录
├── 视频 │ ├── 001-Spark-课程介绍.mp4 19.04M │ ├── 002-Spark-文件结构-介绍.mp4 6.55M │ ├── 003-Spark-基础概念-介绍-分布式.mp4 20.90M │ ├── 004-Spark-基础概念-介绍-计算.mp4 41.68M │ ├── 005-Spark-基础概念-介绍-分布式基础架构.mp4 32.13M │ ├── 006-Spark-基础概念-介绍-框架.mp4 46.52M │ ├── 007-Spark-基础概念-介绍-Spark和MR的关系.mp4 59.99M │ ├── 008-Spark-介绍.mp4 39.40M │ ├── 009-Spark-部署方式-介绍.mp4 62.77M │ ├── 010-Spark-解压后的文件结构.mp4 50.90M │ ├── 011-Spark-部署环境-Local.mp4 61.49M │ ├── 012-Spark-部署环境-Local-演示.mp4 114.68M │ ├── 013-Spark-部署环境-Yarn-演示.mp4 127.63M │ ├── 014-Spark-部署环境-Yarn-历史服务.mp4 63.42M │ ├── 015-Spark-部署环境-Yarn-2种执行方式Cluster和Client.mp4 146.45M │ ├── 016-Spark-部署环境-几种模式的对比.mp4 22.54M │ ├── 017-Spark-数据结构-说明.mp4 42.55M │ ├── 018-Spark-RDD-介绍.mp4 62.58M │ ├── 019-Spark-RDD-数据处理流程简介.mp4 42.44M │ ├── 020-Spark-RDD-计算原理.mp4 54.99M │ ├── 021-Spark-RDD-计算原理-补充.mp4 138.22M │ ├── 022-Spark-RDD-代码-环境的准备.mp4 86.35M │ ├── 023-Spark-RDD-代码-对接内存数据源构建RDD对象.mp4 34.61M │ ├── 024-Spark-RDD-代码-对接磁盘数据源构建RDD对象.mp4 18.66M │ ├── 025-Spark-RDD-代码-RDD的理解.mp4 35.07M │ ├── 026-Spark-RDD-代码-RDD的分区.mp4 64.72M │ ├── 027-Spark-RDD-代码-内存数据源-分区数量的设定.mp4 91.86M │ ├── 028-Spark-RDD-代码-磁盘文件数据源-分区数量的设定.mp4 134.52M │ ├── 029-Spark-RDD-代码-内存数据源-分区数据的分配.mp4 85.40M │ ├── 030-Spark-RDD-代码-磁盘文件数据源-分区数据的分配.mp4 70.89M │ ├── 031-Spark-RDD-代码-磁盘文件数据源-分区数据的分配-演示.mp4 34.49M │ ├── 032-Spark-RDD-课件梳理.mp4 34.36M │ ├── 033-Spark-RDD-方法-介绍.mp4 67.86M │ ├── 034-Spark-RDD-方法-方法的2大类-转换和行动.mp4 38.11M │ ├── 035-Spark-RDD-方法-数据处理的2大类-单值和键值.mp4 65.48M │ ├── 036-Spark-RDD-方法-转换-map.mp4 135.83M │ ├── 037-Spark-RDD-方法-转换-map-1.mp4 106.44M │ ├── 038-Spark-RDD-方法-转换-map-2.mp4 48.21M │ ├── 039-Spark-RDD-方法-转换-map-3.mp4 137.03M │ ├── 040-Spark-RDD-方法-转换-map-4.mp4 51.66M │ ├── 041-Spark-RDD-方法-转换-filter.mp4 57.75M │ ├── 042-Spark-RDD-方法-转换-flatMap.mp4 131.57M │ ├── 043-Spark-RDD-方法-转换-flatMap-1.mp4 40.43M │ ├── 044-Spark-RDD-方法-转换-groupBy.mp4 66.14M │ ├── 045-Spark-RDD-回顾-原理.mp4 87.15M │ ├── 046-Spark-RDD-回顾-方法.mp4 31.56M │ ├── 047-Spark-RDD-Shuffle.mp4 55.45M │ ├── 048-Spark-RDD-Shuffle-原理.mp4 67.01M │ ├── 049-Spark-RDD-Shuffle-原理-补充.mp4 49.15M │ ├── 050-Spark-RDD-Shuffle-演示.mp4 97.15M │ ├── 051-Spark-RDD-方法-distinct.mp4 38.41M │ ├── 052-Spark-RDD-方法-sortBy.mp4 83.69M │ ├── 053-Spark-RDD-方法-KV类型数据介绍.mp4 78.10M │ ├── 054-Spark-RDD-方法-KV类型数据补充.mp4 22.38M │ ├── 055-Spark-RDD-方法-KV-mapValues.mp4 53.29M │ ├── 056-Spark-RDD-方法-KV-wordCount.mp4 57.83M │ ├── 057-Spark-RDD-方法-KV-groupByKey.mp4 73.48M │ ├── 058-Spark-RDD-方法-KV-reduceByKey.mp4 144.81M │ ├── 059-Spark-RDD-方法-KV-sortByKey.mp4 183.51M │ ├── 060-Spark-RDD-方法-KV-reduceByKey和groupByKey的区别.mp4 122.65M │ ├── 061-Spark-RDD-WordCount程序在环境中运行.mp4 79.71M │ ├── 062-Spark-RDD-转换方法的回顾.mp4 142.30M │ ├── 063-Spark-RDD-行动算子-介绍.mp4 176.59M │ ├── 064-Spark-RDD-行动算子-collect.mp4 70.71M │ ├── 065-Spark-RDD-行动算子-collect-补充.mp4 74.09M │ ├── 066-Spark-RDD-行动算子-其他方法-1.mp4 39.91M │ ├── 067-Spark-RDD-行动算子-其他方法-2.mp4 57.06M │ ├── 068-Spark-RDD-行动算子-其他方法-3.mp4 98.90M │ ├── 069-Spark-RDD-行动算子-Driver端和Executor端数据传输.mp4 96.26M │ ├── 070-Spark-RDD-序列化-1.mp4 93.67M │ ├── 071-Spark-RDD-序列化-2.mp4 42.57M │ ├── 072-Spark-案例-数据格式说明.mp4 103.13M │ ├── 073-Spark-案例-需求介绍.mp4 35.16M │ ├── 074-Spark-案例-需求分析.mp4 55.81M │ ├── 075-Spark-案例-需求设计.mp4 33.06M │ ├── 076-Spark-案例-开发原则.mp4 30.18M │ ├── 077-Spark-案例-代码实现-1.mp4 110.06M │ ├── 078-Spark-案例-代码实现-2.mp4 230.41M │ ├── 079-Spark-案例-代码实现-3.mp4 137.01M │ ├── 080-Spark-案例-代码实现-4.mp4 90.51M │ ├── 081-Spark-RDD-KRYO序列化框架.mp4 103.51M │ ├── 082-Spark-RDD-依赖关系-介绍.mp4 84.03M │ ├── 083-Spark-RDD-依赖关系-原理.mp4 43.14M │ ├── 084-Spark-RDD-依赖关系-血缘关系.mp4 43.12M │ ├── 085-Spark-RDD-依赖关系-依赖关系.mp4 35.39M │ ├── 086-Spark-RDD-依赖关系-宽窄依赖关系.mp4 85.33M │ ├── 087-Spark-RDD-依赖关系-作业,阶段和任务的关系.mp4 336.03M │ ├── 088-Spark-RDD-依赖关系-任务的数量.mp4 64.59M │ ├── 089-Spark-RDD-依赖关系-分区的数量.mp4 67.55M │ ├── 090-Spark-RDD-持久化和序列化的关系.mp4 9.31M │ ├── 091-Spark-RDD-持久化-cache.mp4 96.12M │ ├── 092-Spark-RDD-持久化-persist.mp4 100.61M │ ├── 093-Spark-RDD-持久化-checkpoint.mp4 104.47M │ ├── 094-Spark-RDD-持久化-shuffle算子的持久化.mp4 132.34M │ ├── 095-Spark-RDD-分区器.mp4 154.03M │ ├── 096-Spark-RDD-自定义分区器.mp4 85.62M │ ├── 097-Spark-两个案例.mp4 58.78M │ ├── 098-Spark-第一个案例问题原因.mp4 37.79M │ ├── 099-Spark-广播变量.mp4 65.30M │ ├── 100-Spark-RDD的局限性.mp4 129.28M │ ├── 101-SparkSQL-介绍.mp4 117.04M │ ├── 102-SparkSQL-环境对象的封装.mp4 79.67M │ ├── 103-SparkSQL-模型对象的封装.mp4 31.32M │ ├── 104-SparkSQL-SQL的操作.mp4 38.52M │ ├── 105-SparkSQL-不同场景下环境对象的转换.mp4 72.26M │ ├── 106-SparkSQL-不同场景下模型数据对象的转换.mp4 61.77M │ ├── 107-SparkSQL-使用SQL的方式来访问数据模型.mp4 35.89M │ ├── 108-SparkSQL-使用DSL的方式来访问数据模型.mp4 15.96M │ ├── 109-SparkSQL-自定义udf函数对象.mp4 121.20M │ ├── 110-SparkSQL-自定义udf函数的底层实现原理.mp4 71.33M │ ├── 111-SparkSQL-自定义udaf函数的底层实现原理.mp4 44.88M │ ├── 112-SparkSQL-自定义udaf函数的实现步骤-1.mp4 60.21M │ ├── 113-SparkSQL-自定义udaf函数的实现步骤-2.mp4 91.21M │ ├── 114-SparkSQL-自定义udaf函数的实现步骤-回顾.mp4 70.05M │ ├── 115-SparkSQL-数据源-CSV.mp4 105.08M │ ├── 116-SparkSQL-数据源-JSON.mp4 81.60M │ ├── 117-SparkSQL-数据源-Parquet.mp4 56.34M │ ├── 118-SparkSQL-数据源-JDBC.mp4 66.58M │ ├── 119-SparkSQL-数据源-Hive.mp4 76.43M │ ├── 120-SparkSQL-案例-数据准备.mp4 54.42M │ ├── 121-SparkSQL-案例-数据准备-补充.mp4 17.91M │ ├── 122-SparkSQL-案例-需求分析.mp4 82.17M │ ├── 123-SparkSQL-案例-需求设计.mp4 59.04M │ ├── 124-SparkSQL-案例-SQL实现-1.mp4 112.79M │ ├── 125-SparkSQL-案例-SQL实现-2.mp4 48.36M │ ├── 126-SparkSQL-案例-SQL实现-3.mp4 100.36M │ ├── 127-SparkSQL-案例-SQL实现-4.mp4 98.79M │ ├── 128-SparkSQL-案例-SQL实现-5.mp4 51.55M │ ├── 129-SparkSQL-案例-SQL实现-6.mp4 113.08M │ ├── 130-SparkSQL-案例-SQL实现-7.mp4 96.65M │ ├── 131-SparkSQL-案例-SQL实现-8.mp4 11.69M │ ├── 132-SparkSQL-案例-SQL实现-9.mp4 95.53M │ ├── 133-SparkStreaming-介绍.mp4 78.78M │ ├── 134-SparkStreaming-原理.mp4 72.77M │ ├── 135-SparkStreaming-原理-补充.mp4 22.24M │ ├── 136-SparkStreaming-课件梳理.mp4 50.41M │ ├── 137-SparkStreaming-环境准备.mp4 80.52M │ ├── 138-SparkStreaming-网络(Socket)数据流处理演示.mp4 39.02M │ ├── 139-SparkStreaming-Kafka数据流处理演示.mp4 64.64M │ ├── 140-SparkStreaming-DStream方法介绍.mp4 63.63M │ ├── 141-SparkStreaming-DStream输出方法介绍.mp4 44.16M │ ├── 142-SparkStreaming-窗口操作.mp4 119.04M │ ├── 143-SparkStreaming-回顾-1.mp4 151.56M │ ├── 144-SparkStreaming-回顾-2.mp4 130.70M │ ├── 145-SparkStreaming-关闭-1.mp4 78.32M │ ├── 146-SparkStreaming-关闭-2.mp4 42.69M │ ├── 147-SparkStreaming-关闭-3.mp4 75.54M │ ├── 148-Spark-内核-运行流程-1.mp4 216.95M │ ├── 149-Spark-内核-运行流程-2.mp4 167.93M │ ├── 150-Spark-内核-运行流程-3.mp4 56.83M │ ├── 151-Spark-内核-核心对象.mp4 72.45M │ ├── 152-Spark-内核-核心对象通信流程-Netty.mp4 160.12M │ ├── 153-Spark-内核-Task任务的调度执行.mp4 271.38M │ ├── 154-Spark-内核-Shuffle底层的实现原理-1.mp4 162.27M │ ├── 155-Spark-内核-Shuffle底层的实现原理-2.mp4 160.17M │ ├── 156-Spark-内核-内存管理.mp4 113.59M │ └── 157-Spark-内核-内存管理-补充.mp4 101.61M ├── 1.课件.zip 25.68M └── 3.代码.zip 18.08M
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)