• 欢迎来到分销市场~
  • 前往课程批发市场
  • 免费注册
  • 立即登录
点播

Spark 2.0从入门到精通:Scala编程

点击 “立即分销” 开始分销商品~

预计收益: 713.25

商品售价: ¥1585.00

本课程主要讲解目前大数据领域热门、火爆、有前景的技术——Spark。

在本课程中,会从浅入深,基于大量案例实战,深度剖析和讲解Spark,并且会包含完全从企业真实复杂业务需求中抽取出的案例实战。课程会涵盖Scala编程详解、Spark核心编程、Spark SQL和Spark Streaming、Spark内核以及源码剖析、性能调优、企业级案例实战等部分。完全从零起步,让学员可以一站式精通Spark企业级大数据开发,提升自己的职场竞争力,实现更好的升职或者跳槽,或者从j2ee等传统软件开发工程师转型为Spark大数据开发工程师,或是对于正在从事hadoop大数据开发的朋友可以拓宽自己的技术能力栈,提升自己的价值。
1.课程研发环境
开发工具: Eclipse、Scala IDE for Eclipse;
Spark: 1.3.0和1.5.1
Hadoop: 2.4.1
Hive: 0.13
ZooKeeper: 3.4.5
Kafka: 2.9.2-0.8.1     
其他工具: SecureCRT、WinSCP、VirtualBox等

2.内容简介
本课程主要讲解的内容包括:Scala编程、Hadoop与Spark集群搭建、Spark核心编程、Spark内核源码深度剖析、Spark性能调优、Spark SQL、Spark Streaming。

本课程的特色包括:
1、代码驱动讲解Spark的各个技术点(绝对不是照着PPT空讲理论);
2、现场动手画图讲解Spark原理以及源码(绝对不是干讲源码和PPT);
3、覆盖Spark所有功能点(Spark RDD、Spark SQL、Spark Streaming,初级功能到高级特性,一个不少);
4、Scala全程案例实战讲解(近百个趣味性案例);
5、Spark案例实战的代码,几乎都提供了Java和Scala两个版本和讲解(一次性同时精通Java和Scala开发Spark);
6、大量全网独有的知识点:基于排序的wordcount,Spark二次排序,Spark分组取topn,DataFrame与RDD的两种转换方式,Spark SQL的内置函数、开窗函数、UDF、UDAF,Spark       Streaming的Kafka Direct API、updateStateByKey、transform、滑动窗口、foreachRDD性能优化、与Spark SQL整合使用、持久化、checkpoint、容错与事务。
7、多个从企业实际需求抽取出的复杂案例实战:每日uv和销售额统计案例、top3热卖商品统计案例、每日top3热点搜索词统计、广告计费日志实时黑名单过滤案例、热点搜索词滑动统       计案例、top3热门商品实时统计案例
8、深度剖析Spark内核源码与Spark Streaming源码,给源码进行详细的注释和讲解
9、全面讲解Spark、Spark SQL、Spark Streaming的性能调优,其中包括全网独有的Shuffle性能调优(详细讲解性能调优的各个技术点)
10、涵盖Spark两个重要版本,Spark 1.3.0和Spark 1.5.1的讲解(走在Spark前沿,涵盖新高级特性)


本次Spark 2.0课程升级,总计30讲内容,大约15个课时。主要是深入浅出讲解了Spark2.0版本的相关内容。主要内容大纲如下:
1. Spark 2.0新特性深入浅出剖析:主要讲解了Spark 2.0都有哪些新特性,同时深入浅出剖析了Spark 2.0的第二代Tungsten引擎的工作原理。
2. Dataset/Dataframe开发详解:主要完整讲解了Spark 2.0开始,API-Dataset/Dataframe的开发,包括主要的各种计算操作以及常用函数等。
3. Structured Streaming开发详解:主要深入浅出讲解了Spark 2.0新增加的下一代流式计算引擎——Structured Streaming,包括其设计理念和思想,以及开发模式,以及开发的一些细节。
4. Spark简历编写、面试以及如何找工作:主要为大家分析了学完课程之后,对自己如何定位?如何深入了解企业的招聘需求?如何将自己的技术背景补齐到与公司需求相match?如何编写简历?如何拥有属于自己的独一无二的大数据项目?如何掌握面试的关键技巧?目前大数据行业的薪资现状以及如何谈一个合适的薪资?
5. 具体的升级内容大纲,见“课程大纲”底部新增内容。
     这里需要提前特别提醒的是,新手如何看待Spark 1.x和Spark 2.x的关系,以及学习的建议。大家千万不要以为Spark 2.x完全颠覆了Spark 1.x,因此Spark 1.x的东西不用学了,那是完全错误的想法!事实恰恰相反,实际上Spark 2.x与Spark 1.x一脉相承,2.x完全是在1.x的基础上进行了功能的完善,底层引擎的优化,以及新的功能模块的增加。spark官方也发出了声明,spark 1.x的所有东西在未来都完全是有其价值和意义的,绝对不是被淘汰!
      因此对于新人来说,课程里讲解的Spark 1.x,不仅完全没有过时,而且在目前以及未来都是绝对有用的!实际上Spark 1.x只有极其少数的一些东西是被标记为淘汰的!因此,新人必须从本课程讲解的Spark 1.x开始,一点一点学习,循序渐进,千万不能急于求成!而且Spark 2.0还很不稳定,因此本次升级讲解的内容,主要是希望大家能够跟上技术的发展潮流,站在技术发展的前沿,而不是让大家马上学了spark 2.0后就开始投入生产环境使用!具体的分析,在课程里都有讲解,希望大家踏踏实实地学习。


互联网IT网校

分销商品总数

30

渠道商数

20

大数据、web、JAVA、python...
推荐课程

MADP管理会计

推荐 · ¥6980.00

MADP管理会计定向委培班

推荐 · ¥12800.00

开心学英语--英语其实很简单

推荐 · ¥99.00

机器学习算法与案例实战

推荐 · ¥1299.00

会计实操做账(线上)

推荐 · ¥3380.00