课程简介
本课程系统讲解大数据技术栈,从Hadoop基础到Spark高级应用,培养大数据工程师核心能力。
课程特色
- ✓ Hadoop生态体系全覆盖
- ✓ Spark大数据计算
- ✓ 实时数据处理Kafka
- ✓ 数据仓库Hive
- ✓ 企业级项目实战
课程大纲
- 第一阶段:Linux与Java基础(约30小时)
Linux系统 / Shell脚本 / Java基础 / Maven使用 - 第二阶段:Hadoop体系(约50小时)
HDFS分布式存储 / MapReduce计算 / YARN资源管理 / Hadoop集群 - 第三阶段:Spark技术(约60小时)
Spark Core / RDD编程 / DataFrame / SparkSQL / Spark MLlib - 第四阶段:数据仓库(约40小时)
Hive数据仓库 / HQL开发 / 数据清洗 / ETL流程 - 第五阶段:实时处理(约80小时)
Kafka消息队列 / Flink实时计算 / 用户画像 / 企业项目
讲师介绍
吴海峰 - 大数据技术专家
前BAT大数据工程师,10年大数据开发经验。精通Hadoop、Spark、Kafka等主流大数据技术,主导过多个PB级数据平台建设。