培训 · Cloudera 开源

Cloudera 培训

围绕 Cloudera Data Platform 的核心开源项目 —— Apache NiFi、Kafka、Impala 与 Kudu —— 提供实战型深度课程,满载工程师可立即落地的运维、开发与调优经验。

课程概览

对四个开源项目进行从架构到运维调优的端到端讲解,凝聚源自真实生产部署的最佳实践。

01
数据流管理的事实标准

Apache NiFi

面向企业数据接入、转换与投递的 Apache NiFi 完整课程,涵盖架构、DataFlow 设计、运维调优及 Processor 扩展。

Curriculum

19 topics
  • 01数据流水线架构
  • 02NiFi 的核心能力
  • 03NiFi 核心组件
  • 04NiFi 重要概念
  • 05NiFi Processor
  • 06FlowFile 结构
  • 07Relationship
  • 08Yield、Penalize、Rollback、Commit
  • 09调度 (Scheduling)
  • 10Process Group
  • 11Queue
  • 12Funnel
  • 13Data Provenance
  • 14Site-To-Site
  • 15Controller Service
  • 16NiFi Processor 的使用
  • 17NiFi Processor 的开发与扩展
  • 18NiFi 运维与优化
  • 19NiFi DataFlow 实战设计
02
分布式流处理平台

Apache Kafka

端到端讲解 Apache Kafka —— 从安装、内部机制到 Producer/Consumer 行为、镜像、运维及监控。

Curriculum

12 topics
  • 01Kafka 简介
  • 02Kafka 安装
  • 03Kafka 消息发送
  • 04Kafka 消息消费
  • 05Kafka 内部机制
  • 06Topic 与 Partition
  • 07消息投递
  • 08Kafka Connector
  • 09Kafka 镜像
  • 10Kafka 管理
  • 11Kafka 监控
  • 12Kafka 运维配置
03
高性能 MPP SQL 引擎

Apache Impala

涵盖 Impala 架构、安装需求、Iceberg 集成、Query Profile 分析、性能调优及安全配置。

Curriculum

16 topics
  • 01Impala 简介
  • 02Impala 架构
  • 03安装与配置要求
  • 04Impala 主要端口
  • 05Impala 数据类型
  • 06Impala 客户端访问
  • 07Impala Coordinator
  • 08Impala Catalog 与 StateStore
  • 09支持的文件格式与存储
  • 10Iceberg 集成
  • 11Impala Query Profile
  • 12Impala 系统监控
  • 13Admission Control
  • 14性能调优
  • 15Impala 安全
  • 16HBase 集成
04
快速分析型列式存储

Apache Kudu

学习 Kudu 的定位与架构、模式设计、Impala 集成、API 使用、安全及管理 CLI,并进行实战演练。

Curriculum

9 topics
  • 01Kudu 简介
  • 02Kudu 的定位
  • 03Kudu 架构
  • 04Kudu 模式设计
  • 05Impala 与 Kudu
  • 06Impala 与 Hive
  • 07Kudu API
  • 08Kudu 安全
  • 09Kudu 命令行
培训 · Cloudera 开源
联系我们