Blog
clouderacdplakehouseiceberghybrid-cloud

Cloudera CDP 7.3.2 릴리스 정리 — 2032년까지 지원되는 LTS와 하이브리드 클라우드 지원

Cloudera Base on-premises 7.3.2 릴리스의 주요 변화 — Lakehouse Optimizer, Data Sharing, Cloud Bursting, Iceberg v2, JDK 17, IPv6 지원과 컴포넌트별 업데이트

Data Dynamics2026년 5월 20일12 min read

2026년 3월 GA 된 Cloudera Base on-premises 7.3.2 는 Cloudera 가 공식적으로 "지금까지 가장 오래 가는 LTS(Long-Term Support) 릴리스" 라고 발표한 버전입니다. 2032년까지 지원 이 보장되며, 7.3.1 의 단일 코드베이스 위에 Lakehouse 최적화, 외부 플랫폼과의 데이터 공유, 클라우드 버스팅 등 하이브리드 전략에 필요한 기능들이 더해졌습니다.

이 글에서는 7.3.2 의 핵심 변경 사항을 정리합니다. 출처는 Cloudera 공식 Base on-premises 7.3.2 announcement 입니다.


1. 한눈에 보는 7.3.2

항목내용
릴리스 시점2026년 3월 GA
포지셔닝LTS (Long-Term Support), 2032년까지 지원
베이스7.3.1 통합 코드베이스 위의 기능 강화 릴리스
기본 JDKJDK 17 (JDK 8 · 11 지원 종료)
Cloudera Manager7.13.2
보안Critical/High CVE 90개 이상 해결, IPv6 클라이언트 지원 확대
핵심 컴포넌트Spark 3.5, Kafka 3.9, Hadoop 3.4, HBase 2.6.3, Zookeeper 3.8, Ranger 2.6, Atlas 2.4, Knox 2.1, Phoenix 5.2.1

한 줄 요약: **"레거시 7.1.x · 7.2.x · 7.3.1 사용자에게, 2032년까지 지원을 목표로 한 릴리스입니다.


2. 주요 하이라이트

Cloudera Lakehouse Optimizer

Iceberg 테이블을 자동으로 유지·최적화해 주는 신규 컴포넌트입니다.

  • 쿼리 성능 최대 38배 향상
  • 스토리지 비용 최대 36% 절감
  • 컴팩션 · 스냅샷 만료 · 파일 정리 같은 Iceberg 유지보수 작업을 스마트 자동화
  • 유연한 스케줄링 + Ranger 통합으로 권한 모델까지 일관성 유지

운영자가 직접 OPTIMIZE, EXPIRE SNAPSHOTS 를 짜고 cron 으로 돌리던 영역을 플랫폼 레벨에서 흡수했다고 보면 됩니다.

Cloudera Data Sharing

Iceberg 테이블을 Databricks, Snowflake 같은 외부 플랫폼과 데이터 복제 없이 공유합니다.

  • 표준 Apache Iceberg REST Catalog API 기반
  • 데이터 거버넌스(누가 무엇을 보는지) 와 데이터 중력성 (원본은 그대로) 을 유지
  • 멀티 클라우드 · 멀티 엔진 환경에서의 "복사본 증식" 문제를 완화

Cloudera Cloud Bursting

"사설 데이터센터를 클라우드로 동적으로 확장"

  • 온프레미스 클러스터를 베이스로 두고, 워크로드 피크 시 클라우드 리소스를 동적으로 추가
  • 데이터 중복 없이 온디맨드 탄력성 확보
  • 하이브리드 환경의 운영 분절(fragmentation) 문제를 줄이는 방향

Cloudera Object Store (Apache Ozone)

  • 메타데이터 처리 메커니즘 강화
  • 클러스터 조정 효율 개선
  • 진단 도구 강화로 클러스터 헬스 가시성 확대

보안 & 인프라

  • 90개 이상의 Critical/High CVE 해결
  • IPv6 클라이언트 지원: Hue(Data Explorer), Kafka, Phoenix, Kudu, Hive, ZooKeeper, HBase, Impala
  • 최신 오픈소스 컴포넌트로의 rebase 통합
  • AI 워크로드를 위한 보안 기반 강화

3. 컴포넌트별 상세 변경

Apache Iceberg

  • Iceberg v2 기능 확대
  • Branching / Tagging 신규 지원
  • Snapshot Expiration 으로 스토리지 관리
  • Copy on Write 지원
  • Iceberg REST Catalog APIHive Metastore(HMS) 와 연동

Apache Impala

  • 중간 결과(intermediate result) 캐싱에 암호화 적용
  • Lazy Materialization 으로 Parquet 스캔 가속화
  • 계층적(hierarchical) 이벤트 처리 로 카탈로그 품질 개선
  • OpenTelemetry 통합 — 관찰성 강화
  • Query Profile 에 Iceberg 진단 메트릭 추가
  • AES 암복호화 함수 지원
  • 온프레미스 S3 호환 객체 스토리지 에 대한 인증 지원
  • ARM 기반 프로세서 지원

Apache Hive

  • Iceberg v2 작업 대거 보강:
    • Branching / Tagging
    • Snapshot expiration
    • TRUNCATE PARTITION
    • INSERT INTO / INSERT OVERWRITE PARTITION
    • DROP PARTITION
    • Compaction 동작 개선
  • CBO 가 CTE(공통 테이블 표현식) 성능을 끌어올리도록 개선
  • ARM 아키텍처 호스트에서 실행 가능
  • OpenTelemetry 통합으로 관찰성 개선

Apache Kudu

  • ARM 프로세서 지원
  • 새로운 Array 데이터 타입
  • Flink 기반 실시간 복제 도구
  • Python 통합 간소화
  • 설정 개선으로 클러스터 밀도(density) 향상
  • 메모리 추적 개선으로 OOM 에러 감소

Apache Atlas

  • ReactJS 기반 UI 로 전면 교체 (기존 BackboneJS)
  • 더 단순하고 안정적인 UX
  • 기술 프리뷰: 삭제된 엔티티의 자동 정리(auto-purge) 로 메타데이터 성능 개선

Apache Ranger

  • Ranger RAZS3A 호환 객체 스토리지 지원 (온프레미스 ID Broker 경유)
  • 온프레미스 · 클라우드를 가로지르는 일관된 fine-grained 보안

Apache Phoenix

  • High Availability(HA) 설정 지원

Apache Solr

  • ARM 아키텍처 지원 (Data Hub)
  • HBase Indexer 2.6.3 로 업데이트

컴포넌트 버전 매트릭스

컴포넌트7.3.2 버전
Hadoop3.4
Spark3.5
Kafka3.9
HBase2.6.3
Zookeeper3.8
Ranger2.6
Atlas2.4
Knox2.1
Phoenix5.2.1
Cloudera Manager7.13.2

4. Replication Manager 강화

하이브리드 데이터 거버넌스 관점에서 묶음으로 살펴볼 만한 변경입니다.

  • Iceberg 복제 — AWS 리전 간 지원
  • Ozone 복제 — 온프레미스 객체 스토리지 복제
  • Atlas 복제 — Hive 외부 테이블, Iceberg 메타데이터
  • Ranger 복제 — 온프레미스 ↔ 클라우드 정책 일관성
  • FIPS 140-2 준수 강화

5. 업그레이드 경로

직접 in-place 업그레이드 지원 버전

다음 버전들은 7.3.2 로 원스텝 직접 업그레이드 가능합니다:

  • 7.1.7 SP3
  • 7.1.9 SP1
  • 7.3.1
  • 7.2.18

현재 버전별 권장

현재 버전권장 강도이유
7.1.7 (EOS)🔴 긴급이미 EOS. 7.3.2 로 가면 즉시 "safe harbor" 복귀 — 지원/컴플라이언스 복원
7.1.9 (LTS ~2028)🟡 권장모던 워크로드 · AI 대비를 위한 성능 · 보안 업그레이드
7.3.1 (STS, 2026 내 EOS 예정)🟠 높음올해 안에 지원 종료 예정 — 가능한 한 빨리 이동
7.2.18 (Cloud)🟡 권장더 나은 성능, 낮은 TCO, 월별 신용 비용 절감 효과

6. 환경 호환성 — 끊김(Discontinued)

7.3.2 / Cloudera Manager 7.13.2 에서 더 이상 지원되지 않는 환경입니다. 업그레이드 전에 반드시 점검하세요.

데이터베이스

  • PostgreSQL 13
  • Oracle 19c (19c RAC 포함)

운영체제

  • SLES 15 SP4
  • Ubuntu 20.04

Python

  • 3.8 / 3.9 / 3.103.11 만 지원

JDK

  • JDK 8 / JDK 11 (Azul · OpenJDK · Oracle 배포판 모두) — JDK 17 만 지원

7. 새로 지원되는 환경

운영체제

  • RHEL 9.6
  • Rocky Linux 9.6
  • Ubuntu 24.04
  • SLES 15 SP6

데이터베이스

  • MariaDB 11.4

8. Cloudera Data Services 와의 호환성 (주의)

같은 클러스터에서 Cloudera AI 를 포함한 Cloudera Data Services 1.5.5 (또는 1.5.5 SP1 / 1.5.5 SP2) 를 운영 중이라면, Cloudera Base on-premises 7.3.2 로의 설치 · 업그레이드를 진행하지 마세요.

호환되는 조합은 다음과 같습니다.

  • Cloudera Data Services on-premises 1.5.5 SP1 (단, Cloudera AI 제외)
  • Cloudera Data Services on-premises 1.5.5 SP2 (단, Cloudera AI 제외)

업그레이드 일정과 Data Services 의 버전 매트릭스를 함께 검토하는 것이 안전합니다.


9. 추가로 눈여겨볼 변화

Cloudera Data Explorer

  • 기존 Hue 의 리브랜딩. UI 개선과 기능 확장의 첫 단계로 포지셔닝됩니다.

자동화된 데이터 라이프사이클 관리 (Ozone, 기술 프리뷰)

  • 3-way 복제 블록을 Erasure Coding 으로 자동 전환
  • 물리 스토리지 사용량 최대 50% 절감 효과 기대

10. 어떤 조직이 지금 7.3.2 로 가야 할까

가장 큰 가치를 보는 케이스는 다음과 같습니다.

  • 7.1.7 / 7.1.9 / 7.3.1 / 7.2.18 에 머물러 있는 조직 — 직접 in-place 업그레이드 경로가 열려 있는 지금이 비용·리스크 최저점
  • 하이브리드 클라우드 전략 을 본격화하려는 조직 — Cloud Bursting · Data Sharing · Replication Manager 가 한 번에 들어옴
  • Iceberg 운영 비용 을 낮추고 싶은 조직 — Lakehouse Optimizer 가 가장 큰 ROI 포인트
  • 레거시 OS / JDK 8·11 에 묶여 있는 조직 — JDK 17, 최신 RHEL/Ubuntu/SLES 스택으로의 이전 트리거가 됨

반대로 Cloudera AI 를 포함한 Data Services 1.5.5 계열을 운영 중이라면, 7.3.2 도입 전 호환 매트릭스 점검이 선행되어야 합니다.


정리

Cloudera Base on-premises 7.3.2 는 단순한 마이너 버전이 아니라, 2032년까지 끌고 갈 수 있는 LTS 종착지 로 설계된 릴리스입니다.

  • Lakehouse Optimizer · Data Sharing · Cloud Bursting — 하이브리드 데이터 플랫폼의 3대 축
  • Iceberg v2 강화 · OpenTelemetry · ARM 지원 — 모던 데이터/AI 워크로드 대응
  • JDK 17 표준화 · IPv6 · 90+ CVE 해결 — 보안·인프라 현대화
  • 명확한 업그레이드 경로 — 7.1.7 SP3 / 7.1.9 SP1 / 7.3.1 / 7.2.18 에서 한 번에 진입 가능

자세한 원문은 Cloudera 공식 문서 Base on-premises 7.3.2 announcement 에서 확인할 수 있습니다.