Blog
clouderacdplakehouseiceberghybrid-cloud

Cloudera CDP 7.3.2 릴리스 정리 — 2032년까지 지원되는 LTS와 하이브리드 클라우드 지원

Cloudera Base on-premises 7.3.2 릴리스의 주요 변화 — Lakehouse Optimizer, Data Sharing, Cloud Bursting, Iceberg v2, JDK 17, IPv6 지원과 컴포넌트별 업데이트

Data Dynamics2026年5月20日12 min read
This post is not yet translated. The original Korean version is shown below.

2026년 3월 GA 된 Cloudera Base on-premises 7.3.2 는 Cloudera 가 공식적으로 "지금까지 가장 오래 가는 LTS(Long-Term Support) 릴리스" 라고 발표한 버전입니다. 2032년까지 지원 이 보장되며, 7.3.1 의 단일 코드베이스 위에 Lakehouse 최적화, 외부 플랫폼과의 데이터 공유, 클라우드 버스팅 등 하이브리드 전략에 필요한 기능들이 더해졌습니다.

이 글에서는 7.3.2 의 핵심 변경 사항을 정리합니다. 출처는 Cloudera 공식 Base on-premises 7.3.2 announcement 입니다.


1. 한눈에 보는 7.3.2

항목내용
릴리스 시점2026년 3월 GA
포지셔닝LTS (Long-Term Support), 2032년까지 지원
베이스7.3.1 통합 코드베이스 위의 기능 강화 릴리스
기본 JDKJDK 17 (JDK 8 · 11 지원 종료)
Cloudera Manager7.13.2
보안Critical/High CVE 90개 이상 해결, IPv6 클라이언트 지원 확대
핵심 컴포넌트Spark 3.5, Kafka 3.9, Hadoop 3.4, HBase 2.6.3, Zookeeper 3.8, Ranger 2.6, Atlas 2.4, Knox 2.1, Phoenix 5.2.1

한 줄 요약: **"레거시 7.1.x · 7.2.x · 7.3.1 사용자에게, 2032년까지 지원을 목표로 한 릴리스입니다.


2. 주요 하이라이트

Cloudera Lakehouse Optimizer

Iceberg 테이블을 자동으로 유지·최적화해 주는 신규 컴포넌트입니다.

  • 쿼리 성능 최대 38배 향상
  • 스토리지 비용 최대 36% 절감
  • 컴팩션 · 스냅샷 만료 · 파일 정리 같은 Iceberg 유지보수 작업을 스마트 자동화
  • 유연한 스케줄링 + Ranger 통합으로 권한 모델까지 일관성 유지

운영자가 직접 OPTIMIZE, EXPIRE SNAPSHOTS 를 짜고 cron 으로 돌리던 영역을 플랫폼 레벨에서 흡수했다고 보면 됩니다.

Cloudera Data Sharing

Iceberg 테이블을 Databricks, Snowflake 같은 외부 플랫폼과 데이터 복제 없이 공유합니다.

  • 표준 Apache Iceberg REST Catalog API 기반
  • 데이터 거버넌스(누가 무엇을 보는지) 와 데이터 중력성 (원본은 그대로) 을 유지
  • 멀티 클라우드 · 멀티 엔진 환경에서의 "복사본 증식" 문제를 완화

Cloudera Cloud Bursting

"사설 데이터센터를 클라우드로 동적으로 확장"

  • 온프레미스 클러스터를 베이스로 두고, 워크로드 피크 시 클라우드 리소스를 동적으로 추가
  • 데이터 중복 없이 온디맨드 탄력성 확보
  • 하이브리드 환경의 운영 분절(fragmentation) 문제를 줄이는 방향

Cloudera Object Store (Apache Ozone)

  • 메타데이터 처리 메커니즘 강화
  • 클러스터 조정 효율 개선
  • 진단 도구 강화로 클러스터 헬스 가시성 확대

보안 & 인프라

  • 90개 이상의 Critical/High CVE 해결
  • IPv6 클라이언트 지원: Hue(Data Explorer), Kafka, Phoenix, Kudu, Hive, ZooKeeper, HBase, Impala
  • 최신 오픈소스 컴포넌트로의 rebase 통합
  • AI 워크로드를 위한 보안 기반 강화

3. 컴포넌트별 상세 변경

Apache Iceberg

  • Iceberg v2 기능 확대
  • Branching / Tagging 신규 지원
  • Snapshot Expiration 으로 스토리지 관리
  • Copy on Write 지원
  • Iceberg REST Catalog APIHive Metastore(HMS) 와 연동

Apache Impala

  • 중간 결과(intermediate result) 캐싱에 암호화 적용
  • Lazy Materialization 으로 Parquet 스캔 가속화
  • 계층적(hierarchical) 이벤트 처리 로 카탈로그 품질 개선
  • OpenTelemetry 통합 — 관찰성 강화
  • Query Profile 에 Iceberg 진단 메트릭 추가
  • AES 암복호화 함수 지원
  • 온프레미스 S3 호환 객체 스토리지 에 대한 인증 지원
  • ARM 기반 프로세서 지원

Apache Hive

  • Iceberg v2 작업 대거 보강:
    • Branching / Tagging
    • Snapshot expiration
    • TRUNCATE PARTITION
    • INSERT INTO / INSERT OVERWRITE PARTITION
    • DROP PARTITION
    • Compaction 동작 개선
  • CBO 가 CTE(공통 테이블 표현식) 성능을 끌어올리도록 개선
  • ARM 아키텍처 호스트에서 실행 가능
  • OpenTelemetry 통합으로 관찰성 개선

Apache Kudu

  • ARM 프로세서 지원
  • 새로운 Array 데이터 타입
  • Flink 기반 실시간 복제 도구
  • Python 통합 간소화
  • 설정 개선으로 클러스터 밀도(density) 향상
  • 메모리 추적 개선으로 OOM 에러 감소

Apache Atlas

  • ReactJS 기반 UI 로 전면 교체 (기존 BackboneJS)
  • 더 단순하고 안정적인 UX
  • 기술 프리뷰: 삭제된 엔티티의 자동 정리(auto-purge) 로 메타데이터 성능 개선

Apache Ranger

  • Ranger RAZS3A 호환 객체 스토리지 지원 (온프레미스 ID Broker 경유)
  • 온프레미스 · 클라우드를 가로지르는 일관된 fine-grained 보안

Apache Phoenix

  • High Availability(HA) 설정 지원

Apache Solr

  • ARM 아키텍처 지원 (Data Hub)
  • HBase Indexer 2.6.3 로 업데이트

컴포넌트 버전 매트릭스

컴포넌트7.3.2 버전
Hadoop3.4
Spark3.5
Kafka3.9
HBase2.6.3
Zookeeper3.8
Ranger2.6
Atlas2.4
Knox2.1
Phoenix5.2.1
Cloudera Manager7.13.2

4. Replication Manager 강화

하이브리드 데이터 거버넌스 관점에서 묶음으로 살펴볼 만한 변경입니다.

  • Iceberg 복제 — AWS 리전 간 지원
  • Ozone 복제 — 온프레미스 객체 스토리지 복제
  • Atlas 복제 — Hive 외부 테이블, Iceberg 메타데이터
  • Ranger 복제 — 온프레미스 ↔ 클라우드 정책 일관성
  • FIPS 140-2 준수 강화

5. 업그레이드 경로

직접 in-place 업그레이드 지원 버전

다음 버전들은 7.3.2 로 원스텝 직접 업그레이드 가능합니다:

  • 7.1.7 SP3
  • 7.1.9 SP1
  • 7.3.1
  • 7.2.18

현재 버전별 권장

현재 버전권장 강도이유
7.1.7 (EOS)🔴 긴급이미 EOS. 7.3.2 로 가면 즉시 "safe harbor" 복귀 — 지원/컴플라이언스 복원
7.1.9 (LTS ~2028)🟡 권장모던 워크로드 · AI 대비를 위한 성능 · 보안 업그레이드
7.3.1 (STS, 2026 내 EOS 예정)🟠 높음올해 안에 지원 종료 예정 — 가능한 한 빨리 이동
7.2.18 (Cloud)🟡 권장더 나은 성능, 낮은 TCO, 월별 신용 비용 절감 효과

6. 환경 호환성 — 끊김(Discontinued)

7.3.2 / Cloudera Manager 7.13.2 에서 더 이상 지원되지 않는 환경입니다. 업그레이드 전에 반드시 점검하세요.

데이터베이스

  • PostgreSQL 13
  • Oracle 19c (19c RAC 포함)

운영체제

  • SLES 15 SP4
  • Ubuntu 20.04

Python

  • 3.8 / 3.9 / 3.103.11 만 지원

JDK

  • JDK 8 / JDK 11 (Azul · OpenJDK · Oracle 배포판 모두) — JDK 17 만 지원

7. 새로 지원되는 환경

운영체제

  • RHEL 9.6
  • Rocky Linux 9.6
  • Ubuntu 24.04
  • SLES 15 SP6

데이터베이스

  • MariaDB 11.4

8. Cloudera Data Services 와의 호환성 (주의)

같은 클러스터에서 Cloudera AI 를 포함한 Cloudera Data Services 1.5.5 (또는 1.5.5 SP1 / 1.5.5 SP2) 를 운영 중이라면, Cloudera Base on-premises 7.3.2 로의 설치 · 업그레이드를 진행하지 마세요.

호환되는 조합은 다음과 같습니다.

  • Cloudera Data Services on-premises 1.5.5 SP1 (단, Cloudera AI 제외)
  • Cloudera Data Services on-premises 1.5.5 SP2 (단, Cloudera AI 제외)

업그레이드 일정과 Data Services 의 버전 매트릭스를 함께 검토하는 것이 안전합니다.


9. 추가로 눈여겨볼 변화

Cloudera Data Explorer

  • 기존 Hue 의 리브랜딩. UI 개선과 기능 확장의 첫 단계로 포지셔닝됩니다.

자동화된 데이터 라이프사이클 관리 (Ozone, 기술 프리뷰)

  • 3-way 복제 블록을 Erasure Coding 으로 자동 전환
  • 물리 스토리지 사용량 최대 50% 절감 효과 기대

10. 어떤 조직이 지금 7.3.2 로 가야 할까

가장 큰 가치를 보는 케이스는 다음과 같습니다.

  • 7.1.7 / 7.1.9 / 7.3.1 / 7.2.18 에 머물러 있는 조직 — 직접 in-place 업그레이드 경로가 열려 있는 지금이 비용·리스크 최저점
  • 하이브리드 클라우드 전략 을 본격화하려는 조직 — Cloud Bursting · Data Sharing · Replication Manager 가 한 번에 들어옴
  • Iceberg 운영 비용 을 낮추고 싶은 조직 — Lakehouse Optimizer 가 가장 큰 ROI 포인트
  • 레거시 OS / JDK 8·11 에 묶여 있는 조직 — JDK 17, 최신 RHEL/Ubuntu/SLES 스택으로의 이전 트리거가 됨

반대로 Cloudera AI 를 포함한 Data Services 1.5.5 계열을 운영 중이라면, 7.3.2 도입 전 호환 매트릭스 점검이 선행되어야 합니다.


정리

Cloudera Base on-premises 7.3.2 는 단순한 마이너 버전이 아니라, 2032년까지 끌고 갈 수 있는 LTS 종착지 로 설계된 릴리스입니다.

  • Lakehouse Optimizer · Data Sharing · Cloud Bursting — 하이브리드 데이터 플랫폼의 3대 축
  • Iceberg v2 강화 · OpenTelemetry · ARM 지원 — 모던 데이터/AI 워크로드 대응
  • JDK 17 표준화 · IPv6 · 90+ CVE 해결 — 보안·인프라 현대화
  • 명확한 업그레이드 경로 — 7.1.7 SP3 / 7.1.9 SP1 / 7.3.1 / 7.2.18 에서 한 번에 진입 가능

자세한 원문은 Cloudera 공식 문서 Base on-premises 7.3.2 announcement 에서 확인할 수 있습니다.