Cloudera CDP 7.3.2 릴리스 정리 — 2032년까지 지원되는 LTS와 하이브리드 클라우드 지원
Cloudera Base on-premises 7.3.2 릴리스의 주요 변화 — Lakehouse Optimizer, Data Sharing, Cloud Bursting, Iceberg v2, JDK 17, IPv6 지원과 컴포넌트별 업데이트
2026년 3월 GA 된 Cloudera Base on-premises 7.3.2 는 Cloudera 가 공식적으로 "지금까지 가장 오래 가는 LTS(Long-Term Support) 릴리스" 라고 발표한 버전입니다. 2032년까지 지원 이 보장되며, 7.3.1 의 단일 코드베이스 위에 Lakehouse 최적화, 외부 플랫폼과의 데이터 공유, 클라우드 버스팅 등 하이브리드 전략에 필요한 기능들이 더해졌습니다.
이 글에서는 7.3.2 의 핵심 변경 사항을 정리합니다. 출처는 Cloudera 공식 Base on-premises 7.3.2 announcement 입니다.
1. 한눈에 보는 7.3.2
| 항목 | 내용 |
|---|---|
| 릴리스 시점 | 2026년 3월 GA |
| 포지셔닝 | LTS (Long-Term Support), 2032년까지 지원 |
| 베이스 | 7.3.1 통합 코드베이스 위의 기능 강화 릴리스 |
| 기본 JDK | JDK 17 (JDK 8 · 11 지원 종료) |
| Cloudera Manager | 7.13.2 |
| 보안 | Critical/High CVE 90개 이상 해결, IPv6 클라이언트 지원 확대 |
| 핵심 컴포넌트 | Spark 3.5, Kafka 3.9, Hadoop 3.4, HBase 2.6.3, Zookeeper 3.8, Ranger 2.6, Atlas 2.4, Knox 2.1, Phoenix 5.2.1 |
한 줄 요약: **"레거시 7.1.x · 7.2.x · 7.3.1 사용자에게, 2032년까지 지원을 목표로 한 릴리스입니다.
2. 주요 하이라이트
Cloudera Lakehouse Optimizer
Iceberg 테이블을 자동으로 유지·최적화해 주는 신규 컴포넌트입니다.
- 쿼리 성능 최대 38배 향상
- 스토리지 비용 최대 36% 절감
- 컴팩션 · 스냅샷 만료 · 파일 정리 같은 Iceberg 유지보수 작업을 스마트 자동화
- 유연한 스케줄링 + Ranger 통합으로 권한 모델까지 일관성 유지
운영자가 직접 OPTIMIZE, EXPIRE SNAPSHOTS 를 짜고 cron 으로 돌리던 영역을 플랫폼 레벨에서 흡수했다고 보면 됩니다.
Cloudera Data Sharing
Iceberg 테이블을 Databricks, Snowflake 같은 외부 플랫폼과 데이터 복제 없이 공유합니다.
- 표준 Apache Iceberg REST Catalog API 기반
- 데이터 거버넌스(누가 무엇을 보는지) 와 데이터 중력성 (원본은 그대로) 을 유지
- 멀티 클라우드 · 멀티 엔진 환경에서의 "복사본 증식" 문제를 완화
Cloudera Cloud Bursting
"사설 데이터센터를 클라우드로 동적으로 확장"
- 온프레미스 클러스터를 베이스로 두고, 워크로드 피크 시 클라우드 리소스를 동적으로 추가
- 데이터 중복 없이 온디맨드 탄력성 확보
- 하이브리드 환경의 운영 분절(fragmentation) 문제를 줄이는 방향
Cloudera Object Store (Apache Ozone)
- 메타데이터 처리 메커니즘 강화
- 클러스터 조정 효율 개선
- 진단 도구 강화로 클러스터 헬스 가시성 확대
보안 & 인프라
- 90개 이상의 Critical/High CVE 해결
- IPv6 클라이언트 지원: Hue(Data Explorer), Kafka, Phoenix, Kudu, Hive, ZooKeeper, HBase, Impala
- 최신 오픈소스 컴포넌트로의 rebase 통합
- AI 워크로드를 위한 보안 기반 강화
3. 컴포넌트별 상세 변경
Apache Iceberg
- Iceberg v2 기능 확대
- Branching / Tagging 신규 지원
- Snapshot Expiration 으로 스토리지 관리
- Copy on Write 지원
- Iceberg REST Catalog API 가 Hive Metastore(HMS) 와 연동
Apache Impala
- 중간 결과(intermediate result) 캐싱에 암호화 적용
- Lazy Materialization 으로 Parquet 스캔 가속화
- 계층적(hierarchical) 이벤트 처리 로 카탈로그 품질 개선
- OpenTelemetry 통합 — 관찰성 강화
- Query Profile 에 Iceberg 진단 메트릭 추가
- AES 암복호화 함수 지원
- 온프레미스 S3 호환 객체 스토리지 에 대한 인증 지원
- ARM 기반 프로세서 지원
Apache Hive
- Iceberg v2 작업 대거 보강:
- Branching / Tagging
- Snapshot expiration
TRUNCATE PARTITIONINSERT INTO/INSERT OVERWRITE PARTITIONDROP PARTITION- Compaction 동작 개선
- CBO 가 CTE(공통 테이블 표현식) 성능을 끌어올리도록 개선
- ARM 아키텍처 호스트에서 실행 가능
- OpenTelemetry 통합으로 관찰성 개선
Apache Kudu
- ARM 프로세서 지원
- 새로운 Array 데이터 타입
- Flink 기반 실시간 복제 도구
- Python 통합 간소화
- 설정 개선으로 클러스터 밀도(density) 향상
- 메모리 추적 개선으로 OOM 에러 감소
Apache Atlas
- ReactJS 기반 UI 로 전면 교체 (기존 BackboneJS)
- 더 단순하고 안정적인 UX
- 기술 프리뷰: 삭제된 엔티티의 자동 정리(auto-purge) 로 메타데이터 성능 개선
Apache Ranger
- Ranger RAZ 가 S3A 호환 객체 스토리지 지원 (온프레미스 ID Broker 경유)
- 온프레미스 · 클라우드를 가로지르는 일관된 fine-grained 보안
Apache Phoenix
- High Availability(HA) 설정 지원
Apache Solr
- ARM 아키텍처 지원 (Data Hub)
- HBase Indexer 2.6.3 로 업데이트
컴포넌트 버전 매트릭스
| 컴포넌트 | 7.3.2 버전 |
|---|---|
| Hadoop | 3.4 |
| Spark | 3.5 |
| Kafka | 3.9 |
| HBase | 2.6.3 |
| Zookeeper | 3.8 |
| Ranger | 2.6 |
| Atlas | 2.4 |
| Knox | 2.1 |
| Phoenix | 5.2.1 |
| Cloudera Manager | 7.13.2 |
4. Replication Manager 강화
하이브리드 데이터 거버넌스 관점에서 묶음으로 살펴볼 만한 변경입니다.
- Iceberg 복제 — AWS 리전 간 지원
- Ozone 복제 — 온프레미스 객체 스토리지 복제
- Atlas 복제 — Hive 외부 테이블, Iceberg 메타데이터
- Ranger 복제 — 온프레미스 ↔ 클라우드 정책 일관성
- FIPS 140-2 준수 강화
5. 업그레이드 경로
직접 in-place 업그레이드 지원 버전
다음 버전들은 7.3.2 로 원스텝 직접 업그레이드 가능합니다:
- 7.1.7 SP3
- 7.1.9 SP1
- 7.3.1
- 7.2.18
현재 버전별 권장
| 현재 버전 | 권장 강도 | 이유 |
|---|---|---|
| 7.1.7 (EOS) | 🔴 긴급 | 이미 EOS. 7.3.2 로 가면 즉시 "safe harbor" 복귀 — 지원/컴플라이언스 복원 |
| 7.1.9 (LTS ~2028) | 🟡 권장 | 모던 워크로드 · AI 대비를 위한 성능 · 보안 업그레이드 |
| 7.3.1 (STS, 2026 내 EOS 예정) | 🟠 높음 | 올해 안에 지원 종료 예정 — 가능한 한 빨리 이동 |
| 7.2.18 (Cloud) | 🟡 권장 | 더 나은 성능, 낮은 TCO, 월별 신용 비용 절감 효과 |
6. 환경 호환성 — 끊김(Discontinued)
7.3.2 / Cloudera Manager 7.13.2 에서 더 이상 지원되지 않는 환경입니다. 업그레이드 전에 반드시 점검하세요.
데이터베이스
- PostgreSQL 13
- Oracle 19c (19c RAC 포함)
운영체제
- SLES 15 SP4
- Ubuntu 20.04
Python
- 3.8 / 3.9 / 3.10 — 3.11 만 지원
JDK
- JDK 8 / JDK 11 (Azul · OpenJDK · Oracle 배포판 모두) — JDK 17 만 지원
7. 새로 지원되는 환경
운영체제
- RHEL 9.6
- Rocky Linux 9.6
- Ubuntu 24.04
- SLES 15 SP6
데이터베이스
- MariaDB 11.4
8. Cloudera Data Services 와의 호환성 (주의)
같은 클러스터에서 Cloudera AI 를 포함한 Cloudera Data Services 1.5.5 (또는 1.5.5 SP1 / 1.5.5 SP2) 를 운영 중이라면, Cloudera Base on-premises 7.3.2 로의 설치 · 업그레이드를 진행하지 마세요.
호환되는 조합은 다음과 같습니다.
- Cloudera Data Services on-premises 1.5.5 SP1 (단, Cloudera AI 제외)
- Cloudera Data Services on-premises 1.5.5 SP2 (단, Cloudera AI 제외)
업그레이드 일정과 Data Services 의 버전 매트릭스를 함께 검토하는 것이 안전합니다.
9. 추가로 눈여겨볼 변화
Cloudera Data Explorer
- 기존 Hue 의 리브랜딩. UI 개선과 기능 확장의 첫 단계로 포지셔닝됩니다.
자동화된 데이터 라이프사이클 관리 (Ozone, 기술 프리뷰)
- 3-way 복제 블록을 Erasure Coding 으로 자동 전환
- 물리 스토리지 사용량 최대 50% 절감 효과 기대
10. 어떤 조직이 지금 7.3.2 로 가야 할까
가장 큰 가치를 보는 케이스는 다음과 같습니다.
- 7.1.7 / 7.1.9 / 7.3.1 / 7.2.18 에 머물러 있는 조직 — 직접 in-place 업그레이드 경로가 열려 있는 지금이 비용·리스크 최저점
- 하이브리드 클라우드 전략 을 본격화하려는 조직 — Cloud Bursting · Data Sharing · Replication Manager 가 한 번에 들어옴
- Iceberg 운영 비용 을 낮추고 싶은 조직 — Lakehouse Optimizer 가 가장 큰 ROI 포인트
- 레거시 OS / JDK 8·11 에 묶여 있는 조직 — JDK 17, 최신 RHEL/Ubuntu/SLES 스택으로의 이전 트리거가 됨
반대로 Cloudera AI 를 포함한 Data Services 1.5.5 계열을 운영 중이라면, 7.3.2 도입 전 호환 매트릭스 점검이 선행되어야 합니다.
정리
Cloudera Base on-premises 7.3.2 는 단순한 마이너 버전이 아니라, 2032년까지 끌고 갈 수 있는 LTS 종착지 로 설계된 릴리스입니다.
- Lakehouse Optimizer · Data Sharing · Cloud Bursting — 하이브리드 데이터 플랫폼의 3대 축
- Iceberg v2 강화 · OpenTelemetry · ARM 지원 — 모던 데이터/AI 워크로드 대응
- JDK 17 표준화 · IPv6 · 90+ CVE 해결 — 보안·인프라 현대화
- 명확한 업그레이드 경로 — 7.1.7 SP3 / 7.1.9 SP1 / 7.3.1 / 7.2.18 에서 한 번에 진입 가능
자세한 원문은 Cloudera 공식 문서 Base on-premises 7.3.2 announcement 에서 확인할 수 있습니다.