현재 다니고 있는 회사에서 빅데이터 플랫폼을 구축하는데에 Ambari라는 오픈소스를 사용할 때가 종종 있다.
대충 어떤 느낌인지는 알지만 이번 기회에 한 번 정리를 하고자 기록한다.
아래는 Apache-Ambari의 공식 문서에 나온, Ambari에 대한 간략한 설명이다.
A completely open source management platform for provisioning, managing, monitoring and securing Apache Hadoop clusters. Apache Ambari takes the guesswork out of operating Hadoop.
위의 설명에서 볼 수 있듯이, 간략하게 Ambari는 하둡 클러스터를 모니터링하고 관리할 수 있는 오픈소스 플렛폼이다. 그럼 이미 만들어진 하둡 클러스터를 관리하는 용도인가? 그것 뿐만 아니라 Ambari를 사용하여 직접 하둡 클러스터를 구성할 수 있다.
그렇다면 Ambari를 통해 초기에 하둡 클러스터를 구성하고, 그 이후에 유지 및 보수 또한 Ambari를 통해 할 수 있는 것이다. 물론 사전에 하둡 클러스터를 구성하기 위한 서버의 세팅 (각 서버 끼리의 통신 설정 등)이 필요할 것이다.
어디서 주워들은 게 있다. 하둡 클러스터를 사용할 때 Apache-Zookeeper를 사용한다고. 그렇다면 Ambari랑 Zookeeper의 차이점은 무엇일까.
| 차이점 | Apache Ambari | Apache Zookeeper |
| Basic Task | 하둡 클러스터의 모니터링, 프로비저닝, 관리 | 설정 정보 유지, 네이밍, 각 클러스터들의 동기화 |
| 본 사용 목적 | web interface | open source server |
| 상태 유지 | API를 통한 상태 유지 | znode를 통한 상태 유지 |
위 표에서 볼 수 있는 것처럼 Ambari를 사용한 하둡 클러스터 관리와 Zookeeper를 사용한 하둡 클러스터 관리의 목적 자체가 다른 것을 볼 수 있다. 간단하게 말하면 Ambari는 하둡 클러스터 구성 및 하둡 클러스터의 각 서버의 상태 모니터링을 제공하고 Zookeeper는 하둡 클러스터를 구성하는 각 서버의 상태를 동기화 기능을 제공한다.
Ref
- https://intellipaat.com/blog/what-is-apache-ambari/
What is Ambari - Introduction to Apache Ambari Architecture
What is Ambari – Get to know about its definition, Apache Ambari architecture, its installation process, how it is different from zookeeper, its unique features and usecases. Also find out different reasons to learn ambari, future trends and job opportun
intellipaat.com
'개발 > Big Data' 카테고리의 다른 글
| [Hadoop] #0 - 시작하기 앞서 (0) | 2022.12.26 |
|---|---|
| Apache Bigtop (0) | 2022.04.09 |
| Spark Datasource [4] - 세미나 준비 (0) | 2021.06.28 |
| Spark Datasource [3] - 세미나 준비 (0) | 2021.06.19 |
| Spark Datasource [2] - 세미나 준비 (0) | 2021.06.12 |