Data Engineering/Kafka
[Kafka] 카프카 개념
Zyung
2023. 7. 15. 21:23
사용하는 이유
- 높은 처리량으로 실시간 처리가 가능하다.
- 임의의 타이밍에 데이터 읽을 수 있다.
- 다양한 제품과 시스템에 쉽게 연동할 수 있다.
- 메시지를 잃지 않는다.
분산환경에서 데이터의 이동이 서비스나 모니터링, 데이터베이스 등 다양하게 이동하게 되는데 거기에 따른 많은 파이프라인 구축이 필요하게 된다.
이것을 한곳으로 모아서 데이터가 이동하게 해서 확장성과 안정성을 높이자!! ⇒ 카프카
💡 브로커가 있는 이유
- 접속처를 하나로 할 수 있다.
- 증감에 대응할 수 있다.