Data Engineering/Kafka

[Kafka] 카프카 개념

Zyung 2023. 7. 15. 21:23

사용하는 이유

  1. 높은 처리량으로 실시간 처리가 가능하다.
  2. 임의의 타이밍에 데이터 읽을 수 있다.
  3. 다양한 제품과 시스템에 쉽게 연동할 수 있다.
  4. 메시지를 잃지 않는다.

 

분산환경에서 데이터의 이동이 서비스나 모니터링, 데이터베이스 등 다양하게 이동하게 되는데 거기에 따른 많은 파이프라인 구축이 필요하게 된다.

이것을 한곳으로 모아서 데이터가 이동하게 해서 확장성과 안정성을 높이자!! ⇒ 카프카

 

 

💡 브로커가 있는 이유

  • 접속처를 하나로 할 수 있다.
  • 증감에 대응할 수 있다.