이동준1
아웃풋 공부
이동준1
전체 방문자
오늘
어제
  • 분류 전체보기 (84)
    • airflow (8)
    • sql (23)
    • aws (12)
    • python (3)
    • 네트워크 (12)
    • 알고리즘 (2)
    • 짧은서평 (24)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • Network
  • 고통의 비밀
  • 유연함의힘
  • regexp
  • AWS
  • 네트워크
  • 서평
  • 퓨처셀프
  • 고통의비밀

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
이동준1
airflow

[airflow] why airflow?

[airflow] why airflow?
airflow

[airflow] why airflow?

2023. 9. 17. 21:21

데이터는 일반적으로 추출(Extract), 적재(Load), 그리고 가공(Transfrom)하는 과정을 거쳐 최종적으로 사용된다. 이 데이터 흐름은 항상 원활하게 이루어지지는 않은데, 각 단계에서 오류가 발생할수 있기 때문이다.

 

예를들어, 데이터를 추출하기 위해 필요한 API가 갑자기 작동하지 않을 수 있고, 데이터를 적재하는 snowflake에서 오류가 발생할수 있고, 그리고 DBT를 이용해 데이터를 변환하는 과정에서 실수가 있었을 수도있다. 이렇게 각각의 단계에서 이슈가 발생할수 있고, 때문에 이런 것들을 관리할 도구가 필요하다. 이를 도와주는것이 airflow이다.

 

 

위와같은 데이터흐름이 하나만 존재한다면 airflow가 필요하지 않을지도 모르지만, 데이터 파이프라인이 늘어나면 늘어날수록 airflow같은 orchestrator 없이 각각의 파이프라인내의 step들의 오류를 하나씩 관리하는것은 엄청난 노동이 될것이다. airflow가 있다면 수백개의 데이터 파이프라인 수백만개의 작업들을 자동으로 관리할수 있다. 

 

'airflow' 카테고리의 다른 글

[airflow] hook  (0) 2024.01.10
[airflow] docker volume mount  (0) 2023.12.25
[airflow] Xcom  (0) 2023.12.12
[airflow] task 내 함수 선언  (1) 2023.12.10
[airflow] WSL  (0) 2023.12.03
    'airflow' 카테고리의 다른 글
    • [airflow] docker volume mount
    • [airflow] Xcom
    • [airflow] task 내 함수 선언
    • [airflow] WSL
    이동준1
    이동준1

    티스토리툴바

    개인정보

    • 티스토리 홈
    • 포럼
    • 로그인

    단축키

    내 블로그

    내 블로그 - 관리자 홈 전환
    Q
    Q
    새 글 쓰기
    W
    W

    블로그 게시글

    글 수정 (권한 있는 경우)
    E
    E
    댓글 영역으로 이동
    C
    C

    모든 영역

    이 페이지의 URL 복사
    S
    S
    맨 위로 이동
    T
    T
    티스토리 홈 이동
    H
    H
    단축키 안내
    Shift + /
    ⇧ + /

    * 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.