[보안뉴스 조재호 기자] 전 세계 인터넷 트래픽의 상당 부분을 처리하는 글로벌 웹 인프라 기업 클라우드플레어(Cloudflare)에서 대규모 서비스 장애가 발생해 주요 글로벌 IT 서비스가 줄줄이 마비되는 사태가 벌어졌다.
이번 서비스 장애는 한국 시간 기준 18일 오후 8시 30분경부터 클라우드플레어의 인프라를 사용하는 웹사이트와 애플리케이션에서 동시다발적인 접속 오류가 보고되기 시작했다.

▲Internal Server Error 500 에러 메시지 [자료: 보안뉴스]
사용자들은 서비스 접속 시 ‘Internal Server Error 500’ 메시지를 마주하거나, ‘잠시만 기다려 주십시오’(Just a moment...), ‘계속하려면 challenges.cloudflare.com 차단을 해제하십시오’와 같은 보안 검증 화면에서 무한 로딩이 걸리는 현상을 겪고 있다. 이는 클라우드플레어의 엣지 네트워크가 사용자의 요청을 정상적으로 처리하지 못할 때 발생하는 전형적인 증상이다.
이번 장애로 인한 피해 범위는 소셜 미디어부터 업무 툴, 게임에 이르기까지 광범위하다. 오픈AI(OpenAI)의 생성형 인공지능 ‘챗GPT’를 시작으로 소셜 미디어 X(옛 트위터), 협업 도구 ‘캔바’(Canva), 음원 서비스 ‘스포티파이’(Spotify) 등이 접속 불가 또는 기능 저하 현상을 겪고 있다. 게이머들의 피해도 잇따랐다. 인기 온라인 게임 ‘리그 오브 레전드’(LoL)와 ‘발로란트’(Valorant)에서도 로그인 불가 현상이 나타났으며, 음성 채팅 메신저 ‘디스코드’(Discord)도 메시지 전송 실패 등의 오류가 발생했다.
클라우드플레어 측은 장애 발생 직후 자사 시스템 상태 대시보드(Cloudflare Status)를 통해 “여러 고객에게 영향을 미치는 광범위한 500 오류와 대시보드 및 API 실패 문제를 인지하고 있다”며 “현재 조사가 진행 중이며 서비스 복구에 집중하고 있다”고 알렸다.
구체적인 원인은 아직 밝혀지지 않았으나, 일각에서는 이날 예정되어 있던 일부 데이터센터(산티아고, 마이애미, 로스앤젤레스 등)의 유지관 작업과의 연관성을 제기하고 있다.

▲ 이번 서비스 장애 관련 클라우드플레어의 서비스 공지 현황. [자료: 클라우드플레어]
클라우드플레어는 과거 2020년과 2022년에도 라우팅 설정 오류나 대역폭 업체의 실수, DDos 공격 등으로 인해 대규모 글로벌 접속 장애를 일으킨 바 있어, 단일 인프라 의존도에 대한 우려가 다시금 커지고 있다.
회사 측은 현재 일부 트래픽을 우회시키는 등 복구 작업을 진행 중이며, “서비스가 회복세를 보이고 있으나 여전히 평소보다 높은 에러율이 발생할 수 있다”고 밝혔다.
이번 서비스 마비 사태에 대해 한 네트워크 전문가는 “CDN 서비스의 대표주자인 CloudFlare에 의존도가 높은 서비스들이 얼마나 많은지 알 수 있는 장애로 서비스 효율을 위해 사용한 CDN인데, 한 업체의 장애가 인터넷 마비로 이어질 정도로 크리티컬한 문제를 일으켰다”며 “사이버 정전 사태를 대비해 의존성 분할을 위한 Akamai 등 서비스 이중화를 통한 안정성 확보가 시급해보인다”고 조언했다.
[조재호 기자(sw@boannews.com)]
<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>














