top of page

SD-WAN 모니터링, 이제 관점을 바꾸어야 할 때

기업들의 SD-WAN 사용이 늘면서 네트워크 운영팀이 제어할 수 없는 네트워크 서비스에 대한 의존도가 높아지고 있습니다. 이제 네트워크 운영은 인프라를 소유하고 있는지 여부와 상관없이, 네트워크의 성능을 끝까지 투명하게 볼 수 있는 엔드투엔드 가시성 확보가 중요 과제가 되었습니다. 2023년 EMA 설문조사에 따르면, 기업 중 63%가 인터넷을 주된 WAN 연결 방식으로 사용하고 있다고 답했습니다. 하지만 기존의 모니터링 방식은 애플리케이션이 데이터센터 밖에서 운영될 때 발생하는 성능 문제에 대해 충분한 통찰력을 제공하지 못합니다. 대부분 수동적인 트래픽 분석만을 제공하기 때문입니다. 이러한 상황에서 운영 팀이 네트워크를 사용하는 최종 사용자의 경험을 정확히 이해하고 개선할 수 있도록 활성 모니터링의 중요성이 더욱 부각됩니다.



능동 모니터링이란?

능동 모니터링은 테스트 트래픽이나 합성 트랜잭션을 이용해 네트워크 경로와 애플리케이션의 성능을 종단간 조사하는 과정을 말합니다. 이는 자연 발생하는 네트워크 활동을 단순히 관찰하는 수동 모니터링과는 다릅니다. 능동 모니터링은 대기 시간, 패킷 손실, 대역폭 사용률, 애플리케이션 응답성 등 다양한 측정치를 직접 생성하여 평가합니다. 이 방법의 주요 이점은 다음과 같습니다.


  • 24시간 내내 가시성을 제공하여 운영팀이 최종 사용자가 문제를 보고하기 전에 네트워크 성능 이슈를 사전에 파악할 수 있습니다.

  • 문제를 빠르게 분류하고 잠재적인 결함 영역을 식별하여 문제 발생 평균 시간(MTTI)과 문제 해결 평균 시간(MTTR)을 단축합니다.

  • 실제 트래픽이 없는 경우에도 백업 링크가 정상적으로 작동하는지 지속해서 확인합니다.


능동 모니터링을 활용하면 운영팀은 문제 해결에 드는 시간을 줄이고, 여러 공급업체 간 책임 소재 문제를 예방하며, 자신이 소유하지 않은 네트워크 부분에 대한 가시성을 높일 수 있습니다.


네트워크의 활성 모니터링

지속적인 네트워크 경로 분석은 사용자가 지정한 네트워크 대상으로 정기적으로 작은 데이터 패킷을 보내고, 이 패킷들이 네트워크를 지난 후 얻은 타이밍 정보를 수집하는 과정을 포함합니다. 이런 방식의 경량 분석은 네트워크 내의 문제를 식별하는 데 유용하며, 문제의 원인을 정밀하게 파악하기 위해 자동으로 상세 진단을 시작할 수 있습니다. 측정되는 주요 성능 지표에는 왕복 시간(RTT), 대기 시간, 지터, 데이터 손실 등이 포함됩니다. 이 데이터는 또한 네트워크 링크의 총 용량과 사용 용량 등 추가적인 측정항목을 파악하는 데도 활용될 수 있습니다.


애플리케이션의 활성 모니터링

실제 사용자의 행동을 시뮬레이션하는 모니터링(Synthetic Monitoring)은 SaaS와 웹 애플리케이션의 성능 추세를 파악하는 데 효과적인 방식입니다. 이 방법은 스크립팅을 통해 최종 사용자의 애플리케이션 사용 경로와 행동을 모사합니다. 이러한 테스트는 사용자 네트워크 내 전략적 위치에 있는 모니터링 지점에서 주기적으로 수행됩니다. 각 테스트 실행 시, DNS 타이밍, TCP 연결 시간, SSL 핸드셰이크, 요청 대기 시간 및 다운로드 속도 등 여러 타이밍이 측정됩니다. 이 정보는 네트워크, 보안 설정, 서버, 혹은 애플리케이션 중 어디에서 성능 저하가 발생하는지 정확히 알아내는 데 도움을 줍니다. 사용자 경험이 허용 가능한 기준을 초과할 경우, 분석, 보고 및 알림을 위해 이러한 측정값이 수집되고 저장됩니다.


활성 모니터링을 사용하여 네트워크 문제 격리

네트워크 통신 전체에 걸쳐 여러 장애 도메인이 연결과 성능에 영향을 줄 수 있습니다. 이에는 로컬 네트워크, SD-WAN 플랫폼, WAN 링크의 기반 네트워크, 애플리케이션 실행 환경, 데이터 센터 등이 포함됩니다. 문제를 효과적으로 분리하고 해결하기 위한 일반적인 방법은 최종 사용자의 서브넷에서부터 애플리케이션이 위치한 VPC, SaaS 제공업체, 혹은 원격 데이터센터에 이르기까지, 애플리케이션의 위치와 상관없이 능동적 모니터링을 실시하는 것입니다. 이러한 트래픽 모니터링은 WAN 링크를 통과하며, 이때 두 가지 주요 전략 중 하나가 사용됩니다.


  • WAN 오버레이 및 언더레이 모니터링: 이 방법은 한 모니터링 지점을 에지 라우터에 직접 연결하여 SD-WAN 터널을 우회하고, 다른 모니터링 지점을 사용자 서브넷에 연결하여 언더레이 경로와 오버레이를 통한 모니터링 경로를 설정합니다. 이 접근법은 SD-WAN 터널을 우회하기 때문에, 타사 공급자가 제공하는 언더레이 회로에 대해 각 단계별로 명확한 가시성을 제공하며, 최종 사용자 트래픽이 SD-WAN 오버레이를 통과할 때 발생할 수 있는 문제에 대해 사전 경고를 할 수 있습니다.

  • 특정 SD-WAN 터널 모니터링: 이 전략은 SD-WAN 정책 내에 특정 라우팅 규칙을 설정하여 모니터링 트래픽이 특정 SD-WAN 터널을 통과하도록 합니다. 이 방식은 언더레이의 일부 세부 정보를 숨길 수 있지만, WAN 링크의 상태를 모니터링하고 평가하는 데에는 여전히 유효합니다. 모니터링 트래픽을 SD-WAN 터널을 통해 라우팅하여 일반 애플리케이션 트래픽에 적용되는 정책 및 최적화 조치가 모니터링 트래픽에도 동일하게 적용되어, SD-WAN 오버레이가 애플리케이션 트래픽에 미치는 영향을 포함한 엔드투엔드 성능을 관찰할 수 있습니다. 그러나 이 방법은 SD-WAN 오버레이를 우회할 때 얻을 수 있는 언더레이 관련 문제에 대한 세부적인 통찰력은 제공하지 않습니다.


두 가지 모니터링 전략에서 얻은 결과를 통합적으로 분석하여 네트워크의 동작을 더욱 정확하게 이해하고 문제를 효과적으로 해결하기 위한 정보에 기반한 결정을 내릴 수 있습니다. 모든 애플리케이션에 영향을 미치는 문제가 발생할 경우, 조사는 주로 LAN이나 SD-WAN 엣지로 집중되는 경향이 있습니다. 이는 SD-WAN 기술이 언더레이의 문제를 동적으로 조정하여 최종 사용자에게 미치는 영향을 최소화하도록 설계되었기 때문입니다. LAN에서의 진단은 조사 범위를 좁히는 데 도움이 될 수 있습니다. 만약 모든 터널이 동시에 영향을 받는다면, 문제의 주된 원인은 SD-WAN 엣지일 가능성이 높습니다. 여러 통신 제공업체가 동시에 같은 문제를 겪는 것은 드물지만 불가능한 것은 아닙니다. 이런 경우에는 SD-WAN 엣지의 구성, 하드웨어, 소프트웨어 구성 요소를 면밀히 조사하여 WAN 연결과 애플리케이션 성능에 영향을 주는 근본적인 문제를 식별하고 해결하는 것이 중요합니다. 애플리케이션에 부분적으로만 문제가 발생하는 경우, 언더레이 네트워크 분석과 ISP나 CSP와 같은 외부 파트너와의 협력을 통해 문제의 근본 원인을 해결하는 방법이 필요할 수 있습니다.


새로운 관점에서 문제를 해결하는 방법 

지속적으로 변화하는 네트워크 및 클라우드 환경 속에서 SD-WAN 시스템의 부담은 점점 커지고 있습니다. 이에 따라, 조직이 네트워크 인프라를 직접 관리하는지 여부와 상관없이, 엔드투엔드 가시성이 어느 때보다 중요해졌습니다. 수동 모니터링으로는 더 이상 충분한 통찰력을 얻을 수 없게 되면서, 능동 모니터링이 필수적인 도구로 자리잡게 되었습니다. 조직들은 능동 모니터링을 네트워크 관리의 핵심 요소로 채택하여 클라우드에 대한 의존성 증가와 관리되지 않는 네트워크 구조로 인해 발생하는 도전들에 효과적으로 대응할 수 있게 됩니다. SD-WAN 환경의 복잡성을 줄이는 전략을 알아보고 싶다면 브로드컴 소프트웨어의 SD-WAN 관리란 제목의 백서를 읽어보는 것을 추천합니다.


조회수 5회댓글 0개

최근 게시물

전체 보기
bottom of page