반응형
트위터가 오늘 하루종일 다운되어 있었습니다. 많은 트위터족들의 울부짖음이 들렸습니다.
매일 트위터 들여다 보다가 트위터가 멈췄으니 많은 사람들이 당황해 했던 하루였습니다. 어떤 분은 이래서 한국에도 트위터서비스가 나와야 한다는 소리까지 하더군요.
그런데 오늘 트위터서비스 중단은 오늘 갑자기 일어난것은 아니고 지난 주말부터 고래가 자주 출몰했습니다.
트위터 서비스 과부하 걸리면 고래가 출동하죠.
그리고 방금전에 트위터가 공식적으로 그 이유를 밝혔습니다.
내부 네트워크 구성 잘못 즉 설계 잘못으로 과부하가 걸렸다고 밝혔습니다.
The
Twitter Engineering Blog
트위터 엔지니어 블로그에 나온 내용을 보면 대략 3개의 실수가 있었다고 밝히고 있습니다.
실수 두개는 급속히 증가하는 광대역 망을 내부 네트워크와 같은 구성에 포함시켜 버렸고 내부 네트워크에서는 광대역 네트워크를 모니터릴 하지 못했습니다.
저도 네트워크 설계해봤지만 이 네트워크 설계 여간 골머리 섞는게 아닙니다. 구성 하나 잘 못하면 학교내 네트워크가 동맥경화가 일어나거나 혹은 루프가 걸리면 아주 짜증이 나죠. 루프걸리면 일일이 허브나 스위치에서 랜선을 하나씩 뽑아서 잡아야 합니다.
이번 장애를 수정 하기위해 내부 네트워크 용량을 2배로 늘렸고 내부 네트워크의 모니터링을 개선했습니다.
또한 내부 네트워크의 부하를 분산하기 위한 리벨러스를 실시한다고 밝혔습니다.
트위터는 2009년 부터 급증하는 부하량에 대응하기 위해서 시스템을 재설계 해왔지만 여전히 개선의 여지가 있다고 밝히고 있어 언제 또 서비스장애가 발생할지 걱정이 되네요. 전면적으로 서비스 재점검을 해야 하지 않을까 하는데요. 돈을 많이 벌지 못해서 트위터가 돈이 없나요? 장비좀 빵빵하것 살수 있을듯 한데 그렇지 못한것 같네요.
반응형