고난의 2주 회고 (2020.03.01 ~ 2020.03.14)

말없이술이나쳐묵자

지난 2주동안 있었던 일..

1. 영상 스트리밍 장애

10일부터 영상 장애 CS 가 폭주했다. 그냥 폭주 아니고 대폭주.ㅠㅠ
CS는 폭주하는데 원인을 모르니 미치겠더라.
비메오 서비스가 우리 트래픽 제한하는 줄 알고 문의하고 제보하고 했는데 자기들은 모르는 일이라고만 했다. (문제의 원인은 아카마이 CDN 서비스의 한국지역 장애였음. 무려이틀동안)

이전에 이런 상황에 대비한 비메오 대탈주 프로젝트를 진행한적이 있어 AWS-CF 환경으로 빨리 이전했다. 그리고 나름 투명하게 상황을 공개하고 업데이트 했는데, 그 때문인지 사용자 이탈이 없던점은 다행이다.
(공지 올려달라는 분 있어서 https://www.inflearn.com/notices/27648)

2.보안문제

보안적으로 구멍이 발견됐다.
토욜에 제보 받고 토일월동안 매꿔놨다. 엄청 부끄러웠다..ㅠㅠ 앞으로 이런일이 없게 여러 테스트 사양을 추가하기로 함.

3. 트래픽 증가로 인한 서비스 장애

인프라를 잘 구성해놨다고 생각해왔는데, 그에 비해 경험이 부족했다. 돈 잘아끼고 있다고 넘 좋아만 하고 있었음. (거의 AWS 최소사양으로만 쓰고 있었으니..) 적절한 사양으로 다시 구성하고 상황에 따른 시나리오를 준비했다.

… 😅

아 진짜 기술적 도전이 가장 많았던 2주였음.
기술적 운영에 대한 경험치가 많이 올라간거 같다.
잘 이겨내고 있는 팀이 자랑스럽다.
특히 영상 CS 폭주할때 스트레스 다 같이 많이 받았을텐데 잘 이겨내줘서 미안하고 감사하다.
이번주도 화이팅 해야징.

그리고 회원수 25만명 돌파함! 🎉

의견을 남겨주세용