眾所周知,DNS作為一項互聯網基礎業務,對整個互聯網的正常運行起著至關重要的作用。當然,別有用心的攻擊者也同樣明白這個道理,總是希望通過各種各樣的攻擊手段破壞DNS解析服務的正常開展。 如何從不同層面綜合運營,保證DNS服務安全高效的運行,一直以來都是DNSPod每一位工程師不斷思索的問題。我們認為,主要從應該從以下幾個方面入手: 狀態監控 DNS服務是一項實時性要求非常高的服務,準確全面的監控系統是整個DNS服務的運營基礎。為此,我們設計了一整套的監控體系,包括網絡流量監控、服務器內核監控模塊、解析監控、服務器集群監控等等。從不同層面不同角度對DNS解析服務進行監控,保證工程師能第一時間了解其運行狀態。在技術選型方面,我們一方面采用比較成熟的基于SNMP的nagios/cacti監控,一方面針對DNS的特點開發與解析服務緊密結合的監控模塊,滿足不同監控對象的需要。 信息告警 DNS服務運行過程中總會有各種各樣的情況發生,同一個事件需要通知到不同的負責人,每個人需要知道的信息也不盡相同。例如在捕獲到域名攻擊事件后,會馬上向運維工程師發出告警,提示各種層面的流量數據。向技術支持人員發送攻擊情況概要和受影響的程度,以便用戶詢問情況時能得到最新信息。針對VIP客戶,還會向相關的銷售人員發送攻擊相關數據和處理情況,由銷售人員直接與客戶取得聯系。特別重大的攻擊事件,還會向市場人員、開發人員、技術負責人甚至總經理發送,保證信息及時傳遞,事件能夠及時處理。為了滿足多樣化的信息發送需求,我們建立了專門的通知系統平臺,提供了一致的API接口供各個程序調用,能夠提供郵件、微信、短信、語音等多種通知方式。 事件處理 為了及時響應并處理各種事件,為用戶提供持續的優質服務,我們實行24小時值班制度。任何時間都會有經驗豐富的技術人員準備應對突發情況。同時,為了進一步加強響應效率,自動化運維處理必不可少。例如,我們對DNS攻擊做了長期的研究,開發了域名封禁/解封、防護算法、流量引導等多種防護手段,根據DNS攻擊的實際情況自動開啟,能在短時間內化解大流量的DNS攻擊,將影響減到最小。 數據記錄 當然,事件處理完成并不代表著結束,還需要做好各種記錄,保證可以回顧分析。基本的數據包括交換機流量數據、網卡抓包數據、事件處理記錄等等,我們對這些數據都做了完整的記錄、備份、整理、歸檔,這樣不但任何問題都有據可查,也為進一步的統計分析做好了準備。因為數據量大、種類多,我們比較多的使用了Redis和MongoDB,其存NoSQL的特點特別適用于這個情況。 綜合運營數據分析 除了短時間的針對單個事件的應對策略,運營更需要長期的數據記錄與分析。我們每天的運營情況都會以報表的形式呈現出來,對域名解析量、用戶數量、攻擊情況等數據更有長時間的追蹤和趨勢分析。如根據攻擊趨勢的分析加強防攻擊投入,根據用戶轉入/轉出情況聯系銷售人員跟進。這里我們使用了Graphite用于繪圖,D3.js在繪制報表方面也有很好的表現。 總的來說,DNS服務有其復雜性和特殊性,DNSPod長期專注于DNS解析業務,在此領域有豐富的經驗和深厚的積累,希望上述分享能給每一位關心DNS領域的朋友帶來益處,共同創造更美好的互聯網環境。 |
免責聲明:本站部分文章和圖片均來自用戶投稿和網絡收集,旨在傳播知識,文章和圖片版權歸原作者及原出處所有,僅供學習與參考,請勿用于商業用途,如果損害了您的權利,請聯系我們及時修正或刪除。謝謝!
始終以前瞻性的眼光聚焦站長、創業、互聯網等領域,為您提供最新最全的互聯網資訊,幫助站長轉型升級,為互聯網創業者提供更加優質的創業信息和品牌營銷服務,與站長一起進步!讓互聯網創業者不再孤獨!
掃一掃,關注站長網微信