فیسبوک متوقف شدن انبوه مردم را به دلیل “اشتباهی که خودمان مرتکب شدیم” می داند



فیس بوک روز سه شنبه این قطعی بزرگ را که بیش از 6 ساعت بر روی کاربران اینستاگرام ، واتس اپ و پیام رسان در سراسر جهان رخ داد ، به عنوان “اشتباه مهندسی که خودمان مرتکب شدیم” دانست.

سانتوس جاناردان ، نایب رئیس زیرساخت های فیس بوک ، نوشت که این قطعی – که می تواند تا 100 میلیون دلار درآمد از دست رفته برای شرکت داشته باشد – ناشی از تلاش مهندسان فیس بوک برای انجام یک کار “تعمیر و نگهداری معمول” بود.

وی گفت مهندسان با هدف ارزیابی وجود یک ستون فقرات جهانی ، که به طور ناخواسته تمام اتصالات شبکه ستون فقرات ما را قطع کرده و عملاً مراکز داده فیس بوک را در سراسر جهان قطع کرده است ، فرمان صادر کردند.

وی افزود: ابزاری که قبل از ایجاد وقفه باید خطا را تشخیص می داد ، با خطایی مانع از مداخله آن می شد.

“این تغییر ارتباط سرور ما بین مراکز داده ما و اینترنت را به طور کامل مختل کرده است. و این قطع کامل ارتباط منجر به مشکل دوم شد که اوضاع را بدتر کرد. “جاناردان توضیح داد.

این مشکل اولیه باعث ایجاد مشکل در DNS در فیس بوک یا سیستم نام دامنه شد ، که نام دامنه را با آدرس IP صحیح مرتبط می کند تا افراد بتوانند به وب سایت های محبوب دسترسی داشته باشند.

در اوایل سال جاری ، قطع شدن یک اپراتور اصلی DNS برای مدت کوتاهی بخش های بزرگی از اینترنت را حذف کرد.

“نتیجه نهایی این بود که سرورهای DNS ما با وجود اینکه هنوز کار می کردند ، غیرقابل دسترسی شد. این باعث شد تا بقیه اینترنت سرورهای ما را پیدا نکند. “جاناردان گفت.

“همه چیز خیلی سریع اتفاق افتاد.”

کارکنان فیس بوک از پاسخ سریع به خاموشی جلوگیری کردند زیرا سیستم های امنیتی داخلی فیس بوک تحت تأثیر قرار گرفت و در برخی موارد کارکنان را از مناطق مهم مسدود کرد.

جاناردان می گوید: “دسترسی به مراکز داده ما به روش معمول امکان پذیر نبود زیرا شبکه های آنها مختل شده بود ، و ثانیاً ، از دست دادن کل DNS بسیاری از ابزارهای داخلی را که ما معمولاً برای بررسی و رفع اختلالات مانند این استفاده می کردیم ، خراب کرد.”

“بنابراین فعال سازی پروتکل های دسترسی ایمن مورد نیاز برای به دست آوردن افراد در سایت و توانایی کار بر روی سرورها ، زمان بیشتری را صرف کرد. تنها در این صورت است که می توانیم مشکل را تأیید کرده و ستون فقرات خود را به صورت آنلاین بازگردانیم. “

جاناردان گفت ، حتی پس از شناسایی و حل مشکل ، فیس بوک نمی تواند همه سیستم های خود را به صورت آنلاین بازگرداند زیرا ممکن است به دلیل افزایش ترافیک دوباره خراب شوند.

وی افزود که این شرکت در حال بررسی آنچه اتفاق افتاده است و به دنبال راه هایی برای بهبود این روند است.

وی گفت: “ما کارهای سختی انجام دادیم تا سیستم های خود را برای جلوگیری از دسترسی های غیرمجاز سخت کنیم ، و جالب این بود که ببینیم چگونه این سخت شدن ما را کند می کند ، در حالی که ما سعی می کردیم از نقص ناشی از فعالیت های مخرب نجات پیدا کنیم ، اما در اشتباهی که خودمان مرتکب شده ایم.” به

“من معتقدم که چنین سازشی ارزش آن را دارد – به طور قابل توجهی امنیت روزانه را در برابر بهبودی کندتر از یک رویداد امیدوارکننده نادر مانند این افزایش می دهد.”

دیدگاهتان را بنویسید