Мэдээлэл, системүүд тасралтгүй ажиллах чадвартай юу?

Мэдээллийн систем тасралтгүй ажиллах чадвар гэдэг нь тухайн систем хүчтэй ачаалал, гэнэтийн доголдол, техникийн эвдрэл эсвэл холболтын тасалдал зэргээс үл хамааран тогтвортой, найдвартай ажиллаж чадах байдал юм. Энэ нь байгууллагын үйл ажиллагааны тасралтгүй байдлыг хангах үндсэн шалгуур юм.

Яагаад чухал вэ?
  1. Систем доголдвол хэрэглэгчийн итгэл алдагдаж, байгууллагын нэр хүндэд сөргөөр нөлөөлнө.
  2. Эмнэлэг, банк, төрийн үйлчилгээ зэрэг салбаруудын цаг алдалгүй, тасралтгүй үйлчилгээ шаарддаг.
  3. Доголдлын үед хохирол, мэдээллийн алдагдал үүсэхээс сэргийлнэ.
  4. ISO 27001, ISO 22301 стандартууд тасралтгүй байдлыг гол шалгуур болгодог.
Шалгах зүйлс
    Load balancing болон clustering хийсэн эсэх
  • Систем хэд хэдэн серверт ачаалал хуваарилж байна уу?
  • High Availability (HA) архитектур байгаа эсэх
  • Гол сервер унтарсан үед нөөц сервер автоматаар ажилладаг уу?
  • Downtime бүртгэл, тогтмол шалгалт хийдэг эсэх
  • Хэзээ систем ажиллаагүй, ямар шалтгаантай вэ?
  • Автомат сэргээх механизм (auto-restart, failover)
  • Процесс унасан үед автоматаар сэргэж байна уу?
  • Хамгийн бага SLA (Service Level Agreement) тодорхойлсон эсэх
  • Жишээ нь: “99.9% uptime” шаардлагыг хангаж байгаа юу?
  • Тасралтгүй байдлын тест хийсэн эсэх (Disaster Recovery Test)
  • Техникийн ослын үед систем сэргээж чадаж байна уу?
Жишээ
Uptime monitoring system ашиглан тасралтгүй байдлыг хянах:
  • “uptimerobot.com” болон “Pingdom”-оор 24/7 монитор хийх.
  • Сэрэмжлүүлэг нь Telegram эсвэл Email-р ирдэг.
  • High availability MySQL configuration:

  • [mysqld]
    server-id=1
    log_bin=mysql-bin
    replicate-do-db=your_database
    Master-Slave эсвэл Galera Cluster-оор тасралтгүй байдлыг хангана. Docker + Kubernetes орчинд:
  • Pods унасан тохиолдолд автоматаар шинэ Pod босгодог (livenessProbe, readinessProbe ашиглах).
  • Жишээ SLA зорилт:
  • Жилд 99.9% uptime → жилд хамгийн их 8.76 цагийн доголдлыг зөвшөөрнө.