İçeriğe Atla
MS Mehmet Sarı Çözüm mimarisi notları

Acronis Yedeği Başarılı Diyor: Restore Testi Neden Ayrı Bir İş?

Yedekleme yazılımlarından gelen 'başarılı' mesajlarına rağmen, restore testinin iş sürekliliği için neden ayrı ve kritik bir adım olduğunu ele alıyorum.

100%

Acronis veya benzeri yedekleme yazılımları, operasyonun sonunda “Yedekleme Başarılı” mesajını gösterdiğinde hepimiz rahat bir nefes alırız. Bu mesaj, günlük operasyonel rutinin önemli bir parçasının tamamlandığını gösterir. Ancak bu mesajın ne anlama geldiğini ve neleri kapsamadığını doğru anlamak, iş sürekliliği için hayati öneme sahiptir.

Bir yedeklemenin başarılı olması, o yedeğin felaket anında gerçekten geri yüklenebileceği anlamına gelmez. Restore testi, bu “başarılı” görünen yedeğin gerçek hayatta işe yarayıp yaramadığını anlamanın tek ve en güvenilir yoludur. Bu yazıda, yedekleme başarısının neden restore edilebilirliğe eşit olmadığını ve restore testlerinin neden ayrı bir disiplin gerektirdiğini detaylandıracağım.

Acronis Başarılı Diyor, Peki Nedir Bu Başarı?

Yedekleme yazılımları, bir operasyonun sonunda “Başarılı” raporu verdiğinde, genellikle belirli teknik kontrollerden geçtiğini kasteder. Bu kontroller arasında, kaynak verinin okunabilmesi, yedekleme dosyalarının hedef depolama birimine yazılabilmesi ve yedekleme dosyasının temel bütünlük (checksum) kontrollerinden geçmesi yer alır. Yani, sistem, veriyi belirlenen yere kopyalayıp kopyalamadığını ve kopyalanan dosyanın bozuk olup olmadığını kontrol eder.

Ancak bu “başarı”, yedeğin içindeki işletim sisteminin boot edilebilirliğini, veritabanının tutarlılığını veya uygulamaların doğru şekilde çalışıp çalışmayacağını test etmez. Sadece dosyanın fiziksel olarak var olduğunu ve aktarım sırasında büyük bir bozulma olmadığını söyler. Bu durum, bir arabanın anahtarını çevirdiğinizde motorun çalıştığını duymanıza benzer; ancak arabanın gerçekten yol alıp alamayacağını, vitese geçip geçmediğini veya frenlerinin işleyip işlemediğini bilmezsiniz.

Operation: Backup
Type: Full
Result: Succeeded
Start time: 2026-06-29 23:00:01
End time: 2026-06-29 23:45:32
Duration: 00:45:31
Data transferred: 500 GB
Target: \\backup-server\shares\server01.tibx
Comments: Volume snapshot created successfully. Data integrity check passed.

Bu tip bir rapor, yedekleme dosyasının fiziksel olarak diske yazıldığını ve basit bir bütünlük kontrolünden geçtiğini gösterir. Ancak içeriğin mantıksal tutarlılığı veya işletim sisteminin boot edilebilirliği hakkında kesin bilgi vermez. Bu, yedekleme stratejimizde en büyük yanılgılardan biridir ve gerçek bir felaket anında büyük sürprizlere yol açabilir. Bu yüzden, ITWISE olarak biz, “başarılı yedekleme” mesajını bir başlangıç noktası olarak görür, nihai bir güvence olarak değil.

Restore Testinin Kapsamı ve Neden Farklı Olduğu

Restore testi, bir yedeklemenin sadece var olup olmadığını değil, aynı zamanda işlevsel olarak kullanılabilir olup olmadığını doğrulamak için yapılan kontrollü bir simülasyondur. Bu test, felaket anında sistemlerinizi ne kadar hızlı ve eksiksiz bir şekilde geri yükleyebileceğinizi gösterir. Restore testinin kapsamı, basit bir dosya geri yüklemesinden çok daha geniştir ve genellikle aşağıdaki adımları içerir:

Öncelikle, yedeklenen verinin izole bir ortama (genellikle bir sanal makine veya test sunucusu) geri yüklenmesi gerekir. Bu izolasyon, üretim ortamına herhangi bir zarar vermemek veya çakışmaları önlemek için kritiktir. Ardından, geri yüklenen işletim sisteminin başarıyla başlatılıp başlatılamadığı kontrol edilir. İşletim sistemi açıldıktan sonra, kritik servislerin (örneğin veritabanı sunucuları, web sunucuları, Active Directory rolleri) otomatik olarak başlayıp başlamadığı ve düzgün çalışıp çalışmadığı doğrulanır.

Son olarak, geri yüklenen sistemdeki verilerin erişilebilirliği ve bütünlüğü test edilir. Bu, rastgele seçilmiş kritik dosyalara erişmeyi, veritabanı sorguları çalıştırmayı veya uygulamanın temel işlevlerini test etmeyi içerebilir. Tüm bu adımlar, yedeklemenin sadece bir dosya koleksiyonu değil, aynı zamanda işleyen bir sistem yansıması olduğunu kanıtlar.

  1. İzolasyon: Ağdan izole, ayrı bir sanal makine veya fiziksel test ortamı hazırla. Üretim sistemleriyle çakışmayı önle.
  2. Restore: Test edilecek en güncel full yedeği bu izole ortama restore et. Restore süresini kaydet.
  3. Boot: Geri yüklenen sanal veya fiziksel makineyi başlat. İşletim sisteminin sorunsuz bir şekilde açıldığını ve stabil çalıştığını doğrula.
  4. Servis Kontrolü: Kritik servislerin (SQL Server, IIS, Active Directory, ERP servisleri vb.) otomatik olarak başladığını ve aktif çalıştığını kontrol et.
  5. Veri Kontrolü: Rastgele seçilmiş kritik dosya veya veritabanı kayıtlarına erişimi test et. Veri bütünlüğünü ve erişilebilirliğini doğrula.
  6. Uygulama Testi: Uygulama katmanında basit bir işlem yaparak (örneğin bir kullanıcı girişi, rapor çalıştırma) işlevselliği test et.

Bu adımlar, bir yedeklemenin sadece “başarılı” olmasının ötesinde, gerçek bir felaket anında işe yarayıp yaramayacağını ortaya koyar. Restore testi, bir felaket kurtarma planının en kritik parçasıdır ve düzenli olarak tekrarlanması gerekir.

Senaryolar: Bozuk Yedekler Nasıl Oluşur?

Yedeklemeler, “başarılı” olarak rapor edilse bile çeşitli nedenlerle bozuk veya kullanılamaz hale gelebilir. Bu durumlar, genellikle yedekleme yazılımının kontrol edemediği veya tespit edemediği dış etkenlerden kaynaklanır. Bu senaryoları anlamak, restore testlerinin neden bu kadar kritik olduğunu daha iyi açıklar.

  • Kaynak Sistem Bozulmaları (Source Corruption): Yedekleme başlamadan önce, kaynak sistemdeki verilerde bir bozulma meydana gelmiş olabilir. Örneğin, bir disk hatası veya RAM arızası nedeniyle bir veritabanı dosyası fiziksel olarak bozulmuş olabilir. Acronis bu bozukluğu bir dosya bozulması olarak algılamaz, çünkü okuma işlemi fiziksel olarak başarılıdır. Yedekleme yazılımı, bozuk veriyi olduğu gibi yedekler ve “başarılı” rapor eder.
  • Yedekleme Depolama Alanı Sorunları (Backup Storage Issues): Yedeklerin yazıldığı disklerde, NAS (Network Attached Storage) ünitelerinde veya bulut depolama alanlarında fiziksel veya mantıksal bozulmalar meydana gelebilir. Yedekleme dosyası yazıldıktan sonra depolama biriminde oluşan bir sektör hatası, dosyanın okunamaz hale gelmesine neden olabilir.
  • Ağ Kesintileri ve Bant Genişliği Sorunları (Network Interruption): Özellikle büyük yedeklemeler veya ağ üzerinden yapılan uzak yedeklemeler sırasında, ağ bağlantısındaki geçici kesintiler veya yüksek paket kaybı, yedekleme dosyasının bazı bloklarının eksik veya bozuk yazılmasına yol açabilir. Yedekleme yazılımı, bazı durumlarda bu bozuklukları fark edemeyebilir.
  • Yazılım Hataları (Software Glitches): Nadiren de olsa, yedekleme yazılımının kendisindeki bir hata, yedeğin düzgün oluşturulamamasına neden olabilir. Bu tür hatalar, genellikle yazılım güncellemeleri veya belirli konfigürasyonlarla ortaya çıkabilir.
  • Şifreleme Anahtarı Kaybı (Encryption Key Loss): Yedeklerinizi şifrelediyseniz ve şifreleme anahtarını kaybettiyseniz veya yanlış sakladıysanız, yedek dosyaları ne kadar sağlam olursa olsun erişilemez hale gelir. Bu durum, yedeğin kendisinin bozuk olmamasından ziyade, erişim imkanının kaybedilmesi anlamına gelir.
  • Bağımlılık Sorunları (Dependency Issues): Özellikle karmaşık sistemlerde, bir sunucunun yedeği geri yüklendiğinde diğer bağımlı sistemlerle entegrasyon sorunları yaşanabilir. Örneğin, bir Active Directory domain controller’ın yedeği geri yüklendiğinde, diğer domain controller’larla replikasyon sorunları çıkabilir ve bu da kullanıcıların oturum açmasını engelleyebilir.

Bu senaryoların her biri, yedekleme operasyonu “başarılı” olarak rapor edilse bile, geri yükleme işleminin başarısız olabileceğini gösterir. Bu yüzden, restore testleri, bu potansiyel sorunları felaket anı gelmeden önce tespit etmek için vazgeçilmezdir.

Manuel ve Otomatik Restore Testi Yaklaşımları

Restore testleri, iş yükünün kritiklik düzeyine ve mevcut kaynaklara bağlı olarak farklı yaklaşımlarla gerçekleştirilebilir. Manuel testler, daha kapsamlı ve gerçekçi sonuçlar sunarken, otomatik testler daha sık ve düşük maliyetli doğrulama imkanı sağlar.

Manuel Restore Testleri: Bu yaklaşım, belirli aralıklarla (örneğin ayda bir veya üç ayda bir) kritik sistemlerin tam bir geri yüklemesini yapmayı içerir. Genellikle izole bir test ortamına (bir sanal makine veya yedek bir fiziksel sunucu) yapılan tam bir işletim sistemi ve uygulama restore işlemidir. Bu testler, işletim sisteminin boot edilebilirliğinden, kritik servislerin başlatılmasına ve uygulamanın temel fonksiyonlarının çalışıp çalışmadığına kadar her şeyi kontrol etme fırsatı verir.

  • Avantajları: Gerçek dünya senaryosuna en yakın testi sunar, uygulamaların ve işletim sisteminin tam işlevselliğini doğrular. Felaket anında karşılaşılacak potansiyel sorunları (lisanslama, bağımlılıklar vb.) önceden tespit etmeye yardımcı olur.
  • Dezavantajları: Zaman ve kaynak yoğundur (test ortamı, insan gücü). Her yedek için veya çok sık yapılamaz.

Otomatik Restore Testleri: Otomasyon, restore testlerinin sıklığını artırmak ve insan müdahalesini azaltmak için kullanılır. Acronis gibi bazı yedekleme çözümleri, yedekleme dosyalarının bütünlüğünü otomatik olarak doğrulama özelliklerine sahiptir. Ancak bu doğrulama, genellikle dosya bütünlüğü veya boot edilebilirliğin yüzeysel bir kontrolünden öteye geçmez.

Daha ileri düzeyde otomasyon için, yedekleri bir sanal makineye restore edip boot ettikten sonra, basit scriptlerle servislerin durumunu kontrol edebiliriz. Örneğin, PowerShell veya Bash scriptleri ile belirli portların açık olup olmadığını, bir veritabanı servisiyle bağlantı kurulup kurulmadığını veya belirli bir web sayfasının erişilebilir olup olmadığını test edebiliriz.

# Acronis Backup Gateway'de bir yedeği mount edip içeriğini listeleme örneği
# Bu komut, yedeğin erişilebilirliğini temel düzeyde kontrol eder.
# Ancak işletim sisteminin boot edilebilirliğini veya uygulama katmanındaki sorunları test etmez.

# Yedekleme dosyasının yolunu ve mount edilecek geçici dizini belirtin
BACKUP_FILE="/mnt/acronis_share/server01_full_b1_s1_v1.tibx"
MOUNT_POINT="/tmp/mounted_backup"

# Geçici mount dizinini oluştur
mkdir -p "$MOUNT_POINT"

# Yedekleme dosyasını mount et (genellikle ilk bölümü)
# --partition=1 parametresi, ilk bölümü mount etmeyi sağlar.
# Gerçek ortamda disk numarasını ve bölüm numarasını kontrol etmek gerekebilir.
acrocmd mount --disk-archive="$BACKUP_FILE" --loc="$MOUNT_POINT" --partition="1"

# Mount işlemi başarılı olduysa
if [ $? -eq 0 ]; then
    echo "Yedekleme başarıyla mount edildi. İçeriği listeleniyor..."
    ls -l "$MOUNT_POINT/Users/CriticalData" # Örnek bir kritik dizin
    
    # Unmount işlemi
    acrocmd unmount --loc="$MOUNT_POINT"
    echo "Yedekleme başarıyla unmount edildi."
else
    echo "Hata: Yedekleme mount edilemedi, potansiyel sorun!"
fi

# Geçici dizini temizle
rmdir "$MOUNT_POINT"

Bu komut dizisi, yedeğin erişilebilirliğini ve belirli bir dizinin içeriğini temel düzeyde kontrol eder. Ancak işletim sisteminin boot edilebilirliğini veya uygulama katmanındaki sorunları test etmez. Otomasyon, manuel testlerin tamamlayıcısı olmalı, onların yerini tamamen almamalıdır. En iyi yaklaşım, her iki yöntemi de stratejik olarak birleştirmektir.

Felaket Kurtarma Planının Temeli Olarak Restore Testi

Felaket Kurtarma (Disaster Recovery - DR) planı, bir kriz anında iş sürekliliğini sağlamanın anahtarıdır. Bu planın kağıt üzerinde ne kadar detaylı ve iyi yazılmış olursa olsun, restore testleri olmadan bir anlam ifade etmez. Restore testleri, DR planının canlı bir kanıtı, bir tatbikatıdır ve planın gerçek dünyada işleyip işlemediğini gösterir.

DR planlarının temel hedefleri olan RTO (Recovery Time Objective) ve RPO (Recovery Point Objective) değerleri, restore testleri ile doğrudan ilişkilidir. RTO, bir felaket sonrası sistemlerin ne kadar sürede tekrar çalışır duruma geleceğini tanımlar. RPO ise, kabul edilebilir maksimum veri kaybı miktarını belirtir. Restore testleri yapılmadığında, kağıt üzerindeki RTO ve RPO hedeflerinin tutturulması genellikle bir hayalden ibaret kalır.

Gerçek bir restore testi sırasında, bir sistemin veya uygulamanın geri yüklenmesi için gereken gerçek süre ölçülür. Örneğin, bir felaket kurtarma senaryosunda, kritik bir SQL Server veritabanının restore süresi kağıt üzerinde 2 saat olarak belirlenmiş olabilir. Ancak gerçek bir test, restore işleminin disk I/O limitleri, ağ bant genişliği veya uygulama bağımlılıkları nedeniyle 6 saati bulduğunu ortaya çıkarabilir. Bu bilgi, RTO hedeflerinin revize edilmesi veya altyapının iyileştirilmesi için kritik öneme sahiptir.

Aynı şekilde, restore testleri, belirli bir yedekleme noktasının (RPO) gerçekten geçerli olup olmadığını doğrular. Eğer en güncel yedek bozuksa, bir önceki günün yedeğine dönmek zorunda kalabiliriz, bu da RPO hedefimizin dışına çıkmamız anlamına gelir. Bu yüzden, restore testleri sadece teknik bir görev değil, aynı zamanda iş sürekliliği ve felaket kurtarma stratejisinin temel bir bileşenidir. DR planı sadece bir doküman değil, düzenli tatbikatlarla canlı tutulması gereken bir süreçtir.

ITWISE Yaklaşımı: Restore Testlerini Standardize Etmek

ITWISE olarak biz, müşterilerimizin altyapılarını tasarlarken ve yönetirken yedekleme çözümlerini sadece konumlandırmakla kalmayız; restore testlerini bu planın ayrılmaz bir parçası olarak ele alırız. Amacımız, sadece “yedekleme başarılı” demekten öte, “işiniz güvende” diyebilmemizi sağlamaktır. Bu yaklaşım, belirli standartlar ve disiplinler üzerine kuruludur.

Her müşterimiz için kritik sistemlerin restore testlerini periyodik olarak, tipik olarak en az üç ayda bir, bazen daha sık olacak şekilde planlarız.

Paylaş:

Bu yazı faydalı oldu mu?

Yükleniyor...

Bu yazı nasıldı?

MS

Mehmet Sarı

Çözüm Mimarı & IT Altyapı Uzmanı (MSP)

Çözüm mimarisi, network, sunucu altyapıları, yedekleme, storage, güvenlik ve MSP operasyonu ekseninde çalışıyorum. Bu blogda sahada karşılığı olan teknik deneyimlerimi paylaşıyorum.

Kişisel Notlar

Bu notlar sadece sizde saklanır. Tarayıcınızda yerel olarak tutulur.

Hazır 0 karakter

Yorumlar

Sunucu Taraflı AI Moderasyon

Yorumlar sunucuda yapay zeka ile denetlenir ve kalıcı olarak saklanır.

?
0/2000

Sunucu taraflı AI denetim

✉️ Ücretsiz · Spam yok · İstediğin an çık

Haftalık özet — AI değil, bizzat ben seçiyorum

Haftada bir mail: o haftanın en önemli yazısı, perde arkası notları, ve "bu hafta gerçekten kullandığım araç" bölümü. Az gürültü, çok sinyal.

  • 📌
    Haftanın en iyisi Sadece okumaya değer tek yazı
  • 🔧
    Alet çantası Bu hafta kullandığım araçlar
  • 🧠
    Perde arkası Blog'a girmeyen notlar

Spam yapmıyoruz. İstediğiniz zaman ayrılabilirsiniz. · Sadece Umami (self-hosted, Google yok) ile takip.

Okuma İstatistikleriniz

0

Yazı Okundu

0dk

Okuma Süresi

0

Gün Serisi

-

Favori Kategori

İlgili Yazılar