Dijital Arşivde Toplu Bilgi Maskeleme: Yöntemler, Süreçler ve KVKK Uyum Protokolleri

Veri Gizleme (Maskeleme) Nedir ve Neden Önemlidir?

Veri gizleme ya da halk dilindeki adıyla maskeleme (redaction), bir belgedeki hassas bilgilerin görünürlüğünü kalıcı olarak ortadan kaldırma işlemidir.

Bu işlemde, doğru yazılımlarla uygulanan siyah blok, bulanıklaştırma veya silme yöntemleri ile bilgi, yalnızca görüntü katmanından değil, aynı zamanda belgenin altındaki metin katmanından (OCR layer) da tamamen silinir. Basit bir görüntü üzerine siyah kutu koymak yetersizdir ve bu durum, bilginin Adli Bilişim yöntemleriyle kurtarılmasına yol açar. Kurumsal düzeyde bu işlem, kişisel verilerin korunması, KVKK / GDPR uyumluluğu ve bilgi güvenliği için kritik bir adımdır.

Neden gerekli?

  • Kişisel veriler (TCKN, doğum tarihi, maaş gibi) yetkisiz erişime karşı korunmalı.
  • İş süreçleri (personel özlük dosyaları, maaş bordroları, sağlık raporları) paylaşımda anonimleştirme gerektirir.
  • Arşiv ve dış paylaşımda yükümlülükleri yerine getirmek (denetimler, üçüncü taraf hizmetler).
  • Dijitalleştirilmiş arşivlerde toplu veri sızıntısını önlemek.

Hangi belgelerde maskeleme yapılır? (Örnek dosya türleri)

Dijital / taranmış evraklarda maskeleme yaygındır. Yaygın örnekler:

  • PDF (taranmış / OCR’lanmış) — en sık kullanılan arşiv formatı.
  • TIF / TIFF (yüksek çözünürlüklü taramalar, arşiv standartları).
  • JPEG / PNG (tek sayfa taramalar, fotoğraflar).
  • Çoklu sayfa PDF (toplu arşivler).

Örnek kullanım alanları:

  • Özlük dosyalarında maaş alanını gizlemek.
  • Kimlik ve nüfus kayıtlarında TCKN / seri no gibi verileri maskelemek.
  • Muhasebe evraklarında banka hesap numaralarını veya IBAN’ı gizleme.
  • Adli sicil belgelerinde hassas kısımları sınırlama.

Maskeleme Yöntemleri — Hangi Durumda Hangi Yöntem Uygundur?

Toplu maskeleme genelde dört ana yaklaşımla yapılır: kural bazlı, Excel (liste) bazlı, koordinat bazlı ve manuel. Her birinin avantajları ve ideal kullanım alanları farklıdır.

1) Kural bazlı maskeleme

Ne demek? Belgedeki sabit anahtar kelimeler veya düzenli ifadeler (Regex) temelinde otomatik maskeleme. Örnek: TCKN için \d{11} Regex kuralı veya Maaş: etiketi sonrası 10 karakteri maskele.

Avantaj: Büyük hacimli belgede yüksek otomasyon.

Hangi evrakta iyi çalışır? Yapılandırılmış formlar, bordro şablonları, standart sözleşmeler, sabit alanlı formlar.

Dezavantaj: Şablon dışı evraklarda yanlış/eksik tespit olabilir.

2) Excel (liste) bazlı maskeleme

Ne demek? Maskeleme kriterleri önceden bir Excel listesinde verilir; program bu listede geçen değerleri belge metninde arayıp kapatır (ör. müşteri numaraları, VKN/TCKN listesi).

Avantaj: Bilinen değerlerin toplu gizlenmesi (müşteri listesi, riskli kart numaraları).

Hangi evrakta iyi çalışır? Müşteri ilişkileri, hukuki liste karşılaştırmaları, toplu veri temizliği.

Dezavantaj: Liste güncelliği ve doğruluğu gerekir; OCR hataları bulunursa kaçırma olabilir.

3) Koordinat bazlı maskeleme

Ne demek? Sabit sayfa şablonlarında (ör. nüfus kayıt örneği, ikametgah) belirli (x,y,width,height) alanlar maskelenir.

Avantaj: Çok hızlı ve kesin—özellikle aynı formatta indirilebilen resmi evraklarda ideal.

Hangi evrakta iyi çalışır? Nüfus kayıtları, resmi formlar, adli sicil belgeleri (internetten indirilebilen sabit şablonlar).

Dezavantaj: Belge düzeyi/format farklılıklarında işe yaramaz; tarama hizalanması önemli.

4) Manuel maskeleme

Ne demek? İnsan operatör tarafından görüntü üzerinde elle seçip maskeleme.

Avantaj: Bozuk, yıpranmış, el yazısı veya OCR başarısız belgelerde tek güvenilir yöntem.

Hangi evrakta iyi çalışır? Fiziksel olarak yıpranmış, lekeli, eksik veya el yazısı ile dolu belgeler.

Dezavantaj: İş gücü maliyeti yüksek, toplu işlem zayıf.

Toplu İş Akışı: Adım Adım Uygulanabilir Süreç (Önerilen Sıra)

  1. Dosya formatlarını standartla — Önce tüm gelen dosyaları (JPEG, TIF, PNG vb.) PDF’e dönüştür.
  2. OCR ile metin katmanı ekle — (Eğer henüz OCR yoksa) PDF’leri OCR’la (optik karakter tanıma) geçir; böylece kural veya liste tabanlı aramalar mümkün olur.
  1. Kural bazlı maskeleme (ilk tur) — Standart form ve şablonlarda kural bazlı işlem uygula (TCKN, IBAN, etiketler).
  2. Koordinat bazlı maskeleme (şablonlar için) — Eğer belge tipi sabit ve şablon biliniyorsa koordinat kurallarını uygula.
  3. Excel bazlı (liste) maskeleme — Bilinen kişi/hesap listelerini kullanarak ikinci tur arama.
  4. Otomatik kalite kontrol — Log ve rapor üret; maskelenen alan sayısı, atlanan belgeler.
  5. Manuel inceleme & düzeltme — Atlanan / hatalı maskelenen sayfalar için insan kontrolü yap.
  6. Nihai arşivleme (dijital arşivleme) — Maskelenmiş dosyaları güvenli dijital arşivine taşı.

Bu sıra, toplu maskeleme verimliliğini maksimize edip manuel müdahaleyi azaltır.

Uygulama Örnekleri — Somut Senaryolar

  • Özlük dosyası: Personel dosyasında Maaş: etiketi tespit edilip yanındaki sayısal alan kural bazlı olarak 10 karakter maskelenir. Eğer maaş alanı farklı formatta ise Excel listesi veya manuel seçimle düzeltme uygulanır.
  • Kimlik bilgileri: Nüfus kayıt örneği PDF’leri için TCKN koordinat bazlı maske (şablon sabit ise); farklı kaynaklardan gelen kayıtlar için önce OCR, ardından kural tabanlı regex ile işlem.
  • Adli sicil belgeleri (internetten indirilen sabit format): Koordinat bazlı toplu maskeleme hızlı ve güvenli.

Teknik ve Operasyonel Notlar / Tavsiyeler

  • OCR kalitesi düşükse Excel bazlı ve kural bazlı yaklaşımlar başarısız olabilir — bu durumda önce görüntü iyileştirme (deskew, contrast, despeckle) yapın.
  • Koordinat bazlı yöntemlerde tarama hizalaması çok önemlidir; sayfa kayması varsa alan tutmaz.
  • Loglama: Hangi dosyada ne maskelendi, hangi kural uygulandı, manual review listesi mutlaka tutulmalı.
  • Yedekleme: Orijinaller silinmemeli; sadece maskelenmiş versiyonlar arşivlenmeli.
  • Güvenlik: Maskelenmemiş orijinallerin erişimini kısıtlayın.

Sonuç — Neden Bunu Yaptırmalısınız?

Toplu maskeleme, dijital arşivlemeyi tamamlayan bir güvenlik adımıdır. Doğru kombinasyon (kural + koordinat + Excel + manuel) kullanıldığında:

  • Hassas veriler hızlıca korunur,
  • İş akışları otomatikleşir, zaman ve maliyet düşer,
  • Yasal uyumluluk (KVKK/GDPR) sağlanır, denetimler kolaylaşır.

Belge Bilgi Maskeleme – Sık Sorulan 10 Soru ve Cevap

Maskeleme ile anonimleştirme arasındaki fark nedir?

Maskeleme yaparken sadece siyah kutu eklemek yeterli mi?

Maskeleme işlemi yapıldıktan sonra maskeleme geri alınabilir mi?

Çok karmaşık ve farklı formatlı dosyalarda hangi maskeleme yöntemini tercih etmek gerekir?

Koordinat bazlı maskeleme hangi durumlarda hatalı sonuç verir?

Excel liste yöntemi hangi veri türleri için uygun değildir?

Bir PDF dosyasında hem OCR katmanı hem de görüntü katmanı varsa maskeleme nasıl yapılır?

Toplu maskeleme sırasında en büyük risk nedir?

Maskeleme işleminden sonra orijinal dosyalar saklanmalı mı?

İnternetten indirilen resmi belgelerde (adli sicil, ikametgah vb.) maskeleme nasıl daha güvenli yapılır?

Belge özelliklerindeki (Metadata) gizli veriler maskeleme sırasında silinmeli mi?

Maskeleme rengi olarak beyaz kullanılabilir mi? (Görünmez Maskeleme)

Cevap: Evet, estetik nedenlerle siyah yerine beyaz blok (White Redaction) kullanılabilir.

Ancak bu yöntem çok daha risklidir. Okuyucu, oradaki boşluğun maskeleme olduğunu anlamayıp “boşluk” sanabilir. Ayrıca beyaz maskeleme yapıldığında, altındaki metin katmanının silindiğinden emin olunmazsa, kullanıcı boş alana tıklayıp “Ctrl+A” yaptığında gizli metni kopyalayabilir. Bu yüzden beyaz maskelemede ekstra dikkat gerekir.

Maskelenmiş bir belge hukuki geçerliliğini yitirir mi?

Bu yazıyı değerlendirmek için oy kullanın!
[Toplam: 2 Ortalama: 4.5]