Arşiv Projelerinde Hata Eşiği Nasıl Belirlenir? (Kabul Kriteri, Örnekleme ve Aksiyon Planı)

Dijital arşiv projelerinde “hata” tamamen sıfırlanamaz; ancak hata eşiği doğru tanımlanırsa hatalar kontrollü, ölçülebilir ve düzeltilebilir hale gelir. Hata eşiği belirlemek; proje sonunda tartışma yaşamamak, yeniden tarama maliyetini yönetmek ve teslimi objektif kabul kriterine bağlamak için zorunludur.

Serinin ana yol haritası: Dijital Arşiv Sistemine Geçiş Nasıl Olur?


Hata Eşiği Nedir? (Kısa Tanım)

Hata eşiği; tarama, OCR ve indeksleme süreçlerinde kabul edilebilir hata oranının hangi metrikle, hangi belge grubunda, hangi kontrol yöntemiyle ölçüleceğini ve eşik aşıldığında hangi aksiyonun uygulanacağını tanımlar.

Hata eşiği tanımlanmamış projelerde şu olur:

  • “Bu kabul edilir mi?” tartışması proje sonunda başlar
  • Yeniden tarama / düzeltme süresi öngörülemez
  • QC raporları karar üretmez, sadece listeye dönüşür

Bu yüzden hata eşiği, kalite kontrol planının bir parçası olarak yazılmalıdır:
Kalite Kontrol Planı Nasıl Hazırlanır?


1) Hata Türlerini Sınıflandırmadan Eşik Belirleyemezsiniz

Kurumsal projelerde hata, tek bir kategori değildir. Eşikler hata türüne göre ayrı yazılır:

A) Tamlık hataları (Eksik sayfa / atlanan sayfa)

  • En kritik hatadır.
  • Denetim ve kanıt niteliği olan dosyalarda kabul edilmez yaklaşımı gerekir.

Eksik sayfa riskinin kaynağı çoğu zaman multi-feed’tir:
Çoklu Besleme Algılama ve Belge Koruma Sistemleri

B) Görüntü kalite hataları (okunamazlık, kırpma, eğrilik)

  • “Belge var ama kullanılamaz” sınıfıdır.
  • Eşik; belge türüne göre “kritik alan okunabilirliği” üzerinden tanımlanmalıdır.

Görüntü düzeltme ve eğrilik giderme bu sınıfı düşürür:
Sayfa Eğrilik Giderme ve Otomatik Görüntü Düzeltme Teknolojileri

C) OCR hataları (aranabilirlik başarısızlığı)

  • Metin aramada değer üreten projelerde önemlidir.
  • Eşik, belge grubuna göre ve ölçüm yöntemiyle birlikte verilir.

Ölçüm yöntemi:
OCR Doğruluk Oranı Nasıl Ölçülür?

D) İndeks/Meta veri hataları (yanlış alan, eksik alan, yanlış eşleşme)

  • Arama performansını düşürür, yanlış dosyalamaya yol açar.
  • Eşik; “zorunlu alan doluluğu + validasyon uyumu” üzerinden yazılmalıdır.

Meta veri standardı:
Kurumsal Meta Veri Standardı Nasıl Oluşturulur?


2) “Tek Eşik” Yoktur: Belge Riskine Göre Eşik Değişir

Her belge grubu aynı riski taşımaz. Bu yüzden eşikleri risk seviyesine göre ayırın:

  • Kritik/Riskli Belgeler: (özlük, sözleşme, hukuk, KVKK kapsamı)
    • Tamlık hatası toleransı çok düşüktür
    • QC daha sık ve daha derin yapılır

Riskli grupları tanımlamak için:
Riskli Belgeler Nasıl Tespit Edilir?

  • Standart Belgeler: (rutin yazışma, standart formlar, düşük risk)
    • Örnekleme ile izlenebilir
    • Hata eşiği, operasyon hızını koruyacak şekilde kurgulanır

3) Hata Eşiği Hangi Metriğe Göre Ölçülecek?

Eşiği “% kaç hata” diye yazmak yetmez; önce metrik netleşir:

Tamlık metrikleri

  • Batch bazında eksik sayfa olay sayısı
  • Beklenen sayfa – gerçek sayfa tutarlılığı

Görüntü kalitesi metrikleri

  • Okunamaz sayfa oranı
  • Kırpma hatası oranı (imza/mühür kesilmesi)
  • Eğrilik/dönüklük oranı

OCR metrikleri

  • Kelime doğruluğu (genel arama)
  • Alan doğruluğu (belge no, tarih gibi kritik alanlar)

İndeks metrikleri

  • Zorunlu alan doluluk oranı
  • Validasyon ihlali oranı
  • Yanlış belge türü/alan seti eşleşmesi

4) Örnekleme mi %100 Kontrol mü? (Eşiği Uygulatacak Karar)

Hata eşiği; kontrol yöntemiyle birlikte çalışır.

  • Kritik belgeler: %100 kontrol (özellikle tamlık ve kırpma hatalarında)
  • Standart belgeler: örnekleme (batch bazında belirlenen oran)

Örnekleme oranını artırmanın en doğru yolu, işi batch mantığıyla yönetmektir:
Büyük Arşivlerde Batch Mantığıyla Çalışma


5) Eşik Aşıldığında Ne Olacak? (Aksiyon Planı Yazılmadan Eşik İşe Yaramaz)

Hata eşiği; “eşik aşıldı” dediğiniz anda otomatik bir aksiyon doğurmalıdır. Kurumsal projelerde en pratik 4 aksiyon seviyesi:

Seviye 1: Düzeltme (lokal)

  • İndeks alanı düzeltme
  • Görüntü profili küçük ayarı
  • Operatör uyarısı

Seviye 2: Yeniden tarama (kısmi)

  • Sorunlu sayfaların/klasörün yeniden taranması
  • Kırpma veya okunamazlık hatasında hızlı geri dönüş

Seviye 3: Profil/standart revizyonu (sistemik)

  • DPI/renk modu/format veya görüntü düzeltme profili güncellenir
  • OCR ayarları belge grubuna göre revize edilir

Bu kararların temeli tarama standardıdır:
Kurumsal Tarama Standardı Nasıl Oluşturulur?

Seviye 4: Pilot tekrar (kritik)

  • Eşik sürekli aşılıyorsa büyük üretimi durdurup pilotu tekrar etmek gerekir

Pilot yaklaşımı:
Dijital Arşiv Pilot Çalışması Nasıl Yapılır?


6) Uygulanabilir “Hata Eşiği Şablonu” (Belge Grubu Bazında)

Hata eşiğini belge grubu bazında tek sayfalık şablona bağlayın:

  • Belge grubu: ______
  • Risk seviyesi: düşük / orta / yüksek
  • Kontrol yöntemi: örnekleme / %100
  • Tamlık kriteri: (eksik sayfa toleransı + kontrol yöntemi)
  • Görüntü kriteri: (okunabilirlik + kırpma + eğrilik)
  • OCR kriteri: (kelime/alan doğruluğu hedefi)
  • İndeks kriteri: (zorunlu alan doluluğu + validasyon)
  • Eşik aşımı aksiyonu: Seviye 1/2/3/4
  • Raporlama periyodu: günlük / haftalık / batch bazlı

Bu şablon, kabul testlerini de netleştirir:
Canlıya Geçiş Öncesi Kabul Testleri


7) Hata Eşiğini Düşüren 5 Kalıcı İyileştirme

  • Hazırlık standardını disipline etmek (zımba/ataş, yıpranmış sayfa, sıralama)
  • Multi-feed tespitinde “dur–kontrol–devam” kuralını zorunlu kılmak
  • Görüntü düzeltme profillerini belge türüne göre ayırmak
  • İndeks alanlarını liste ve validasyonla korumak
  • Pilot ölçümleriyle standardı kilitlemek

Mini Kontrol Listesi

  • Hata türleri (tamlık/görüntü/OCR/indeks) ayrı mı?
  • Eşikler belge grubuna ve risk seviyesine göre mi?
  • Kontrol yöntemi (örnekleme/%100) tanımlı mı?
  • Eşik aşımında aksiyon planı yazılı mı?
  • QC raporları batch bazında karar üretiyor mu?

Kurumunuza Uygun Hata Eşiği ve Kabul Kriterini Netleştirelim

Kurumsal operasyon modeli: Kurumsal Dijital Arşiv Hizmetleri
Planlama ve teklif için: Fiyat Teklifi Alın