Dijital arşiv projelerinde “hata” tamamen sıfırlanamaz; ancak hata eşiği doğru tanımlanırsa hatalar kontrollü, ölçülebilir ve düzeltilebilir hale gelir. Hata eşiği belirlemek; proje sonunda tartışma yaşamamak, yeniden tarama maliyetini yönetmek ve teslimi objektif kabul kriterine bağlamak için zorunludur.
Serinin ana yol haritası: Dijital Arşiv Sistemine Geçiş Nasıl Olur?
Hata Eşiği Nedir? (Kısa Tanım)
Hata eşiği; tarama, OCR ve indeksleme süreçlerinde kabul edilebilir hata oranının hangi metrikle, hangi belge grubunda, hangi kontrol yöntemiyle ölçüleceğini ve eşik aşıldığında hangi aksiyonun uygulanacağını tanımlar.
Hata eşiği tanımlanmamış projelerde şu olur:
- “Bu kabul edilir mi?” tartışması proje sonunda başlar
- Yeniden tarama / düzeltme süresi öngörülemez
- QC raporları karar üretmez, sadece listeye dönüşür
Bu yüzden hata eşiği, kalite kontrol planının bir parçası olarak yazılmalıdır:
Kalite Kontrol Planı Nasıl Hazırlanır?
1) Hata Türlerini Sınıflandırmadan Eşik Belirleyemezsiniz
Kurumsal projelerde hata, tek bir kategori değildir. Eşikler hata türüne göre ayrı yazılır:
A) Tamlık hataları (Eksik sayfa / atlanan sayfa)
- En kritik hatadır.
- Denetim ve kanıt niteliği olan dosyalarda kabul edilmez yaklaşımı gerekir.
Eksik sayfa riskinin kaynağı çoğu zaman multi-feed’tir:
Çoklu Besleme Algılama ve Belge Koruma Sistemleri
B) Görüntü kalite hataları (okunamazlık, kırpma, eğrilik)
- “Belge var ama kullanılamaz” sınıfıdır.
- Eşik; belge türüne göre “kritik alan okunabilirliği” üzerinden tanımlanmalıdır.
Görüntü düzeltme ve eğrilik giderme bu sınıfı düşürür:
Sayfa Eğrilik Giderme ve Otomatik Görüntü Düzeltme Teknolojileri
C) OCR hataları (aranabilirlik başarısızlığı)
- Metin aramada değer üreten projelerde önemlidir.
- Eşik, belge grubuna göre ve ölçüm yöntemiyle birlikte verilir.
Ölçüm yöntemi:
OCR Doğruluk Oranı Nasıl Ölçülür?
D) İndeks/Meta veri hataları (yanlış alan, eksik alan, yanlış eşleşme)
- Arama performansını düşürür, yanlış dosyalamaya yol açar.
- Eşik; “zorunlu alan doluluğu + validasyon uyumu” üzerinden yazılmalıdır.
Meta veri standardı:
Kurumsal Meta Veri Standardı Nasıl Oluşturulur?
2) “Tek Eşik” Yoktur: Belge Riskine Göre Eşik Değişir
Her belge grubu aynı riski taşımaz. Bu yüzden eşikleri risk seviyesine göre ayırın:
- Kritik/Riskli Belgeler: (özlük, sözleşme, hukuk, KVKK kapsamı)
- Tamlık hatası toleransı çok düşüktür
- QC daha sık ve daha derin yapılır
Riskli grupları tanımlamak için:
Riskli Belgeler Nasıl Tespit Edilir?
- Standart Belgeler: (rutin yazışma, standart formlar, düşük risk)
- Örnekleme ile izlenebilir
- Hata eşiği, operasyon hızını koruyacak şekilde kurgulanır
3) Hata Eşiği Hangi Metriğe Göre Ölçülecek?
Eşiği “% kaç hata” diye yazmak yetmez; önce metrik netleşir:
Tamlık metrikleri
- Batch bazında eksik sayfa olay sayısı
- Beklenen sayfa – gerçek sayfa tutarlılığı
Görüntü kalitesi metrikleri
- Okunamaz sayfa oranı
- Kırpma hatası oranı (imza/mühür kesilmesi)
- Eğrilik/dönüklük oranı
OCR metrikleri
- Kelime doğruluğu (genel arama)
- Alan doğruluğu (belge no, tarih gibi kritik alanlar)
İndeks metrikleri
- Zorunlu alan doluluk oranı
- Validasyon ihlali oranı
- Yanlış belge türü/alan seti eşleşmesi
4) Örnekleme mi %100 Kontrol mü? (Eşiği Uygulatacak Karar)
Hata eşiği; kontrol yöntemiyle birlikte çalışır.
- Kritik belgeler: %100 kontrol (özellikle tamlık ve kırpma hatalarında)
- Standart belgeler: örnekleme (batch bazında belirlenen oran)
Örnekleme oranını artırmanın en doğru yolu, işi batch mantığıyla yönetmektir:
Büyük Arşivlerde Batch Mantığıyla Çalışma
5) Eşik Aşıldığında Ne Olacak? (Aksiyon Planı Yazılmadan Eşik İşe Yaramaz)
Hata eşiği; “eşik aşıldı” dediğiniz anda otomatik bir aksiyon doğurmalıdır. Kurumsal projelerde en pratik 4 aksiyon seviyesi:
Seviye 1: Düzeltme (lokal)
- İndeks alanı düzeltme
- Görüntü profili küçük ayarı
- Operatör uyarısı
Seviye 2: Yeniden tarama (kısmi)
- Sorunlu sayfaların/klasörün yeniden taranması
- Kırpma veya okunamazlık hatasında hızlı geri dönüş
Seviye 3: Profil/standart revizyonu (sistemik)
- DPI/renk modu/format veya görüntü düzeltme profili güncellenir
- OCR ayarları belge grubuna göre revize edilir
Bu kararların temeli tarama standardıdır:
Kurumsal Tarama Standardı Nasıl Oluşturulur?
Seviye 4: Pilot tekrar (kritik)
- Eşik sürekli aşılıyorsa büyük üretimi durdurup pilotu tekrar etmek gerekir
Pilot yaklaşımı:
Dijital Arşiv Pilot Çalışması Nasıl Yapılır?
6) Uygulanabilir “Hata Eşiği Şablonu” (Belge Grubu Bazında)
Hata eşiğini belge grubu bazında tek sayfalık şablona bağlayın:
- Belge grubu: ______
- Risk seviyesi: düşük / orta / yüksek
- Kontrol yöntemi: örnekleme / %100
- Tamlık kriteri: (eksik sayfa toleransı + kontrol yöntemi)
- Görüntü kriteri: (okunabilirlik + kırpma + eğrilik)
- OCR kriteri: (kelime/alan doğruluğu hedefi)
- İndeks kriteri: (zorunlu alan doluluğu + validasyon)
- Eşik aşımı aksiyonu: Seviye 1/2/3/4
- Raporlama periyodu: günlük / haftalık / batch bazlı
Bu şablon, kabul testlerini de netleştirir:
Canlıya Geçiş Öncesi Kabul Testleri
7) Hata Eşiğini Düşüren 5 Kalıcı İyileştirme
- Hazırlık standardını disipline etmek (zımba/ataş, yıpranmış sayfa, sıralama)
- Multi-feed tespitinde “dur–kontrol–devam” kuralını zorunlu kılmak
- Görüntü düzeltme profillerini belge türüne göre ayırmak
- İndeks alanlarını liste ve validasyonla korumak
- Pilot ölçümleriyle standardı kilitlemek
Mini Kontrol Listesi
- Hata türleri (tamlık/görüntü/OCR/indeks) ayrı mı?
- Eşikler belge grubuna ve risk seviyesine göre mi?
- Kontrol yöntemi (örnekleme/%100) tanımlı mı?
- Eşik aşımında aksiyon planı yazılı mı?
- QC raporları batch bazında karar üretiyor mu?
Kurumunuza Uygun Hata Eşiği ve Kabul Kriterini Netleştirelim
Kurumsal operasyon modeli: Kurumsal Dijital Arşiv Hizmetleri
Planlama ve teklif için: Fiyat Teklifi Alın

