UZUNLUK, KIRP, TEMİZ — Metin Temizleme Yöntemleri

Veri Temizliği Niye Bu Kadar Önemli?

Excel kullanıcılarının yaşadığı en yaygın sorunlardan biri başkasından gelen dosyadaki kirli veridir. Hücrelerin başında ve sonunda görünmez boşluklar, satır içine sızmış kontrol karakterleri, web kaynaklarından kopyalanan ekstra karakterler raporları sessizce sabote eder. DÜŞEYARA çalışmaz, EĞERSAY beklenenden farklı sayar, eşleştirme sütunları boş döner. İşte bu noktada üç temizleyici fonksiyon devreye girer: UZUNLUK, KIRP ve TEMİZ.

Bu üçlü, raporu görünür kılmak yerine arka planda çalışır ama etkisi muazzamdır. Bir saatlik manuel temizliği saniyelere indirir, bilinmeyen hataların kaynaklarını ortaya çıkarır.

UZUNLUK: Karakter Sayma

UZUNLUK, İngilizce sürümünde LEN olarak geçer ve bir hücredeki karakter sayısını döndürür.

=UZUNLUK(A2)

A2 hücresindeki karakter sayısını verir. İlk bakışta basit görünür ama veri temizliğinin teşhis aracıdır. İki hücrenin görsel olarak aynı görünmesine rağmen UZUNLUK farklı sonuç döndürüyorsa bu hücrelerden birinde gizli boşluk veya kontrol karakteri vardır. Stok kodlarınızın hepsi sekiz karakter olmalıyken bazılarının dokuz karakter çıkması bir sorun göstergesidir.

KIRP: Ekstra Boşlukları Silme

KIRP, İngilizce sürümünde TRIM olarak geçer ve metnin başındaki ve sonundaki boşlukları siler. Aynı zamanda kelimeler arasındaki birden fazla boşluğu tek boşluğa indirger.

=KIRP(A2)

A2'deki metnin başındaki ve sonundaki tüm boşlukları, ayrıca aradaki çift boşlukları temizler. Müşteri adlarının başına yanlışlıkla konmuş boşluğu DÜŞEYARA fark etmez ve eşleşme bulamaz; KIRP bu sorunu kökünden çözer.

TEMİZ: Görünmeyen Karakterleri Silme

TEMİZ, İngilizce sürümünde CLEAN olarak geçer ve metinden yazdırılamayan karakterleri kaldırır. Web sayfalarından kopyalanan veride satır sonu, sekme ve diğer kontrol karakterleri sıkça görülür.

=TEMİZ(A2)

A2 hücresindeki yazdırılamayan tüm karakterleri siler. Web'den kopyalanan veride ilk yapılması gereken işlemlerden biridir.

Üçünü Birlikte Kullanmak

Veri temizliği için tek başlarına çalışmak yerine üç fonksiyonu zincirlemek genellikle en iyi sonucu verir.

=KIRP(TEMİZ(A2))

Bu kombinasyon önce kontrol karakterlerini siler, sonra boşlukları sıkıştırır. Web sayfasından kopyalanan tablolar için altın standarttır. UZUNLUK fonksiyonu temizleme öncesi ve sonrasında karşılaştırma için kullanılır:

=UZUNLUK(A2)-UZUNLUK(KIRP(TEMİZ(A2)))

Bu formül kaç karakterin temizlendiğini gösterir. Sıfırdan büyük çıkan satırlarda gizli problem vardır.

Görünmez Karakter Avı

KIRP yalnızca standart boşlukları temizler. Bazı web sitelerinden gelen verilerde özel boşluk karakterleri vardır, bunları KIRP yakalayamaz. Karakter kodu 160 olan bağlanmasız boşluk klasik bir örnektir. Bu durumda YERİNEKOY fonksiyonu ile karakteri standart boşluğa çevirip sonra KIRP'lemek gerekir.

=KIRP(YERİNEKOY(A2; DAMGA(160); " "))

DAMGA fonksiyonu numaraya göre karakter üretir, 160 numaralı karakter web kaynaklı en yaygın sıkıntıdır.

Senaryolar

  1. DÜŞEYARA çalışmıyor uyarısı. Eşleşmesi gereken iki sütunu yan yana koyup KIRP'lediğinizde aniden tüm sonuçların gelmesi klasik bir senaryodur. Sebep gizli boşluklardır.
  2. Web'den kopyalanan tablo. Tüm sütunları KIRP TEMİZ kombinasyonuyla geçirmek raporun yarısını kurtarır.
  3. SAP ya da kurumsal yazılım çıktısı. Bu sistemler sık sık satır sonu karakterleri ekler. TEMİZ ilk durakta kullanılması gereken fonksiyondur.
  4. Stok kodu uzunluk denetimi. UZUNLUK ile beklenen değeri karşılaştırarak hatalı kodları işaretlemek: =EĞER(UZUNLUK(A2)<>8; "Hata"; "Tamam").

Sık Yapılan Hatalar

  • KIRP'in yetmemesi. Bağlanmasız boşluk gibi özel karakterleri KIRP yakalayamaz. YERİNEKOY ile birlikte kullanılması gerekir.
  • UZUNLUK'a güvenip görsel kontrol etmemek. UZUNLUK doğru sayar ama hangi karakterin sorun olduğunu söylemez. Detayda KOD ve PARÇAAL ile karakter karakter inceleme gerekir.
  • Yardımcı sütun unutkanlığı. KIRP'lediğiniz sütunu kopyala-değer yapıştır yapıp eski sütunu silmek iş akışını sürdürülebilir kılar.
  • TEMİZ'in yıkıcılığı. Bu fonksiyon karakter kodu 32'nin altındakileri siler. Bilerek satır sonu kullandığınız hücreleri bozar; uygulanacağı sütun konusunda dikkatli olun.

İleri Seviye İpucu

Microsoft 365 sürümünde XLOOKUP ile birlikte KIRP'i dizi olarak uygulayabilirsiniz, bu sayede yardımcı sütun açmadan eşleşme alabilirsiniz. Eski sürümlerde yardımcı sütun yöntemine sadık kalmak en güvenlisidir. İlgili: UZUNLUK, KIRP, TEMİZ.

Sonuç

UZUNLUK, KIRP ve TEMİZ veri temizliğinin sessiz kahramanlarıdır. Görünmez gibi dururlar ama olmasalar raporlarınızın yarısı çalışmazdı. Kötü çalışan bir DÜŞEYARA gördüğünüzde ilk şüpheli bunlardır; bir hafta her ham veride önce bu üçlüyü uygulama alışkanlığı kazanırsanız Excel hayatınız kalıcı biçimde rahatlayacaktır.