Power Query ile Veri Temizleme
Veri Temizleme — En Uzun İş
Bir veri analistinin zamanının yüzde seksenin temizliğe gittiği söylenir. Ham veri her zaman düzensizdir: boş satırlar, fazla boşluklar, yanlış biçim, mükerrer kayıtlar, eksik değerler, karışık tarih formatları. Excel'de bu işlerin elle yapılması saatler alır; üstelik kaynak veri her ay yenilendiğinde aynı işi tekrar yapmak gerekir. Power Query; temizleme adımlarını sıralı bir tarif gibi kaydeder ve her yenilemede otomatik olarak tekrar çalıştırır. Bu yazıda en sık ihtiyaç duyulan temizleme dönüşümlerini gözden geçireceğiz.
Düzenleyiciye Geçmek
İçe aktardığınız sorguyu sağ tıklayıp Düzenle seçeneğine basın; Power Query Düzenleyicisi açılır. Sol tarafta sorgu listesi, ortada veri önizlemesi, sağda Uygulanan Adımlar paneli, üstte ise dönüşüm menüleri vardır. Tüm temizleme işlemleri buradan yapılır.
Boşluk ve Görünmez Karakterler
Metin sütunlarında baş ya da son boşluklar sık karşılaşılan bir sorundur. Sütuna sağ tıklayın, Dönüştür altından Kırp seçeneğine tıklayın. Görünmez karakterleri temizlemek için Temizle seçeneğini de kullanın. Excel'in KIRP ve TEMİZLE fonksiyonlarının Power Query karşılığıdır.
Tipi Doğru Belirlemek
Power Query her sütun için bir veri tipi tanır: metin, sayı, tarih, ondalık. Yanlış tip; sonraki adımları bozar. Sütun başlığındaki simgeye tıklayıp doğru tipi seçin. Tarih sütununda metin görüyorsanız hemen Tarih tipine çevirin. Bu adım sıralamayı, gruplamayı ve formülleri doğru çalıştırır.
Mükerrer Kayıt Temizleme
Sütun başlıklarına Ctrl ile tıklayarak benzersiz olması gereken sütunları seçin. Üstteki Giriş menüsünden Yinelenenleri Kaldır düğmesine tıklayın. Power Query yalnızca seçili sütunlardaki yinelemelere bakarak satırları siler. Bu yöntem; manuel filtre ve Excel formülleriyle saatler süren işin saniyeye inmiş hâlidir.
Boş Satır ve Sütun Kaldırma
Giriş menüsünden Satır Kaldır altında Boş Satırları Kaldır seçeneğini kullanın. Sütun bazında benzer bir seçenek de vardır. CSV ya da PDF tablolarından gelen verilerde sıkça karşılaşılan boş hücreleri temizler.
Sütun Bölme
"Ahmet Yılmaz" gibi tek sütunda toplanmış veriyi ayırmak için Dönüştür altından Sütunu Böl seçeneğini açın. Ayraca göre, karakter sayısına göre, büyük-küçük harf değişimine göre veya konuma göre bölebilirsiniz. Excel'in Metni Sütunlara Dönüştür özelliğinden çok daha güçlüdür; çünkü adımlar kaydedilir, gelecek aylarda otomatik çalışır.
Sütun Birleştirme
Birden çok sütunu Ctrl ile seçtikten sonra Dönüştür altındaki Sütunları Birleştir düğmesine tıklayın; ayraç sorulur. Ad ve Soyad sütunlarını "Tam İsim" olarak birleştirmek; en sık örneklerden biridir.
Değer Değiştirme
Sütun üzerinde sağ tıklayıp Değerleri Değiştir seçeneğine basın. Bir değer ya da metin parçasını başkasıyla değiştirir; raporlarda yer alan kısaltmaları açmak ya da yanlış yazılmış kategori isimlerini düzeltmek için pratiktir. Birden çok satırda manuel düzeltme yapmak yerine tek adımda halledilir.
Sütun Pivotunu Kaldırma
Yatay biçimde aylar olan tabloyu (Ocak Şubat Mart sütunları) dikey biçime çevirmek (Ay sütunu altında değerler) için Dönüştür menüsünden Sütun Pivotunu Kaldır seçeneğine tıklayın. Bu adım pivot için ideal kaynak yapısı üretir; Excel'de elle yapması imkânsıza yakındır, Power Query'de tek hareket.
Tabloları Birleştirme
İki sorguyu birleştirmek için Sorguları Birleştir seçeneğini kullanın. SQL bilgisi olmayanlar için kullanışlı bir görsel arayüz sunar; sol birleştirme, iç birleştirme ya da dış birleştirme seçimi yaparsınız. Müşteri tablosu ile satış tablosunu kayıt eşleşmesiyle birleştirmek; en yaygın kullanım örneğidir.
Tabloları Alt Alta Eklemek
Aynı yapıda iki tabloyu alt alta birleştirmek için Sorguları Ekle seçeneğini kullanın. Aylık satış sorgularını yıllık tek tabloya çevirmek; bu komutla mümkündür. Klasördeki dosyaları otomatik birleştiren senaryonun küçük versiyonudur.
Hata Yönetimi
Bir sütunda dönüşüm hatası varsa Power Query satırı hata olarak işaretler. Sütun başlığındaki hata sayısını gösteren bağlantıya tıklayın; sadece hatalı satırları gösteren ayrı bir sorgu açılır. Düzeltir ya da o satırları silebilirsiniz. Bu yaklaşım kaynak veriyle ilgili problemleri görünür kılar.
Adım Sırası ve Bakım
Sağdaki Uygulanan Adımlar paneli; senin tarifindir. Bir adımı silebilir, üzerine yeni adım ekleyebilir, parametrelerini düzenleyebilirsin. Genel kural; tip belirleme adımlarını mümkün olduğunca erken yap, filtre ve birleştirme adımlarını sona bırak. Sorgu yenilemesi sırasındaki sürpriz hataların büyük bölümü; sırayı bozmaktan kaynaklanır.
Yükleme ve Yenileme
Tüm temizleme adımları bittikten sonra Giriş menüsünden Kapat ve Yükle düğmesine basın. Veri çalışma sayfasına çıkar ya da veri modeline gider. Kaynak veri değiştiğinde Veri menüsünden Tümünü Yenile dediğinizde tüm sorgu yeniden çalışır; tüm temizleme adımları aynı sırayla uygulanır. Manuel iş artık geride kalır.
Sonuç
Power Query ile veri temizleme; analist için manuel saatlerden algoritmik dakikalara geçiş demektir. Bir kez tarif yazılır, sonsuza kadar çalışır. Bu yazıdaki dönüşümleri kendi verinizle deneyin; ilk sorgunuzu kurmak yarım saat alır, ikinci sorguda zaman süresi düşer. Bir ay sonra "elle veri temizliyordum" cümlesi geçmişten gelen bir hatıraya dönüşür. Power Query'i öğrenmek; bir Excel kullanıcısının yapabileceği en akıllı zaman yatırımıdır.