Yeni bir laptop alma düşüncesi, birçok kişi için hem heyecan verici hem de kafa karıştırıcı bir süreç. Piyasada sayısız modelin bulunması, doğru bütçeyi belirlemeyi zorlaştırabilir. Web sitelerini tek tek gezmek ve mağazalarda saatler geçirmek yerine, Python programlama dili ve istatistiksel analiz yöntemleriyle bu süreci çok daha akıllıca yönetmek mümkün. Bu rehberde laptop alma kararınızı optimize etmeniz için pratik bir yol haritası paylaşıyoruz.
Neden Bir Fiyat Tahmincisi Oluşturulmalı?
Laptop piyasasındaki çeşitlilik, çoğu zaman doğru ürünü doğru fiyata bulmayı karmaşıklaştırır. Saatler süren detaylı araştırmalar yerine, istenen RAM miktarı veya ekran çözünürlüğü gibi teknik özellikler girilerek bir fiyat tahmini sunabilen otomatik bir araca sahip olmak büyük kolaylık sağlayabilir. Bu uygulama, hem zaman kazandırır hem de fazla ödeme riskini azaltır.
İstatistiksel yöntemlerden biri olan doğrusal regresyon bilgisiyle bu tür bir fiyat tahmin modeli oluşturulabilir. Veri analizi alanında oldukça popüler bir dil olan Python, bilgisayar bilimi geçmişi olmayan kişilerin bile kolayca öğrenebileceği kadar basit yapısı ve güçlü kütüphaneleri sayesinde bu tür projeler için ideal bir araç olarak öne çıkar.
Python İstatistik Araç Takımını Hazırlamak
Bu projeyi gerçekleştirmek için Python ekosisteminde yer alan bazı temel kütüphaneleri kullanmak gerekiyor. Geliştirme süreci için sistemden izole bir Python ortamı oluşturmak önemli çünkü çoğu sistemde kurulu olan Python, sistem işlevselliği için kullanılıyor ve doğrudan kullanıcı projelerine ayrılmıyor. Bu nedenle VirtualEnv gibi araçlarla özel ve izole bir geliştirme ortamı kurmak önerilir.
Daha gelişmiş kullanıcılar için Mamba, paket yönetimi ve ortam kurulumu açısından hızlı ve pratik bir alternatif. Windows kullanıcıları için Windows Alt Sistemi için Linux (WSL) üzerinden bu ortamlar rahatlıkla kurulabilir. Kurulum adımları için kütüphanelerin resmî sayfalarındaki yönergeler takip edilebilir.
- NumPy: Bu kütüphane, istatistiksel ve doğrusal cebir hesaplamaları gibi sayısal işlemler için temel oluşturur.
- Pandas: Veri setlerini “veri çerçevesi” olarak içe aktarmayı ve işlemeyi sağlar. İlişkisel bir veri tabanı ile elektronik tablo arasında köprü görevi görür ve güçlü veri manipülasyonu imkânları sunar.
- Seaborn: İstatistiksel verilerin görselleştirilmesi için kullanılır. Histogramlar, dağılım grafikleri ve doğrusal regresyon çizgileriyle veri dağılımlarını anlaşılır kılar.
- Pingouin: Çeşitli istatistiksel testleri kolayca yapmaya yarar. Perakende fiyatının laptop özelliklerine göre çoklu doğrusal regresyon modelini bu kütüphane oluşturur.
Mamba kurulduktan sonra aşağıdaki komut yardımıyla istatistik analiz ortamı etkinleştirilebilir:
Python kodlarının yazılması ve çalıştırılması için Jupyter Notebook, kullanıcı dostu bir arayüz sunar. Bu sayede hem kodları satır satır çalıştırabilir hem de grafiksel sonuçları anında görebilirsiniz. Ayrıca programın not defteri olarak kullanılabilmesi, ilerideki analizler için kayıt tutmayı da kolaylaştırır.
Projeye dair örnek kodlara ve veri setlerine GitHub bağlantısı üzerinden erişebilirsiniz. Bu kaynaklar, modelin eğitilmesi, test edilmesi ve farklı özelliklerin denemesi açısından büyük kolaylık sağlar.
Laptop Verilerini Edinme
Laptop fiyatlarını tahmin etmek için öncelikle kapsamlı ve doğru bir veri seti gerekir. Bu veri seti, genellikle yoğun bir veri toplama ve temizleme sürecinden geçer. Neyse ki, bu aşama çoğu zaman hazır olarak sunuluyor. Örneğin Kaggle gibi veri paylaşım platformlarında; CPU hızı, RAM kapasitesi, depolama alanı, ekran çözünürlüğü gibi donanım özelliklerini içeren laptop veri tabanları mevcut.
Veri setindeki fiyatlar genellikle döviz cinsinden olur. Xe.com üzerinden güncel döviz kuru kontrolünü gerçekleştirebilirsiniz. Böylece fiyat karşılaştırmalarını daha kolay yapabilirsiniz.
Regresyon Modelini Oluşturma Aşamaları
Ortam kurulumları tamamlandıktan ve veriler temin edildikten sonra, laptop fiyat tahmin modelinin geliştirilmesine geçilir. İlk adım olarak projede kullanılacak Python kütüphaneleri içe aktarılır:
Burada NumPy, Pandas, Seaborn ve Pingouin kütüphaneleri sırasıyla np
, pd
, sns
, pg
kısaltmalarıyla kullanılmak üzere yüklenir. %matplotlib inline
komutu ise Jupyter’de oluşturulan grafiklerin doğrudan sayfa içinde görüntülenmesini sağlar.
Ardından laptop verileri Pandas ile içe aktarılır:
Bu komut, CSV formatındaki verileri bir Pandas veri çerçevesine dönüştürür.
Veri yapısı ve içeriği, aşağıdaki komutla ilk birkaç satır incelenebilir:
Veri setindeki sayısal sütunlar hakkında temel istatistiksel bilgiler, ortalama, medyan, standart sapma, minimum, maksimum ve çeyrek değerler gibi özet bilgileri görmek için describe()
metodu kullanılır:
Veri dağılımını görselleştirmek, model kurulumundaki önemli adımlardan biri. Seaborn kütüphanesinin displot
fonksiyonuyla fiyatların dağılımı grafiksel olarak incelenebilir:
Bu grafik, fiyatların sağa doğru belirgin bir çarpıklık gösterdiğini ortaya koyar.
Model, laptopların çeşitli teknik özelliklerine bağlı olarak fiyat tahmini yapar. Matematiksel olarak temel yapı şu şekilde:
Burada a, b, c gibi katsayılar, regresyon analizi ile belirlenen ağırlıkları temsil ediyor. Bu ağırlıklar, her bir özelliğin fiyat üzerindeki etkisini gösteriyor. Bu durum, tek değişkenli doğrusal regresyondaki doğru çizgi yaklaşımının çok değişkenli bir versiyonu olarak bir düzlem veya hiper düzlemin oluşturulması anlamına geliyor.
Modeli oluşturmak için Pingouin kütüphanesinin linear_regression
fonksiyonu kullanılır. Bu fonksiyon, fiyatı açıklayan değişkenlerin etkilerini ve modelin başarısını hesaplar:
Burada:
- İlk argüman olarak bağımsız değişkenler yani boyut, RAM miktarı, ağırlık, ekran genişliği, ekran yüksekliği, CPU frekansı, birincil ve ikincil depolama gibi teknik özellikleri listelenir.
- İkinci argüman, tahmin edilmek istenen fiyat değişkeni.
relimp=True
parametresi, her değişkenin fiyat üzerindeki katkısını hesaplar.
Fonksiyon, katsayıları ve modelin başarı metriği olan r2
değerini verir. r2
, modelin veriye ne kadar iyi uyduğunu gösterir. Yaklaşık 0.66 gibi bir değer, modelin iyi bir uyum sağladığını ifade eder.
Fiyat Tahmin Fonksiyonunun Oluşturulması
Regresyon analizinden elde edilen katsayılarla kullanıcıların belirttiği teknik özelliklere göre fiyat tahmini yapılabilir. Örnek bir fonksiyon:
Bu fonksiyon, belirtilen parametreleri alarak tahmini fiyatı döndürür. Katsayılar, regresyon analizi sonucunda belirlenir ve her değişkenin fiyat üzerindeki etkisini sayısal olarak gösterir.
Markalar Arası Fiyat Farklılıkları
Yukarıdaki regresyon modeli yalnızca teknik özelliklere odaklanır. Ancak laptop markasının fiyat üzerindeki etkisi merak konusu olabilir. Bu farkın istatistiksel olarak anlamlı olup olmadığını belirlemek için varyans analizi (ANOVA) yapılabilir. Fiyat verilerinin çarpık dağılım göstermesi nedeniyle parametrik olmayan bir yöntem olan Kruskal-Wallis testi, daha uygun ve doğru sonuç verir. Bu testi Pingouin kütüphanesi ile kolayca gerçekleştirebilirsiniz.
Test, fiyat ile marka arasında ilişki olmadığına dair boş hipotezi sınar:
Elde edilen p-değeri, 0 olarak bulunur. Bu sonuç, fiyatın marka tarafından istatistiksel açıdan anlamlı bir şekilde etkilendiğini gösterir. P-değerinin yuvarlanması, sonucu daha net ifade etmek amacıyla yapılır; aksi hâlde bilimsel gösterimle sunulurdu. Bu durumda boş hipotez reddedilir ve markanın, fiyatın önemli bir tahmin unsuru olduğu kabul edilir.
Bu analizler sayesinde teknik özelliklere dayalı bir laptop için adil fiyat belirlemeye imkân veren bir tahmin aracı oluşturulabilir. Python ve güçlü veri analizi kütüphaneleri, elle yapılması zor olan karmaşık istatistiksel hesaplamaları birkaç satır kodla hızlıca gerçekleştirebilme imkânı sunar.
Özetle laptop satın almak, karmaşık bir karar gibi görünse de doğru analiz yöntemleriyle bu süreç önemli ölçüde kolaylaşıyor. Python’ın veri işleme ve analiz gücü sayesinde teknik özellikler ve marka etkisi göz önünde bulundurularak güvenilir fiyat tahminleri yapılabiliyor. Bu rehberde sunulan yöntemlerle kullanıcılar, bilinçli seçimler yaparak gereksiz harcamalardan kaçınabilir ve ihtiyaçlarına en uygun laptopu rahatlıkla bulabilirler.
Kaynak: www.howtogeek.com