Veri Analizi Projelerim - 4 - Banka Müşterisi Mevduat Tahmini

Merhaba! Bugün sizler ile Veri Analizi ile ilgili yaptığım projelerimi anlatacağım. Toplamda 4 proje yaptım ve sizlere bu gönderide bir tanesini anlatacağım!


denizhan-şahin-ver-analizi-data-science-analytics-project

Veri Seti Özellikleri

Veri seti 17 sütun ve 11162 satır veriden oluşmaktadır. 
age : Banka müşterisi ile ilgili yaş verisi
job : Müşterinin iş bilgisi
marital : Müşterinin medeni durumu
education : Eğitim bilgisi
default : Bir müşteri no ise borç ödemesinde sıkıntı yok, yes ise borç ödemede sıkıntısı vardır.
balance : Bir müşterinin bakiye durumu ile ilgili borçlanması ve kar elde etmesi - birim türünde
housing : Müşteriye ait konut kredisi bilgisidir. no ise konut kredisi yok, yes ise vardır.
loan : Müşteriye ait borç bilgisidir. no ise kredi yoktur , yes ise kredi vardır.
contact : Müşteri ile ilgili iletişim bilgisidir. cellular ise tel veya sms ile iletişim demektir. unknow ise iletişim bilgisi yoktur. telephone ise bir müşteriye sabit telefon ile iletişim kurulduğunu gösterir.
day : Gün bilgisi
month : Ay bilgisi
duration : Müşteri ile ilgili iletişim süresidir.
campaign : Kampanyalara göre her bir  kampanyanın pazarlanma sayısıdır.
pdays : Gün bilgisi, müşteri ile ilgili en son temas günü, eksi değerle hiç temas yapılmadığını gösterebilir.
previous : Müşterinin önceki kampanyalara verdiği cevapların sayısıdır.
poutcome : Kampanya bilgilerinin sonucudur. unknown bilgi yok demektir. failure bu değer önceki kampanyaların başarısız olduğunu gösterir. success ise kampanyanın başarılı olduğunu gösterir. other kategorisi belli olmayan bilgilerdir.
deposit : Depozito ile bir müşterinin mevduat hesabı olup olmadığı incelenir. yes ise müşterinin mevduat hesabı vardır no ise yok demektir.

Veri seti üzerinde herhangibir boş veri bulunmamaktadır.
Age-yaş sütununda 496 ile 31 yaş verisi en çok bulunmaktadır.
Job-iş  sütununda ise management mesleği 2566 ile en çok bulunmaktadır.
Marital-medeni sütununda ise 6351 kişi evli, 3518 kişi bekar, 1293 kişi ise boşanmıştır.
Education-eğitim sütununda ise 497 kişi eğitim hakkında bilgi yoktur, 5476 kişi ikincil eğitim, 3689 kişi üçüncül ve 1500 kişi ise öncelikli eğitim içindedir.
5881 kişi ev kredisi almıştır ve 5281 kişi ev kredisi almamaktadır.

denizhan-şahin-ver-analizi-data-science-analytics-project


Veri Görselleştirme

Matplotlib ile figsize=30,30 olan figure olan bir nesne oluşturulmuştur. Barh, Bar, Pie ile grafikler oluşturulmuştur. Her bir sütunun diğer bir sütun ile ilişkilendirilmesi ile ilgili Seaborn ile Pairplot, Matplotlib ile Show fonksiyonları ile grafik çizimi yapılmıştır.

denizhan-şahin-ver-analizi-data-science-analytics-project


Veri Seti Düzenleme

Marital, job, education, housing vb. Sütunlar Sklearn Preprocessing içinde yer alan LabelEncoder ile sayısal olmayan veriler sayısal verilere dönüştürülmüştür.

denizhan-şahin-ver-analizi-data-science-analytics-project


Veri Seti Korelasyon

Duration ile deposit sütunları arasındaki ilişki 0.45, pdays ve previous için ise 0.51 aralarındaki ilişki düzeyleri en yüksektir.

denizhan-şahin-ver-analizi-data-science-analytics-project

denizhan-şahin-ver-analizi-data-science-analytics-project



Makine Öğrenmesi için  Veri Parçalama

Y değeri ile istenen deposit, mevduat hesabı bilgisi, tahmin edilmek istenmiştir. x_train,x_test,y_train,y_test için ise Sklearn Model Selection için train_test_split fonksiyonu kullanılmıştır.  Ayrıca x_train, x_test ise Sklearn içinde yer alan Preprocessing içindeki MinMaxScaler ile bir aralık içinde indirgenmiştir.


Sklearn RandomForestRegressor ile Tahmin

Karar ağaç sayısı olarak 10 sayısı belirlenmiştir. Random_state ise 0 olarak belirlenmiştir. Daha sonra X ve Y ile model eğitimi yapılmıştır.

TensorFlow ile Tahmin

İlk katman 30 nörondan oluşturulmuş ve diğer iki katman 15 nöron ile oluşturulmuştur. Bu katmanlar için ise ReLu fonksiyonu kullanılmıştır. Loss için ise MeanSquaredError kullanılmış ve optimizer olarak Adam fonksiyonu kullanılmıştır. Daha sonra model eğitimi yapılmış ve loss değerleri için görselleştirme yapılmıştır. Tahmin işlemi ise belirlenmiş satırlar kullanılarak yapılmıştır.



denizhan-şahin-ver-analizi-data-science-analytics-project

Yorum Gönder

Yorum yaptığınız için teşekkürler :)

Daha yeni Daha eski