Amazon’da Bir Ürünü Skorlama & Yorum Sıralama
Merhaba!
Çeşitli platformlardan bir ürün almadan önce mutlaka puan ve yorumlarına bakıyoruz.
Peki ürün puanlarını ve yorumlarını nasıl sıralayabiliriz?
Bu yazıda, bir ürünün puanını daha doğru hesaplamaya ve yorumlarını daha doğru sıralamaya çalışacağız.
Veri Seti Hikayesi
Amazon ürün verilerini içeren bu veri seti ürün kategorileri ile çeşitli metadataları içermektedir.
Elektronik kategorisindeki en fazla yorum alan ürünün kullanıcı puanları ve yorumlarını içeren alt dataframe üzerinden ilerleyeceğiz.
Değişkenler
reviewerID: Kullanıcı ID
asin: Ürün ID
reviewerName: Kullanıcı Ad
helpful: Faydalı Yorum Derecesi
reviewText: Yorum
overall: Ürün Rating’i
summary: İnceleme Özeti
unixReviewTime: İnceleme Zamanı (Unix time)
reviewTime: İnceleme Zamanı (Raw)
Proje Aşamaları
1. Veri setimizi okutalım ve ürünün ortalama puanını hesaplayalım;
2. Tarihe göre ağırlıklı puan ortalama puanını hesaplayalım;
Bu aşamada ürüne yapılan yorum tarihleri üzerinden ilerleyeceğiz. Temel odağımız yakın tarihte yorum yapan kullanıcıların puan ortalamalarına fazla ağrılık vermek olacak.
Öncelikle “reviewTime” değişkeninin tipini düzeltmememiz gerekiyor.
reviewTime değişkenindeki maksimum tarihi analizin yapıldığı tarih olarak kabul edip, kullanıcı yorumlarının kaç gün önce yapıldığını veri setimize ekleyelim;
Şimdi yakın tarihli yorumların ortalamasına fazla ağırlık vermek için “day_diff” değişkenini çeyrekliklere ayırıp birlikte basit bir hesaplama yapalım;
3. Ürün için detay sayfasında görüntülenecek 20 yorumu belirleyelim;
Ürün yorumlarını sıralarken “helpful” değişkeni üzerinden 3 farklı yöntem ele alacağız. İlk önce değişkenimizi hatırlayalım;
Burada [0, 0] ile belirtilen listenin ilk indeksi faydalı (up), ikinci indeksi ise faydasız (down) bulunan yorumları ifade etmektedir. Veri setinde “helpful_yes” (up) ile “total_vote” değişkeni mevcut. “helpful_no” (down) değişkenini gelin birlikte oluşturalım ve veri setini ihtiyacımız olan değişkenlere göre indirgeyelim;
Sıralama yöntemlerimiz için gerekli fonksiyonlarımızı getirelim;
Hadi gelin bu üç yöntemden çıkacak olan sonuçları da veri setimize ekleyelim;
Son olarak sayfada görülecek ilk 20 yorumu “wilson lower bound” değişkenine göre belirleyelim;
Umarım faydalı olmuştur, yeniden görüşmek dileğiyle..
KAYNAKLAR