Amazon’da Bir Ürünü Skorlama & Yorum Sıralama

Barış Kavuş
2 min readJun 25, 2021

--

Merhaba!

Çeşitli platformlardan bir ürün almadan önce mutlaka puan ve yorumlarına bakıyoruz.

Peki ürün puanlarını ve yorumlarını nasıl sıralayabiliriz?

Bu yazıda, bir ürünün puanını daha doğru hesaplamaya ve yorumlarını daha doğru sıralamaya çalışacağız.

Veri Seti Hikayesi

Amazon ürün verilerini içeren bu veri seti ürün kategorileri ile çeşitli metadataları içermektedir.

Elektronik kategorisindeki en fazla yorum alan ürünün kullanıcı puanları ve yorumlarını içeren alt dataframe üzerinden ilerleyeceğiz.

Değişkenler

reviewerID: Kullanıcı ID

asin: Ürün ID

reviewerName: Kullanıcı Ad

helpful: Faydalı Yorum Derecesi

reviewText: Yorum

overall: Ürün Rating’i

summary: İnceleme Özeti

unixReviewTime: İnceleme Zamanı (Unix time)

reviewTime: İnceleme Zamanı (Raw)

Proje Aşamaları

1. Veri setimizi okutalım ve ürünün ortalama puanını hesaplayalım;

Ürünün ortalama puanı

2. Tarihe göre ağırlıklı puan ortalama puanını hesaplayalım;

Bu aşamada ürüne yapılan yorum tarihleri üzerinden ilerleyeceğiz. Temel odağımız yakın tarihte yorum yapan kullanıcıların puan ortalamalarına fazla ağrılık vermek olacak.

Öncelikle “reviewTime” değişkeninin tipini düzeltmememiz gerekiyor.

reviewTime -> object
reviewTime -> datetime64[ns]

reviewTime değişkenindeki maksimum tarihi analizin yapıldığı tarih olarak kabul edip, kullanıcı yorumlarının kaç gün önce yapıldığını veri setimize ekleyelim;

Şimdi yakın tarihli yorumların ortalamasına fazla ağırlık vermek için “day_diff” değişkenini çeyrekliklere ayırıp birlikte basit bir hesaplama yapalım;

3. Ürün için detay sayfasında görüntülenecek 20 yorumu belirleyelim;

Ürün yorumlarını sıralarken “helpful” değişkeni üzerinden 3 farklı yöntem ele alacağız. İlk önce değişkenimizi hatırlayalım;

Burada [0, 0] ile belirtilen listenin ilk indeksi faydalı (up), ikinci indeksi ise faydasız (down) bulunan yorumları ifade etmektedir. Veri setinde “helpful_yes” (up) ile “total_vote” değişkeni mevcut. “helpful_no” (down) değişkenini gelin birlikte oluşturalım ve veri setini ihtiyacımız olan değişkenlere göre indirgeyelim;

İndirgenmiş veri seti

Sıralama yöntemlerimiz için gerekli fonksiyonlarımızı getirelim;

Hadi gelin bu üç yöntemden çıkacak olan sonuçları da veri setimize ekleyelim;

Son olarak sayfada görülecek ilk 20 yorumu “wilson lower bound” değişkenine göre belirleyelim;

Umarım faydalı olmuştur, yeniden görüşmek dileğiyle..

--

--