1. Anasayfa
  2. Sektörel

Yandex, Müzik Dinleme Verilerini İçeren Yeni Veri Seti Yambda’yı Yayımladı

Yandex, Müzik Dinleme Verilerini İçeren Yeni Veri Seti Yambda’yı Yayımladı
0

Yandex, Yandex Music verilerinden oluşan ve öneri sistemleri için hazırlanan 4,79 milyar etkileşimlik Yambda veri setini erişime açtı. Yambda, öneri sistemlerine yönelik 10 aylık müzik dinleme, beğenme ve etkileşim verilerini içeren büyük ölçekli açık veri seti olarak sunuldu. Veri seti, öneri sistemleri alanında çalışanlar için farklı büyüklük seçenekleriyle kullanıma sunuldu.

Yandex, müzik akış servisi Yandex Music üzerinden elde ettiği yaklaşık 5 milyar kullanıcı etkileşiminden oluşan veri setini araştırmacıların kullanımına açtı. “Yambda” adı verilen bu set, öneri sistemleri alanında şimdiye kadar yayımlanmış en büyük açık veri kaynağı olma özelliği taşıyor.

Yamba veri seti, 10 aylık bir süreçte toplanan 4,79 milyar anonimleştirilmiş etkileşim verisini içeriyor. Kullanıcıların müzik dinleme, beğenme ve beğenmeme gibi etkileşimlerinden oluşan veri seti, hem örtülü hem açık geri bildirimleri kapsıyor. Aynı zamanda tüm veriler, zaman damgaları ve içerik önerisinin organik olup olmadığını belirten işaretlerle birlikte sunuluyor.

Farklı boyutlardaki veri setleri araştırmacılara açıldı

yandex yamba veri seti

Veri seti, öneri sistemleri üzerine çalışan araştırmacılar için farklı boyutlarda (50 milyon, 500 milyon ve 5 milyar etkinlik) erişilebilir hale getirildi. Apache Parquet formatında sunulan dosyalar, Spark ve Pandas gibi analiz araçlarıyla uyumlu olarak hazırlanmış durumda. Değerlendirme yöntemi olarak ise zaman bağını koruyan Global Temporal Split tekniği kullanılıyor.

Bu veri seti sayesinde araştırmacılar, öneri sistemlerini gerçek dünya senaryolarına daha yakın koşullarda test edebiliyor. Aynı zamanda mevcut temel modellerle karşılaştırmalar yapılmasını sağlayan değerlendirme metrikleri de sistemle birlikte sunuluyor.

Bu Yazıya Tepkiniz Ne Oldu?
  • 0
    be_endim
    Beğendim
  • 0
    alk_l_yorum
    Alkışlıyorum
  • 0
    e_lendim
    Eğlendim
  • 0
    d_nceliyim
    Düşünceliyim
  • 0
    _rendim
    İğrendim
  • 0
    _z_ld_m
    Üzüldüm
  • 0
    _ok_k_zd_m
    Çok Kızdım

Adnan Güney; Bilim, Teknoloji, Mobil, Medya,Yapay zeka, Uzay Sosyal medya, yararlı konularda güncel açıklama ve uygulamaların anlatıldığı bir web sitesidir.

Yazarın Profili

Bültenimize Katılın

Hemen ücretsiz üye olun ve yeni güncellemelerden haberdar olan ilk kişi olun.

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir