Forsterket læringsbasert anbefalingssystem (MDP)

Casestudie for forsterkningslæring
Forsterket læringsbasert anbefalingssystem (MDP) 1 | Veracity
Forsterkningslæring

BAKGRUNN

Anbefalingssystemer prøver å forutsi «rangering» eller «preferanse» en bruker vil gi til en vare. Anbefalingssystemer benyttes på en rekke områder og blir ofte anerkjent som spillelistegeneratorer for video- og musikktjenester eller produktanbefalinger for detaljhandelstjenester eller innholdsanbefalinger for sosiale medieplattformer.

Behovet for anbefalingssystemet er utvidet av informasjonseksplosjonen. Når valg av brukere øker, blir viktigheten av anbefalingssystemer som hjelper med å ta beslutninger, avgjørende.

PROBLEM

Anbefalersystemer har oppnådd stor suksess med en metode som kalles collaborative filtering (CF), en populær teknikk i domenet. Målet med CF er å lage en personlig forutsigelse om preferansene til brukere, ved å bruke informasjonen om andre brukere som har lignende interesser for elementer. Ulempen med CF er at de vanligvis er en dimensjonale og statiske begrenser nøyaktigheten og tilpasningsevnen til tilnærmingen.

LØSNING

Forsterkningslæring er et nylig interesseområde innen maskinlæring som bruker en erfaringsbasert tilnærming for å lære å maksimere resultatet. VeracityAI gir en forsterkningsbasert tilnærming til anbefalingssystem som kan tilpasse seg individuelle behov effektivt og nøyaktig. Vi bruker en diskret tilstand MDP-modell for å maksimere nyttefunksjonen som tar hensyn til fremtidige interaksjoner med brukerne. Forsterkningslæring er et nylig interesseområde innen maskinlæring som bruker en erfaringsbasert tilnærming for å lære å maksimere resultatet. VeracityAI gir en forsterkningsbasert tilnærming til anbefalingssystem som kan tilpasse seg individuelle behov effektivt og nøyaktig. Vi bruker en diskret tilstand MDP-modell for å maksimere nyttefunksjonen som tar hensyn til fremtidige interaksjoner med brukerne.

Forsterket læringsbasert anbefalingssystem (MDP) 2 | Veracity

Anbefaler brukerinteraksjoner i MDP [1]

INNVIRKNING

Ved å bruke forsterkningsbasert anbefalingssystem optimaliserer vi ikke bare effektiviteten, men forbedrer også anbefalingens kvalitet på kaldstartproblemet. Videre gjør metodikken oss i stand til å identifisere begrunnelsen bak anbefalingene uten å være begrenset til en svart boks-løsning.

Source : [1] F. Liu et al., «Deep Reinforcement Learning based Recommendation with Explicit User-Item Interactions Modeling», arXiv.org, 2019. [Online]. Available: https://arxiv.org/abs/1810.12027. [Accessed: 05- Sep- 2019].

Kontakt oss for å bli kjent med produktene våre

Recent research publications

Planlegg en demonstrasjon med våre eksperter

Bli kjent med produktene våre