Forstå Ratingsystemet på SWAN:

Det, der er sværest at forstå ved ratingssystemet, illustreres bedst ved spørgsmålet:

"Hvorfor går min rating ned, når jeg har fået indsæt dit gode matchpoint- eller IMP-resultat her?"

Det enkle svar er, at ratingsystemet ikke sammenligner dit resultat med andre resultater. Dit resultat i forhold til andres resultater tæller derimod med i statistikken i din profil. Dette svar udløser et nyt spørgsmål:

"Hvis systemet ikke sammenligner med andre resultater, hvordan kan det så fungere?"

Du forstår nemmest, hvordan ratingssystemet virker, hvis du betragter det, som om du kun konkurrerer med kortene. Der er flere årsager til, at vi har valgt denne metode, men vi mener at metoden giver et bedre ratingssystem end en metode baseret på sammenligning af resultater.

Nogle forskelle mellem almindelig bridge og online bridge.

Når du spiller parturnering, så anvendes en resultatopgørelse, som forsøger at udbalancere held og uheld med kortene. Det er en meget brugbar metode til at beregne en spillers præstation indenfor en gruppe, specielt da:

  • Turneringer omfatter normalt et forholdsmæssigt lille antal spil.
  • I turneringer spiller man mod mange andre par i en gruppe. Jo flere par fra gruppen du spiller imod, jo nøjagtigere er resultatet.
  • Turneringer spiller normalt indenfor en kortere periode, og resultaterne kan beregnes og offentliggøres hurtigt efter turneringen.

Online spil foregår i et helt andet miljø end turneringsspil:

  • Når du spiller online kan du spille så mange spil, som du har lyst til. Når du har spillet hundredevis af spil, så vil held og uheld gå lige op.
  • Når du spiller online, så spiller du langtfra mod alle de andre par, som spiller online. Du konkurrerer derfor ikke mod hele gruppen.
  • Når du spiller online, så spiller du, når du har lyst. Da spillene ikke spilles efter nogen fast plan, så er det ikke altid givet, at spillene er blevet spillet før, der er derfor ikke nødvendigvis resultater at sammenligne med.

Konstruktion af et bedre ratingsystem.

SWANs ratingsystem er konstrueret til at fungere i forbindelse med online spil. Da vi skulle beslutte, hvad ratingændringer skulle baseres på, besluttede vi, at det ikke skulle være på grundlag af sammenligning af resultater. De betingelser, der gør sammenligning til en god metode for turneringsspil, er ikke tilstede i samme grad ved online spil. Desuden ville et system, som baseres på sammenligning af resultater, være nødt til at tage stilling til styrken af den gruppe, der sammenlignes indenfor. Denne faktor er vanskelig at håndtere statistisk set. Ved at undlade at basere systemet på resultatsammenligning, var vi i stand til at konstruere et enklere system, som heller ikke lider under de talrige (og manipulerbare) tilnærmelser, som er nødvendige, hvis du skal udregne en gruppes styrke.

En bonus ved ikke at anvende resultatsammenligning er, at systemet ikke behøver at vente på, at et spil er spillet tilstrækkeligt mange gange, før der kan laves ratingændringer. Vores ratingsystem beregner ratingændringen efter hvert spil, du afslutter. Ved at være i stand til øjeblikkeligt at opdatere ratingen undgår vi mange problemer, som er forbundet med et system, som arbejder med forsinket opdatering:

  • I et system, som bruger forsinket opdatering, vil ratingændringen altid ske på et andet tidspunkt end da resultatet blev opnået. Dette skaber et nyt problem. For at kunne beregne ratingændringer er det vigtigt at man kender hver spillers rating på det tidspunkt, hvor resultatet blev opnået. Da spillerne ikke spiller spillene i nogen fast rækkefølge, så er spillene heller ikke færdigspillet, udfra et ratingmæssigt synspunkt, i nogen fast orden. Dette gør det meget vanskeligt at undgå at bruge skønsmæssig rating som grundlag for beregningen af ratingændringer.
  • Overvej, hvad der sker, når nogen spillere spiller flere spil end andre. I et system med forsinket opdatering, vil disse spillere enten være nødt til at vente længere og længere på opdatering, indtil spillene er blevet spillet tilstrækkeligt mange gange af andre, eller man vil være nødt til at trække spil ud før tiden, hvilket vil reducere størrelsen af den gruppe, der sammenlignes med.

Hvorfor er det en brugbar metode og hvordan virker den?

Vi hører ofte: "Hvis I ikke bruger resultatsammenligning, så må I bruge det rå resultat. Det kan ikke være rigtigt, det ser bort fra den kendsgerning at det drejer sig om at maksimere sit resultat i forhold til andres."

Dette argument ville være gyldigt, hvis vi kun brugte det rå resultat til vores beregninger. Men det gør vi ikke. Før vi udregner ratingændringen, justerer vi det rå resultat på en måde, der tager hensyn til regnskabstypen. Da vi justerer forskelligt for matchpoint og for IMP, så har vi to ratingtal. Ved at justere det rå resultat, er vi i stand til at beregne ratingændringer, som hænger sammen med strategien for regnskabstypen.

Her er en oversigt over, hvordan systemet udregner en ratingændring:

    Når et spil afsluttes, bliver Nord-Syds resultat og ratingen for de fire spillere brugt til beregningen.

    Resultatet justeres på grundlag af regnskabstypen.

    Ratingen for de fire spillere bruges til at beregne et forventet resultat.

    Forskellen mellem resultatet fra punkt 2 og punkt 3 bruges til at beregne ratingændringen. Hvis (2) er større end (3) vil Nord-Syds rating øges og Øst-Vests formindskes og omvendt, hvis (3) er større end (2).

Det er det hele!

Ja, det kan se mærkeligt ud, at din rating kan formindskes, selvom du får en god score, hvis du sammenligner med andre resultater, men sådan kan det være. Du skal se det, som om du konkurrerer med kortene. Hvis du får dårlige kort, vil din rating gå ned, gode kort vil få den til at stige. Hvis du imidlertid spiller de dårlige kort bedre end andre, så vil din rating gå mindre ned for disse kort end andres. På samme måde, hvis du spiller de gode kort bedre end andre, så vil din rating også stige mere end andres. Efterhånden, som du spiller flere og flere spil, så vil din rating være udtryk for din formåen.

Fordi ratingsystemet er konstrueret, som det er, vil mindre ratingændringer være naturlige. Det er f.eks. ikke usædvanligt at en spillers rating kan svinge med 20 point i løbet af 5 spil. Desuden, hvis du er ny spiller (mindre end 500 spil), så vil dine ratingændinger blive forstærket, hvilket kan give anledning til endnu større udsving. I princippet har en spiller ikke kontrol med sin rating over få spil. Husk at din rating kan gå ned, selvom du spiller kortene helt perfekt (den vil dog gå mere ned, hvis du havde spillet mindre perfekt). Vi regner med at det tager ca. 500 spil før ratingen er nogenlunde stabil og at ratingtallene kun er nøjagtige indenfor +/- 50 point. Dette forudsætter, at størstedelen af de spillere, du spiller med, har etablerede ratingtal. Da SWAN er relativt ny, er der mange spillere, der endnu ikke har et etableret ratingtal, hvilket indebærer, at det tager endnu flere spil at etablere en nøjagtigt rating.

En lykkelig tanke :-)

En sidste kommentar: Da korttidsændringer er uden mening, og da der ikke er nogen statistisk fordel i at vælge bestemte makkere eller modstandere, mener vi at vores ratingsystem formindsker spillernes afhængighed af ratingen, hvilket vil gøre SWAN til et venligere sted at spille online bridge.

Forstå Ratingsystemet på SWAN- Den mere tekniske forklaring:

Ratingsystemet er designet således, at det bedømmer en spillers præstation udelukkende udfra hans egen formåen. Efter hvert spil bliver det, på grundlag af de fire spilleres rating og spillets "rå" score, beregnet, hvordan de de fire spilleres rating skal ændres. Ratingen for de fire spillere bliver således opdateret umiddelbart efter spillets afslutning. Systemet er designet således, at en spillers rating vil være i overensstemmelse med hans formåen i det lange løb.

Systemet tager følgende faktorer i betragtning: De fire implicerede spilleres formåen og resultatet af spillet (her gås ud fra, at en spillers held og uheld med kortene i det lange løb vil udlignes). Rating opdateringen bliver nu baseret på 2 udregninger - en fra et neuralt netværk og en fra en delta kalkulator. Dette forklares nedenfor:

Det neurale netværk

Hvis fire spillere med samme formåen sætter sig og spiller et stort antal spil, så vil det forventede resultat være nul. Vi bruger nu et neuralt netværk til, at beregne det forventede resultat for de fire aktuelle spillere. Der er to grunde til at bruge et neuralt netværk til dette:

    Der er ikke en enkel matematisk formel, som kan beregne dette nøjagtigt. Systemer, der bruger enkle beregninger, som f.eks. et system, der beregner et makkerskabs formåen , som gennemsnittet af de to spilleres formåen, svarer ikke til virkeligheden og kan relativt let påvirkes.

    Ved at anvende et neuralt netværk tilpasser systemet sig selv til virkeligheden. Netværket trænes ved at se de aktuelle resultater fra spillere med forskellig formåen. Dette indebærer, at systemet vil være reagere på den virkelige verden, mens systemet fortsætter med at lære at estimere forventede resultater.

Delta kalkulatoren

Delta kalkulatoren ligner kalkulatorerne, som anvendes i andre ratingsystemer. Sandsynligheden af et spils aktuelle resultat afgøres ved at bruge det estimerede score fra det neurale netværk. Udfra sandsynligheden beregnes nu en basis delta værdi. Hver spillers rating bliver derefter ændret med basis delta værdien ganget med en "erfaringsfaktor". Erfaringsfaktoren bruges til at forstærke ændringerne for nye spillere, hvis rating endnu ikke har fundet et leje.

Vores ratingssystem er forskelligt fra Lehmans på mange punkter. Vigtigst er det, at en spillers rating ikke påvirkes af sammenligning med spillets resultat ved andre borde. Dette kan synes unaturligt, fordi turneringsspil jo netop går ud på at sammenligne resultaterne. Men, statistisk set, ville vi, ved at inddrage sammenligningen i rating modellen, indføre mange indbyrdes afhængige faktorer, hvilket ville vanskeliggøre systemet evne til, nøjagtigt at afgøre en spillers formåen. Sammenligning af spilresultater er ideelt til at bestemme korttids præstationerne for et makkerskab og er derfor velegnet til turneringer. Vores ratingsystem mere egnet til, at afgøre præstationerne for den enkelte spiller over en længere periode, og er derfor bedre egnet til ratingberegning.

En anden forskel mellem vores system og Lehmans er, at vores system beregner rating ændringen med det samme. En spiller behøver ikke at vente en uge for at kunne se en ratingændring. Hvis du spiller et antal spil virkelig godt, så vil din rating være højere, når du slutter, end da du startede. Naturligvis er ratingændinger af denne karakter normalt kortvarige, en enkelt god aften vil ikke påvirke din rating væsentligt i det lange løb.

Effektiviteten af vores ratingsystem afhænger naturligvis af de betingelser, det fungerer under. I en ideel situation, set fra ratingsystemet, spiller de enkelte spillere med mange forskellige makkere og med mange forskellige modstandere uden at have en speciel forkærlighed for bestemte makkere eller modstandere eller deres formåen. Dette er næppe rigtigt i virkeligheden. Der vil være spillere, der sjældent skifter makker eller som helst spiller indenfor den samme personkreds. I alvorlige tilfælde kan ratingssystemet aldrig være i stand til at beregne visse spilleres individuelle formåen. Hvis to spillere f. eks. aldig spiller med andre makkere end hinanden, så vil deres rating altid være den samme; da de aldrig skifter makkere, kan ratingsystemet ikke skelne dem fra hinanden. Selv i alvorlige tilfælde som dette, så vil virkningen være lokal, systemets manglende evne til at beregne deres individuelle rating, påvirker ikke systemets evne til at beregne andres rating, og der er da heller ingen fordele eller ulemper for andre spillere ved at spille mod et sådant makkerskab.

Spørgsmål

Her er det mest stillede spørgsmål om ratingsystemet.

Spørgsmål: Hvis mine modstandere får rigtigt mange point i et spil, hvorfor går min rating så også ned? Burde den ikke kun gå ned, hvis jeg har klaret mig dårligere end andre, som spiller det samme spil?

Svar: Systemet tager kun hensyn til spillerne rating og det "rå" resultat af spillet. Hvis dine modstandere får mange point, vil din rating gå ned. På samme måde vil din rating gå op, hvis det er dig, der får mange point i et spil. Ratingsystemet har som forudsætning, at held og uheld med kortene udjævnes i det lange løb.