duminică, 24 mai 2009

N-o sa castigati la Loto

Toata lumea e de acord ca este, matematic vorbind, o idee proasta sa joci numere aleatoare la Loto. O analiza simpla cost-beneficiu demonstreaza asta. Totusi, ce se intampla daca nu jucam numere aleatoare ci cautam un algoritm mai destept prin care sa ghicim numerele care vor veni?

Primul instinct este ca asa ceva e o pierdere de vreme pentru ca numerele de la Loto oricum sunt aleatoare - sau cat se poate de aleatoare, oricum, altfel fie procedul de extragere ar fi fost schimbat, fie loteria ar fi fost devalizata deja.

Cu toate astea, am intalnit zilele trecute doi jucatori de bridge, oameni pe care ii respect si care de altfel sunt foarte inteligenti, care aveau amandoi impresia ca sunt pe cale de a devaliza loteria. Ce e amuzant este ca metodologiile lor erau foarte diferite: A spunea "am de gand sa joc numerele care au aparut de cele mai multe ori pana acum, am eu un tabel cu ele; daca au aparut mai des pana acum, inseamna ca e mai probabil sa apara si la urmatoarea extragere". B spunea "am de gand sa joc numerele care au aparut de cele mai putine ori pana acum; cum toate numerele au aceeasi probabilitate, e clar ca cele care au aparut mai rar trebuie sa recupereze". In acelasi timp, B mai avea o metoda: cautarea exhaustiva de pattern-uri printre numere.

Sa le luam pe rand:
A. Ce spune A e de bun simt (mai de bun simt decat ce spune B, oricum). Totusi, nu e chiar asa. Cand l-am intrebat pe A "cu cate abateri standard apar numerele alese de tine mai des?" s-a uitat la mine de parca l-as fi injurat. Ca sa putem trage astfel de inferente, trebuie sa verificam mai intai care este probabilitatea ca numerele sa fi aparut mai des in mod strict aleator (pentru ca trebuie sa apara unele mai des si altele mai rar chiar si cand sunt perfect aleatoare). Pentru asta, in statistica, avem diverse teste. Eu am ales testul hi-patrat si am obtinut ca presupunerea cum ca rezultatele s-ar datora nu sansei pure ci unei probleme cu masina de generat nu se sustine. Cel mai probabil, numerele au aparut mai des din pura intamplare (pentru cei familiarizati: Chi-square=40.914; df=48; Asymp Sig=0.756; datele le-am preluat de aici).

Deci nu putem folosi aceste numere in mod rezonabil pentru a face predictii. A n-o sa castige mai mult decat ar castiga jucand numere la intamplare.

B1. Argumentul lui B este o eroare comuna, ce poarta numele de Gambler's Fallacy. In ciuda a ce spun unii, Universul NU conspira nici ca sa te "faca", nici ca sa te salveze cand stai rau. Random-ul ramane random si nu tine cont de ce s-a intamplat in trecut. Din moment ce extragerile sunt independente intre ele, fiecare trebuie tratata ca si cum ar fi prima. Istoria este irelevanta.

B2. B a dovedit o mare rabdare si perseverenta. A luat numerele si le-a bagat in Excel in cateva mii de combinatii diferite, cautand corelatii dintre cele mai nastrusnice, doar-doar va obtine ceva interesant. Evident, atunci cand testezi 10000 de ipoteze diferite, unele vor fi adevarate, chiar daca probabilitatea sa fie adevarate din pura intamplare pentru acel set de date este de 1/10000. S-ar putea sa obtii rezultate de tipul "de fiecare data cand extragerea este intr-o zi care este numar prim, apare un numar care este fie multiplu al lui 11, fie al lui 13". So what? Revenim la argumentele de la punctul A. Ca sa aiba valoare demersul, trebuie sa obtinem corelatii care pot fi explicate prin pura sansa cu o probabilitate mult mai mica decat numarul de pattern-uri pe care le-am testat. Altfel nu vom fi obtinut decat o filtrare a pattern-urilor care au aparut de cele care nu au aparut.

Exemplu: avem o moneda si 1 milion de oameni care vor sa ghiceasca ce va pica, stema sau banul. Jumatate aleg stema, jumatate banul. Dupa prima aruncare, raman 500000. Dupa a doua aruncare 250000... Dupa a 20a aruncare va ramane un singur om care va fi "ghicit" de 20 de ori la rand ce a picat. Probabilitatea sa faca asta este cam 1 la 1000000. Dar nu inseamna ca el are puteri supranaturale ci pur si simplu ca au existat 1000000 de oameni care au incercat! La fel si cu cautarea de pattern-uri in mod exhaustiv. Daca testam suficiente posibilitati, o sa gasim si corelatii foarte ciudate si foarte improbabile. Ele nu ne vor spune, insa, nimic despre viitor.

Deci nici B nu va castiga mai mult decat ar castiga jucand numere la intamplare.

Instinctul initial, cum ca pierdem vremea facand analize de genul asta, s-a dovedit adevarat.

5 comentarii:

  1. Toate astea se intampla plecat de la "ipoteza" ca acele extrageri ar fi chiar "random". Unii se indoiesc de asta! Una din teoriile foarte credibile(dupa mine) este ca loteria programeaza cand sa se castige. Altfel spus, ei stiu sigur dinainte ce combinatie nu s-a jucat si au uneori interesul ca aceea sa iasa. Premiul se va reporta, deci data urmatoare miza va fi mai mare, deci mai multi jucatori. Acele "recorduri" asa sunt explicate. Nu programeaza CINE sa castige, ci CAND sa se intample asta:) Si atunci toata matematica pica, pt ca nu e 100% intamplare in acele numere(de ce unele sunt de 2 sau 3 ori mai intalnite ca altele?).
    Concluzia finala(aceeasi ca si a ta): N-O SA CASTIGATI LA LOTO!!

    RăspundețiȘtergere
  2. vezi ca ai pierdut vreo 65000 de oameni la exemplul ala:)

    RăspundețiȘtergere
  3. Am lasat pe dinafara exact 48576, dar nu asta era relevant. :)

    RăspundețiȘtergere
  4. Genial postul tau, jos palaria!
    Aveam si eu o prietena, profa de mate de altfel, care era de acord cu B, sau cine era cel care zicea ca trebuie sa iasa numerele care nu au iesit recent. Chestie care mi se parea o prostie, pentru ca si eu sunt de parere ca treaba e cat se poate de aleatoare.
    La faza cu exemplul ala, da, anonimul de mai sus are dreptate, eu sunt unul dintre cei 65000 care confirma ce a afirmat el.

    In concluzie, ma bucura postul tau, pentru ca am incredere in modul tau matematic de a gandi si nah, cum si eu cred la fel.. :D

    RăspundețiȘtergere
  5. A porneste de la premiza ca bilele sint defecte si ca se foloseste tot timpul acelasi set de bile (premiza, evident, falsa, datorita standardelor de calitate ale Loteriei Romane).
    B da dovada de gandire magica si de neintelegere a procesului.
    Anyway, lucrurile acestea s-au mai zis mai sus.

    Am comentat pentru ca mi-am adus aminte de o frauda practicata de nigerieni (sau rusi sau...): trimit 1 milion de mailuri (spam) spunand ca ei sint o noua firma care au descoperit un nou model de a face predictii la bursa. Dar au nevoie de investitori ca sa perfectioneze sistemul. Si ca sa demonstreze cat de bun e sistemul acum, in stare de prototip, pun o predictie in e-mailuri. La 500 de mii scrie ca actiunea X o sa creasca, la 500 de mii scrie ca actiunea X o sa scada. A doua zi vine cu o noua predictie, dar doar pentru cei 500 de mii "norocosi", predictie din nou impartita in doua parti egale. Dupa cateva astfel de zile, clientii sint invitati sa investeasca in companie, calitatea prezicerilor lor din ultimile zile dovedind in mod clar valoarea tehnica a sistemului de predictie.
    Si uite asa, din 1 milion de oameni raman aproximativ 30 de mii de oameni dupa 5 predictii de succes. Este suficient ca 1% din acestia sa investeasca bani in start-up ca efortul nigerienilor sa dea roade.

    RăspundețiȘtergere