Födelsedagsparadoxen i verkligheten
uppladdat: 2016-10-10
Inactive member
Projektrapport i kurs Ma1b
ProCivitas Lund
Projektrapport
Klass:
? EK15
Elev:
?Carl Örnberg
Datum:
?20160317
Medlaborant:
? Alexander Egard
Kurs:
?Matematik 1b
Födelsedagsparadoxen i verkligheten
1.Inledning
1.1 Teori
Teorins grundtanke är att benämna det skenbart orimliga faktum att sannolikheten är
större än 0,5 för att det i en grupp om 23 slumpmässigt utvalda personer finns minst 2
personer med samma födelsedag, alltså att det sker en matchning. Antaganden till teorin är
följande; att den 29 februari utesluts vilket leder till att året har 365 dagar (antalet möjliga
utfall), att de 365 dagarna är lika troliga det vill säga att antalet födda en viss tidsperiod,
exempelvis under en månad inte är större än antalet under någon annan tidsperiod och
slutligen att födelsedagarna är självständiga vilket menas med att antalet ?k ?personer i en
grupp, inte innehåller tvillingpar, trillingpar osv.
1.2 Syfte
Frågeställningen är ifall denna teori kan framställas i en annan form som i en graf eller
diagram och om teorin kan överensstämma med verkligheten utan antagandena. Alltså om
utfallet visar någorlunda samma resultat som kan beräknas fast än att personerna som
kommer att undersökas må fylla år den 29 februari och att alla dagar inte är lika troliga
samt att det kan finnas tvillingpar etc i slumpmässigt utvalda gruppen.
1.3 Hypotes
Om en undersökning görs enligt teorin och dennes antaganden bör den överensstämma
med beräkningar som gjorts under rapportens tidsförlopp och bör visa till exempel att om
gruppen består av 58 personer, kommer minst två av dem med väldigt stor sannolikhet (
ca 99%) ha samma födelsedag. Huruvida utfallet förhåller sig till teorin utan att ha
antaganden i åtanke är svårt att säga men eftersom att den 29 februari uppstår var fjärde
år, vilket betyder att den är mindre trolig än övriga dagar, borde den faktor göra att
felmarginalen inte bör bli stor. Likaså för de två andra antagandena. Det må finnas en risk
att om ett tvillingpar undersöks under samma undersökning som förändrar sannolikheten
till att genast vara 1 (om inte tvillingarna fötts under 2 olika dagar).
?
2. Materiel
Penna
Papper
Onlinekompilator för C++ kod, ?https://ideone.com/
Matematik Origo 1b matematisk lärobok, Dufåker Daniel med flera
“Lecture 3: Birthday Problem, Properties of Probability | Statistics 110”, Harvard
University, YouTube, ?https://youtu.be/LZ5Wergp_PA
“The Birthday Problem / Paradox”, RichardB1983, YouTube,
https://youtu.be/QrwV6fJKBi8
Födelsedagsparadoxen, Wikipedia,
https://sv.wikipedia.org/wiki/F%C3%B6delsedagsparadoxen
3. Metod
Teorin började beräknas med formlen?för sannolikheten ,
365
k
365 * 364 * 363... (365 - k + 1)
**
P(A)
c
som var komplementhändelse till och där ?k ? var antalet personer i en grupp. P(A)P(A)
stod för att det fanns minst två personer med samma födelsedag, alltså en matchning, och
stod för att det inte fanns några personer med samma födelsedag, alltså ingenP(A)
c
matchning. Sedan, för att slippa beräkna formlen varenda gång ?k?värdet förändrades,
skrevs en kod i C++ som använde 2 ?forloops? och genererade en utmatning som beräknade
för respektive ?k?värde. Startvärdet för ?k ?var 1 och stoppvärdet 100. Värdet av P(A)P(A)
var begränsad till 6 decimaler per utmatning. Koden representerade den generella formlen
för P(A) som beräknades och såg ut såhär:(A) (A) 1 (1)P=1-P
c
= -?
k-1
i=0
-
i
365
#include ?
int? main?(?void?)? ?{
double? p?;? ?//Variabel som står för komplementhändelsen P().A
c
long? ?int? ii?;? ?//Inkrementsvärde för den andra for loopen.
long? ?int? k?;? ?//Värdet för antal personer beskrivs med variabeln k.
for? ?(?k ?=? ?1?;? k ?<=? ?100?;? k?++?)? ?{
p ?=? ?1?;? ?//P(A) = 1 P(A^c)
?for? ?(?ii ?=? ?1?;? ii ?
p ?*?=? ?(?365.0? ?? ii?)? ?/? ?365.0?;? ?//* Varenda gång variabeln "ii" är mindre än variabeln "k"
kommer programmet utföra beräkningar och mata ut dem.*//
?//*Här utförs även formlen för teorin via en for loop som ökar differensen och
sannolikheten.*//
?}
?printf?(?"För %d personer är sannolikheten %.10f?
\n
?"?, k, ?1? ?? p?)?;? ?//*Här betyder %.10f hur
många decimaler utmatningen ska innehålla, för tillfället är den satt till 10 decimaler.
}
return? ?0?; ?}
Figur 8, Lösning av paradoxen med C++ programmeringskod, med kommentarer
Denna kod sattes sedan in i en onlinekompilator som kunde kompilera och exekvera koden
och genererade en utmatning. Utfallet där användes för att sammanställa en tabell med
k?värdet 1 som startvärde och ?k?värdet 100 som stoppvärde. Värdena skrevs in i ett Google
kalkyldokument för att sedan skapa en graf. Grafen skapades genom att en kolumn för
k?värden och en kolumn för respektive sannolikhet skrevs in i kalkylarket. Sedan
markerades kolumnerna och muspekaren på datorn klickade på infoga, sedan på diagram
där en graflayout valdes att användas.
Sedan begärdes klasslistor från gymnasieskolan ProCivitas i Lund, på klasserna EK15 och
NA15 som skulle vara första slumpförsöket, SA15 och NA14 som skulle vara andra
slumpförsöket och EK14 som tredje slumpförsök, för att kunna granska och beräkna ett
resultat. EK15 hade 35 elever, NA15 hade 23 elever, SA15 hade 33, EK14 hade 31 och NA14
hade 16 elever. Sammanlagt ingick 138 elever i undersökningen och i första slumpförsöket
undersöktes 58, i andra slumpförsöket 49 och i tredje undersöktes 31. Sedan anmärktes
sannolikheten för respektive slumpförsök och anmärkte att 58 personer skulle motsvara ca
99?%, för 49 personer anmärktes sannolikheten att vara ca 96,57% och för 31 personer var
sannolikheten beräknad till ca 73%.
Varje elevs födelsemånad i varje slumpförsök noterades utifrån klasslistorna och ett
cirkeldiagram för respektive slumpförsök framställdes i Google kalkyldokumentet. Detta
gjordes genom att var slumpförsök hade sina egna två kolumner för varje månad och
respektive födelsedagar i den födelsemånad. Sedan markerades vardera
slumpförsökskolumner och muspekaren klickade på infoga, sedan på diagram där ett
cirkeldiagram som visade antal födelsedagar per månad och andel i procent valdes.
?
4. Resultat
4.1 Graf
Figur 1 Födelsedagsparadoxens graf, av Carl Örnberg och Alexander Egard
Figur 1 representerar sannolikheten ?P? för antalet personer ?K. P? står för sannolikheten för
att minst två personer i antalet ?K? personer har samma födelsedag.
4.2 Tabeller
Datum Antalet personer EK15 Antalet personer NA15
30 juni 2 1
26 januari 1 1
Datum Antalet personer NA14 Antalet personer SA15
20 maj 1 1
Figur 2 och 3 Tabeller för slumpförsök 1 och 2 i kronologisk ordning
Slumpförsök Matchningar per
datum
Antal elever i
EK15/SA15
Antal elever i
NA15/NA14
Slumpförsök 1
2 3 (2 den 30 juni, 1
den 26 januari)
2(1 den 30 juni, 1
den 26 januari)
Slumpförsök 2
1 1 1
Matchningar per
datum
EK14
Slumpförsök 3
0 0
Figur 4, Sammanställd tabell över matchningar
Under undersökningen av klasserna i slumpförsök 1, EK15 och NA15, hade 3 personer (2
från EK15 och 1 från NA15) samma födelsedag den 30 juni och 2 personer (1 från EK15 och
1 från NA15) den 26 januari. I slumpförsök 2, fanns det två personer (1 från NA14 och 1
från SA15) som fyllde år den 20 maj. I det tredje slumpförsök fanns det inga matchningar
mellan eleverna.
4.3 Födelsedagstrender
Figur 5 Diagram över elevers födelsemånad slumpförsök 1
Figur 6 Diagram över elevers födelsemånad slumpförsök 2
Figur 7, Diagram över elevers födelsemånad, slumpförsök 3
?
4.4 Uträkningar
Uträkning för den generella formel för ;(A)P
(A) (A) 1 (1)P=1-P
c
= -?
k-1
i=0
-
i
365
Uträkning för när ?k ?= 58 personer;
1=
365
58
365364363...(365 - 58+1)
***
=1-
365
58
365364363...308
***
1-
4,1019110
*
148
3,4189510
*
146
1,08335020611 ˜ 0,916649794 ˜ 99% ˜-009
Uträkning för när ?k? = 49 personer;
1
365
49
365364363...(365 - 49+1)
***
=1-
365
49
365364363...317
***
=1-
1,2207710
*
124
3,5673910
*
125
1,3422039068 ˜ 0,657796093 ˜ 97% ˜-009
Uträkning för när ?k? = 31 personer;
1=1
365
31
365364363...(365 - 31+1)
***
=1-
365
31
365364363...335
***
2,4291710
*
81
2,6982310
*
79
1 0.269545366271 ˜ 0.730454633729 ˜ 73% ˜-
Successionsandelen,? dvs ?andelen framgångsrika utfall/antal möjliga utfall?* för slumpförsök
1, 2 och 3;
3
2
0,66666.. ˜ 0,676, & 6, = 66= <67>66
*Notera att i resultatet har vardera slumpförsök olika värden för P(A) och ovanstående
uträkning betraktas inte som relativa frekvensen. Med andelen framgångsrika utfall menas
att det fanns minst en matchning bland eleverna.
5. Slutsats och diskussion
5.1 Om teorin, resultatet och diskussion kring den relativa frekvens
I de diagram ovan går det att intyga att av de två slumpförsök fanns sju individer som hade
gemensamma födelsedatum med någon annan inom respektive slumpförsök. I slumpförsök
1 fanns fem individer som delade födelsedatum med någon annan medan i slumpförsök 2
fanns det endast två individer som delade födelsedatum. I slumpförsök 1 fanns det 58
individer som medverkade vilket gav c.a. 99,2% chans att det fanns två individer som
delade födelsedatum. I slumpförsök 2 fanns 49 medverkande individer, detta gav en chans
på ungefär 96,6% att det var två individer som delade födelsedatum. I slumpförsök 3 så
medverkade 31 individer vars sannolikhet motsvarade 73%. Det går att analysera att alla
de tre slumpförsökens sannolikhet hade majoritet för minst en matchning.
Relativa frekvensen kunde inte beräknas då vardera slumpförsök hade olika stor
sannolikhet och därför kunde endast successionsandelen beräknas av att två eller fler
individer som delade födelsedatum. Detta gjordes genom att dividera antalet framgångsrika
utfall, dvs utfall 1 (slumpförsök 1) och utfall 2 (slumpförsök 2) på antalet möjliga utfall, dvs
utfall 1 till 3. Beräkningen blev således . Men låt
3
2
0,66666.. ˜ 0,676,,6, = 66= <67 >66
säga att slumpförsöken hade samma sannolikhet, dvs att lika många personer undersöktes i
vardera slumpförsök (konstant värde på variabeln ?k?). Då hade det ändå behövts fler
slumpförsök för att förfina mot ett exaktare sannolikhetsvärde (desto fler gånger man utför
identiska slumpförsök så blir den relativa frekvensen närmre sannolikheten som kan
beräknas).
Fler slumpförsök inom denna tidsperiod och antalet födelsedatum hade dock varit omöjligt
eftersom det fanns en begränsad mängd födelsedatum med på listan. Det begränsade
antalet födelsedatum hade påverkat resultatet genom att samma födelsedatum hade
använts flera gånger och därav kunde inte fler slumpförsök utföras. En återanvändning av
eleverna i klasslistorna hade dessutom inte varit en slumpmässig undersökning. För att
göra fler slumpförsök hade fler klasslistor med fler personer behövts.
Att 1 adderas till inuti parentesen (365?k?) är eftersom att annars hade det varit en person
för mycket som räknats med i uträkningen. Detta kan ses vid beräkning av fem personer;
) = 1 . Om(minst en matchning vid 5 personer) (A) 1 (1P=1-P
c
= -?
5-1
i=0
-
i
365
365
5
365364...(365 - 5+1)
*
1 inte hade adderas hade det blivit = 1som hade givit ett inkorrekt resultat.
365
5
365364..(365-5)
*
5.1.1 Utveckling av teorin / andra användningsområden
Utveckling av teorin eller andra användningsområden är att räkna ut t.ex. hur många som
är födda i en speciell månad bland ?k? antal personer eller även räkna på hur många som är
födda ett speciellt datum t.ex. 26:e i varje månad. En annan aspekt som kan tas med är
toleransen av definitionen av en matchning. Alltså hur stor är chansen att det matchar om
det sker en ökning av toleransen från 0 till 1. Alltså får exakta datumet anses matcha med ?k
1, k ?och ?k + 1?, exempelvis om ?k = ?26: mars, så tolereras matchningar med 25:e, 26:e och
27:e mars. Sannolikheten hade stigit eftersom det hade funnits fler matchningar. Detta
bevisar den generella formeln;
(A)(A)(1) ,för k21P=1-P
c
=1-?
k-1
i=0
-
3i
365
<1
Om vi jämför med den andre teorin där sannolikheten nådde 0,5 vid ca 23 personer så når
denna nya teori med toleransen +1 sannolikheten 0,5 vid 13 personer;
(A)(A) ˜ 1,59667622235514 ˜ 54,3%P=1-P
c
=1-
365
13
365362359...(365-133+1)
****
=
365
13
365362359...327
***
-040
Denna modifikation på teorin når sannolikheten 0,5 ungefär 77% snabbare än den teori där
en matchning betraktas med toleransen 0 (endast ?k? ger matchning). Beräkningen blir
således;
, ˜ 1,6923076923 ˜ 1,7
13
23
77
Kontroll: ,733,117
*
1=20
5.2 Diskussion om trender
Trender är något som kan vara en stor faktor av resultatet eftersom det syns en stor
skillnad på födelsedagar i de olika månaderna. Om det finns fler som är födda under en
speciell månad t.ex. juni som är väldigt frekvent i alla slumpförsök, ökar chanserna att man
hittar en matchning markant då det inte finns lika många möjliga utfall i en månad jämfört
med ett helt år. Samtidigt så minskar sannolikheten för att folk är födda i de resterande
månader och ger en motsättning på ett av teorins antagande att alla 365 dagar är lika
troliga.
5.3 Om Hypotesen
Enligt hypotesen skulle det vara en väldigt stor sannolikhet att det skulle finnas två
personer som delade födelsedatum bland 58 personer. Detta visade sig stämma då det
fanns fem personer som hade samma födelsedatum som någon annan i test gruppen.
Hypotesen är även att procentsatsen minskar med antalet personer, detta visades när det
var en mindre test grupp. Den mindre test gruppen hade 73% chans för att det fanns
matchningar men vid denna undersökning blev det inga matchningar.
5.4 Felkällor
Vid dessa försök finns det några olika felkällor som kan ha påverkat resultatet och lett till
att exakta resultat inte framkommit. Första felkällan uppstår vid beräkningen av
procentsatserna då inte alla decimaler räknas med då talen är flera. Redan där har exakta
värdet gått förlorat. Den andra felkällan som uppstår är vid avrundning av decimaltal för att
få fram ett mer läsvänligt svar. Båda felkällorna är inte några större problem eftersom det
är väldigt minimala summor som förändras.
5.5 Vid ett ytterligare försök
För att bevisa att denna teori stämmer bättre än vad som visats under denna laboration
hade det behövts fler människor och mycket mer tid. För att få fram ett tillförlitligt resultat
kan det behövas ungefär 23.000 människor. 23 stycken människor till varje försök och för
att få en minskad felmarginal, göra försöket tusen gånger. Det måste vara unika människor
för att resultaten inte ska kunna vara påverkade av något annat resultat om flera personer
använts i olika undersökningar.
5.6 Avslutande slutsatser
Så, det konstateras att födelsedagsparadoxens sannolikhet per antalet personer kan
framställas i en graf om tillräcklig data finns. Hypotesen som framfördes i början av denna
laboration stämde bra överens med det som i slutändan visade sig, även om sannolikheten
för de olika slumpförsöken varierade.
Nästa fråga är då ifall teorin kan stämma utan antagandena och svaret blir således lite
svårare att ge. För antagandet gällande exkluderingen av den 29: e februari så finns det en
större sannolikhet för att det överensstämmer med teorin då den 29:e februari sker vart
fjärde år och det är en väldigt liten chans att någon fyller år på den dagen. Det hade
dessutom gjort en minimal skillnad i det större perspektivet då dagen utgjort chans
1
3654+1
*
utöver de 365 resterande dagarna (antalet möjliga utfall hade varit 365+ eller ca 365
1
1461
+0,000684462696783).
För antagandet om trender sågs hur liten betydelse de spelar i utfallen vilket resultatet
fastslår. Exempelvis i slumpförsök 2 så skedde matchningen i maj som endast utgjorde ca
8,2% av de 12 födelsemånader vilket är relativt litet då största andelen i det slumpförsök
låg på 14,3%. Differens var hela 4,1 procentenheter. Dock får man ha i åtanke att
sannolikhet inte är något som fastslår något med 100% om inte just sannolikheten är 1,
vilket medför att diskussionen i detta fall kan bli oändlig.
Det som kan påverka ett resultat väldigt kraftigt är om ett tvillingpar som är födda på
samma dag medverkar i detta experiment då detta förhållandet inte är beräknat i de
matematiska uträkningarna. Detta kan endast bevisas i teorin under denna laboration p.g.a.
att det saknas underlag av tvillingpar.
Så, motsättningar må finnas i teorin i dennes verkliga form och fler slumpförsök bör utföras
för att ge ett bättre svar på frågan. Så kanske blir slutsatsen att ställa en till hypotes för en
framtida laboration som är mer omfattande och på denna hypotes anses resultaten i denna
rapport vara grundpelare. De belyser tydligt det faktum att vid varierande
sannolikhetsvärden där värdena är närmare 100% chans än 0% chans, så agerade
majoriteten av utfallen enligt teorin, och det är något extraordinärt för den utåtstående
individ som ej hört talas om denna paradox förut.
6. Källanvisning
Birthday Problem, Wikipedia, ?https://en.wikipedia.org/wiki/Birthday_problem? , 17/ 03
16
Födelsedagsparadoxen, Wikipedia,
https://sv.wikipedia.org/wiki/F%C3%B6delsedagsparadoxen? 14 / 03 16
Ideone, ?https://ideone.com/
Lecture 3: Birthday Problem, Properties of Probability | Statistics 110, Harvard University ,
YouTube,,?https://youtu.be/LZ5Wergp_PA?, 16 / 03 16
Lösning av Paradoxen med C++ kod, av Carl Örnberg, Ideone, ?https://ideone...
...läs fortsättningen genom att logga in dig.
Medlemskap krävs
För att komma åt allt innehåll på Mimers Brunn måste du vara medlem och inloggad.Kontot skapar du endast via facebook.
Källor för arbetet
Saknas
Kommentarer på arbetet
Inga kommentarer än :(
Liknande arbeten
Källhänvisning
Inactive member [2016-10-10] Födelsedagsparadoxen i verklighetenMimers Brunn [Online]. https://mimersbrunn.se/article?id=59891 [2024-04-28]