Bayesisk gennemsnit - Bayesian average

Et Bayesiansk gennemsnit er en metode til at estimere gennemsnittet af en befolkning ved hjælp af udefrakommende oplysninger, især en allerede eksisterende tro, der er indregnet i beregningen. Dette er et centralt træk ved Bayesiansk fortolkning . Dette er nyttigt, når det tilgængelige datasæt er lille.

Beregning af Bayesian gennemsnitlige anvendelser forudgående middelværdi m og en konstant  C . C  vælges baseret på den typiske datasætstørrelse, der kræves til et robust estimat af prøvegennemsnittet. Værdien er større, når den forventede variation mellem datasæt (inden for den større befolkning) er lille. Det er mindre, når datasættene forventes at variere væsentligt fra hinanden.

Dette svarer til at tilføje C -datapunkter med værdi m til datasættet. Det er et vægtet gennemsnit af et tidligere gennemsnit m og prøvegennemsnittet.

Når de binære værdier 0 eller 1 er, kan m tolkes som det forudgående estimat af en binomisk sandsynlighed med det bayesiske gennemsnit, der giver et posteriort estimat for de observerede data. I dette tilfælde kan C vælges baseret på det ønskede Binomial -proportion konfidensinterval for prøveværdien. For eksempel sikrer sjældne resultater, når m er lille, at vælge et 99% konfidensinterval med en bredde på ca. 2 m .


Se også

Referencer

  • Yang, Xiao; Zhang, Zhaoxin (2013). "Kombination af prestige og relevansrangering for personlig anbefaling". Proceedings of the 22nd ACM international Conference on Information & Knowledge Management (CIKM) : 1877-1880. doi : 10.1145/2505515.2507885 .