Schwarzes Hamburg

Schwarzes Hamburg => Archiv => Gedankenaustausch -Archiv- => Thema gestartet von: Thomas am 05 August 2005, 11:45:54

Titel: Statistik ?
Beitrag von: Thomas am 05 August 2005, 11:45:54
Aus einem Artikel von Spiegel-Online :

Bushs Ansehen auf dem Tiefpunkt

Die US-Bürger sind mit der Irak-Politik von Präsident George W. Bush so unzufrieden wie nie zuvor. Weniger als die Hälfte der Befragten ist mit seiner Amtsführung einverstanden.

Washington - Nur noch 38 Prozent sagten bei einer heute veröffentlichten Umfrage des Ipsos-Instituts für die Nachrichtenagentur APS, sie seien mit Bushs Vorgehen im Irak einverstanden. In den vergangenen Monaten hatten sich jeweils mindestens 40 Prozent für Bushs Irak-Politik ausgesprochen.

...

Befragt wurden zwischen dem 1. und 3. August 1000 Erwachsene. Die Fehlerquote wurde mit drei Prozentpunkten angegeben.


Frage : Wieso glaubt man, das man gerade in einem so großen Land wie den USA eine einigermaßen realistische statistische Größe ermitteln kann, wenn man nur lächerliche 1000 Leute befragt ?  :haeh?:


(Hier der Link zum Artikel : )

http://www.spiegel.de/politik/ausland/0,1518,368375,00.html
Titel: Statistik ?
Beitrag von: Alex am 05 August 2005, 12:44:04
Werden denn 1000 Erwachsene in jedem Bundesstaat befragt? Das würde dann schon realistischer sein.
Titel: Statistik ?
Beitrag von: Thomas am 05 August 2005, 12:45:48
Zitat
Werden denn 1000 Erwachsene in jedem Bundesstaat befragt? Das würde dann schon realistischer sein.

Also so wie ich den Artikel verstehe, sind das 1000 Erwachsene insgesamt.
Titel: Statistik ?
Beitrag von: Alex am 05 August 2005, 12:50:31
Ah, sollen die Amis doch machen was die wollen. Bush hat die Wahlen beide male ja auch nicht gewonnen.
Titel: Statistik ?
Beitrag von: LordIggi am 05 August 2005, 12:52:01
um mal ehrlich zu sein:


es war zu erwarten..ich denke das denken evtl. auch noch ander Mitbürger der USA
Titel: Statistik ?
Beitrag von: Thomas am 05 August 2005, 12:55:31
Zitat
Ah, sollen die Amis doch machen was die wollen

Ist die Frage, ob hierzulande oder anderswo mehr Menschen in so eine (scheinbar) representative Umfrage einfließen.

Zitat
Bush hat die Wahlen beide male ja auch nicht gewonnen.

Darum ging's zwar nicht, aber die zweite Wahl hat er schon gewonnen.Außer, da haben auch 1000 Amis representativ für's ganze Volk gewählt =)

Zitat
es war zu erwarten..ich denke das denken evtl. auch noch ander Mitbürger der USA

Das denke ich auch, aber die Frage war halt, ob lächerliche tausend Gestalten ausreichen, um die Meinung eines Millionenvolkes zu representieren.
Titel: Statistik ?
Beitrag von: messie am 05 August 2005, 13:11:13
hm, da musst du mal die statistiker fragen ... für mich ist das im studium zu lange her. Ich kann mich aber dran erinnern dass rein mathematisch gesehen eine erstaunlich kleine Menge an Menschen ausreicht -wenn sie die richtige Verteilung aufweist- um repräsentativ für eine größere Gesamtheit zu sein.

1000 Leute für die gesamten USA erscheint mir allerdings auch extrem wenig.
Titel: Re: Statistik ?
Beitrag von: DaD.SmurF am 05 August 2005, 13:22:59
Zitat von: "Thomas"
Nur noch 38 Prozent sagten [...] jeweils mindestens 40 Prozent für Bushs Irak-Politik ausgesprochen.

Die Fehlerquote wurde mit drei Prozentpunkten angegeben.

Hm... Sehr seltsam. Früher haben sich mindestens 40% FÜR Bush ausgesprochen, jetzt nur noch 38%, wobei die Fehlerquote bei 3 Prozentpunkten liegt, also im Extremfall wieder bei 41%....!?  :shock:

Oder verstehe ich da was falsch?

ByE DaD
Titel: Statistik ?
Beitrag von: Foolx am 05 August 2005, 14:01:19
Viel schlimmer finde ich die Tatsache das NACH WIE VOR 38% für ihn sind.
Das ist meiner Meinung nach noch viel viel viel zu viel.
von 1000 befragten sind 380 nach wie vor für Bush und heissen gut was er tut. Die restlichen finden es schlecht, kümmern sich nicht drum, sind eh gegen Bush bla bla.
Das könnte glatt noch als deutliche Mehrheit ausgelegt werden. Das sind alles Leute die den glatt trotz der Scheiße die der Idiot verzapft hat nochmal wählen würden!!
Zum Glück bleibt uns das erspart. Dafür haben die Amis in der Nächsten Amtsperiode dann auch endlich einen Österreicher als Führer.. ähm Präsident.
Titel: Statistik ?
Beitrag von: colourize am 05 August 2005, 14:13:49
Zitat von: "Thomas"
Frage : Wieso glaubt man, das man gerade in einem so großen Land wie den USA eine einigermaßen realistische statistische Größe ermitteln kann, wenn man nur lächerliche 1000 Leute befragt ?  :haeh?:

Die Bestimmungsgrößen für den nötigen Umfang einer Stichprobe sind:

a) Abweichung vom Erwartungswert unter Annahme der Nullhypothese
b) Zahl der Freiheitsgrade
c) zugelassener Vertrauensbereich

Natürlich muss die Stichprobe eine Zufallsauswahl sein, d.h. alle Alters-, Geschlechts-, Religions-, regionale, ethnische Gruppen sollten in der Stichprobe gemäß ihres Anteils in der Grundgesamtheit vertreten sein.

Zum konkreten Fall:

a) Die Abweichung vom Erwartungswert unter Annahme der Nullhypothese (= kein Zusammenhang) ist recht groß: Die Nullhypothese besagt, dass es keinen Zusammenhang zwischen Frage und Antwort gibt, dass also 50% mit "Ja" antworten und 50% mit "Nein" (vollkommen zufällig). In diesem Fall ist das Verhältnis 38% zu 62% - also eine deutliche Abweichung von der Nullhypothese.

b) Es handelt sich um eine Dichotomie (es gibt nur "ja" und "nein"), also genau ZWEI Möglichkeiten

c) Die Macher der Befragung können mit 3% Fehler leben. Das bedeutet, dass der "tatsächliche" Wert für "ja" nicht 38% betragen muss, sondern irgendwo zwischen 35% und 41% liegt. - Bzw. andersrum: Sie haben 1000 Leute befragt, und errechnen daraus einen möglichen Fehler von 3% - dieser wäre kleiner, wenn man 1.) mehr Menschen befragt hätte UND/ODER 2.) die Abweichung zur Nullhypothese größer wäre (z.B. wenn 10% der Befragten mit "ja" und 90% mit "nein" geantwortet hätten).

Als allgemeine Formel zu Berechnung des benötigten Stichprobenumfangs ist diese ausformulierte Schreibweise hier vielleicht ganz anschaulich:

Benötigter Stichprobenumfang = ((Zahl d. Freiheitsgrade * ((Messwert Option A * Messwert Option B)^0,5) / Vertrauensbereich )^2

Im konkreten Fall wäre die Formel (zum reinkopieren in Excel):
=((2*((0,38*0,62)^0,5))/0,03)^2

Ich habe mir mal erlaubt, die Formel umzuformen und den angeblichen Fehler von 3% zu überprüfen. Es ist eine gerundete Angabe; der tatsächliche Fehler liegt bei 3,0698534%
Um einen max. Fehler von 3% zu erreichen, hätte man 1047 Personen befragen müssen.

Die Größe der Grundgesamtheit spielt für den benötigten Stichprobenumfang dagegen keine Rolle. Wichtig ist nur, dass es sich um eine Zufallsstichprobe handelt.
Titel: Statistik ?
Beitrag von: Thomas am 05 August 2005, 14:39:46
Äh, Colourize, kannst du das nochmal kurz, knapp und auf deutsch formulieren bitte ? =) Vieleicht kapiere ich das, wenn ich es mir zehn mal durchlese und lange drüber nachdenken, aber dazu habe ich weder Zeit noch Lust  :wink:

Mag sein, das das mathematisch korrekt ist, aber wie will man denn Formeltechnisch das Wahlverhalten von ca. 280 Millionen Einwohnern ausloten, wenn man nur 1000 befragt ? Also das kann ich mir, Formel hin oder her, beim besten Willen nicht vorstellen, selbst wenn unter den 1000 alle Volksgruppen ädequat vertreten sind ?

Zitat
Natürlich muss die Stichprobe eine Zufallsauswahl sein, d.h. alle Alters-, Geschlechts-, Religions-, regionale, ethnische Gruppen sollten in der Stichprobe gemäß ihres Anteils in der Grundgesamtheit vertreten sein.

Wiederspricht sich das nicht ? Einerseits "Zufallsauswahl", andererseits müssen alle Gruppen Anteilsmäßig vertreten sein ? Was denn nun ?
Titel: Statistik ?
Beitrag von: colourize am 05 August 2005, 15:04:32
Zur zweiten Frage: "Zufallsauswahl" bedeutet, dass jeder individuelle Fall der Grundgesamtheit (= in diesem Fall: Jeder US-Bürger) die gleich große Chance hat, in die Stichprobe zu rutschen. Begreif den Begriff so, wie man "Zufall" im umgangssprachlichen Gebrauch auch verwenden würde: Jeder Lottospieler hat die gleiche Chance auf einen Gewinn (wenn alle die gleiche Zahl von Kästen ausfüllen). Wer gewinnt ist absoluter Zufall.

Keine Zufallsauswahl wäre es dagegen, wenn man die 1000 Befragten nur aus Colorado wählen würde, oder wenn man nur schwangere Frauen unter 25 befragt hätte, oder schwerpunktmäßig Neger die im Knast sitzen... oder im Wesentlichen Männer mit Cowboyhüten die Mitglieder in einem Rod 'n' Gun Club sind.
Ich gehe davon aus, dass die Stichprobe zufällig gezogen wurde: D.h. dass ein Mitglied eines Rod 'n' Gun Clubs aufgrund des Merkmals seiner Club-Mitgliedschaft keine größere Chance hatte, in die Stichprobe zu rutschen. Und dass ein Neger im Knast die gleiche Chance hat, zufällig in die Stichprobe zu rutschen - genau dieselbe Chance nämlich, wie der Cowboy oder die Schwangere unter 25. Wer befragt wird ist eben vollkommener Zufall.

Zur ersten Frage ("auf deutsch formulieren"): Nimm ein Beispiel den Wurf einer Münze. Es gibt genau zwei Möglichkeiten wie das Ding zum Liegen kommt, namentlich Kopf oder Zahl. Wenn Du nun eine Messung von 100 Würfen gemacht hast (= Stichprobe gezogen), kommst Du vielleicht auf 52 mal Kopf und 48 mal Zahl. In diesem Fall ist es offensichtlich, dass Du einen Irrtum aufsitzt, wenn Du meinst dass Kopf das häufigere Ergebnis wäre. Aus diesem Grund wird der Vertrauensbereich angegeben. Gut möglich, dass Du Dich irrst, wenn Du meinst, dass in 52% der Fälle "Kopf" das richtige Ergebnis ist.

Wenn Du den Versuch nun 1000 mal wiederholst, wirst Du vielleicht bei 50,2 % Kopf und 49,8% Zahl auskommen.. der Vertrauensbereich wird besser (der Messfehler wird kleiner).

Für das Experiment ist es aber vollkommen egal ob Du nun eine Aussage über 100.000 Münzwürfe, 500.000 Münzwürfe oder 200 Millionen Münzwürfe machen möchtest. 50% Kopf, 50% Zahl ist das richtige Ergebnis (was wir uns in diesem Fall aufgrund logischer Überlegungen erschließen können). Falls wir das wie im Fall von Meinungen nicht können, dann können wir auf unsere Messung zurückgreifen: Wir haben 1000 Messungen gemacht, und in 50,2% der Messungen kam Kopf, in 49,8% kam Zahl, bei einem Fehler von soundsoviel Prozent.

Jetzt klarer?
Titel: Statistik ?
Beitrag von: Thomas am 05 August 2005, 15:19:08
Zitat
Zur zweiten Frage: "Zufallsauswahl" bedeutet, dass jeder individuelle Fall der Grundgesamtheit (= in diesem Fall: Jeder US-Bürger) die gleich große Chance hat, in die Stichprobe zu rutschen.

OK, dann hat mich lediglich die Bezeichnung "Zufallsauswahl" verwirrt.

Zitat
Jetzt klarer?

Ich glaube schon, allerdings trau' ich der ganzen Sache von der Theorie her immer noch nicht.

Es wird ja scheinbar davon ausgegangen, das Grundlegend (sowohl bei der Münze als auch bei der Umfrage) 50/50 das "richtige" Ergebniss wäre.Wie kommt man darauf ?

Oder am Beispiel der Münze : Es ist ja nicht logisch festgelegt, das "normalerweise" 50% Kopf und 50%Zahl bei einer Messung herauskommen müßte, da es ja ein reiner Zufallswert ist.
Titel: Statistik ?
Beitrag von: colourize am 05 August 2005, 15:36:27
Zitat von: "Thomas"
Es wird ja scheinbar davon ausgegangen, das Grundlegend (sowohl bei der Münze als auch bei der Umfrage) 50/50 das "richtige" Ergebniss wäre.Wie kommt man darauf ?

Nein, das war doch nur ein Beispiel, bei dem wir uns das "richtige" Ergebnis logisch erschließen können.

Eben WEIL wir das bei Meinungsumfragen so nicht können, wird der Vertrauensbereich angegeben. Angenommen, bei einem Stichprobenumfang von 1.000 bekommen wir 50,2% Kopf und 49,8% heraus, ohne das richtige Ergebnis zu kennen. In diesem Fall kann ich Dir berechnen, dass der Vertrauensbereich bei 3,16% liegt, d.h. "in Wirklichkeit" könnten es maximal 53,4% Kopf sein, minimal 47,04%.
Wenn Du 10.000 Messungen machst, und immer noch bei 50,2% Kopf erreichst, dann ist der Vertrauensbereich nur noch 0,99% - d.h. in "Wahrheit" wird die Quote für Kopf minimal 49,2% betragen, und maximal 51,2%... - je mehr Messungen Du machst, um so genauer wirst Du Vertauen in Deinen Messwert von 50,2% Kopf gewinnen.(*)


(*) Und damit aus logischen Überlegungen bei einer Stichprobe von Unendlich feststellen, dass es sich offenbar um eine gezinkte Münze handelt. ;)
Titel: Statistik ?
Beitrag von: Thomas am 05 August 2005, 16:00:15
Genau das :
Zitat
Angenommen, bei einem Stichprobenumfang von 1.000 bekommen wir 50,2% Kopf und 49;8% heraus, ohne das richtige Ergebnis zu kennen. In diesem Fall kann ich Dir berechnen, dass der Vertrauensbereich bei 3,16% liegt, d.h. "in Wirklichkeit" könnten es maximal 53,4% Kopf sein, minimal 47,04%.

frage ich mich.

Sprich, wie kommst du auf einen Vertrauensbereich, der dir sagt, wie die Quote "in wirklichkeit" sein könnte ? Rechnerisch ist das mit der Formel machbar, aber wie legst du fest, das sich die Formel mit der Wirklichkeit deckt ?

Ich halte diese rechnerische "wahrscheinlichkeitsermittlung" für zu wenig realistisch, da die vielen "vieleicht's" des Lebens nicht mit einkalkuliert werden.Das ist vermutlich auch der Grund, warum man an fast jeder Statistik solange herumrechnen kann, bis ein subjektiv akzeptables Ergebniss dabei herauskommt.

Oder um zu der Ursprünglichen, im Spiegel genannten Umfrage zurückzukommen : Da kommt man bei 1000 Befragten auf Ergebnisse im Verhältnis von 38/62, ich unterstelle auch, das die  "Zufallsauswahl" berücksichtigt wurde :
Woher will man realistisch gesehen wissen, das sich 1000 andere, ebenso gleich verteilte Befragte nicht gänzlich anders geäußert hätten ?
Titel: Statistik ?
Beitrag von: Simia am 05 August 2005, 16:17:54
Zitat von: "Thomas"
Ich halte diese rechnerische "wahrscheinlichkeitsermittlung" für zu wenig realistisch, da die vielen "vieleicht's" des Lebens nicht mit einkalkuliert werden.Das ist vermutlich auch der Grund, warum man an fast jeder Statistik solange herumrechnen kann, bis ein subjektiv akzeptables Ergebniss dabei herauskommt.


Geht mir auch so. Man braucht natürlich Zahlen/Wahrscheinlichkeiten, zur Berechnung von diesem und jenem. Aber es bestünde genaugenommen überhaupt kein Grund, sich in Sicherheit zu wiegen, nur weil lediglich Nullkommasoundsoviele Menschen unter 30 Jahren einen Schlaganfall erleiden. Daß es einen erwischen kann, davor schützt keine Statistik.

Nix für Paranoide ...  :wink:
Titel: Statistik ?
Beitrag von: messie am 05 August 2005, 16:31:19
Na, Statistik ist ja immer gewissen Unsicherheitsfaktoren unterworfen. Man geht in der Statistik i.d.R. davon aus dass es keine externen Faktoren gibt die das Ergebnis beeinflussen. Bei Meinungsumfragen gibts die natürlich. Wenn also n Ami sagt "ja, ich bin für Bush" kann das ja genauso heißen dass er das nur sagt weil s n Typ ist der niemals nein sagt oder weil seine Frau auch ja gesagt hat obwohl er vielleicht ohne diese Zusatzfaktorern nein gesagt hätte.

Solche Meinungsumfragen sind immer nur Stimmungsbarometer, nicht mehr. Wer sich da zu sehr darauf verlässt ist eh mindestens auf einem Auge blind.

Anders sieht es bei den Hochrechnungen aus, da sind von aussen beeinflussende Faktoren extrem gering, so dass die Prognosen oft auch sehr genau sind. Auch da sind die Stichproben ja vergleichsweise klein, dennoch unterscheiden sich die Prognosen selten mehr als um einen Prozentpunkt pro Partei gegenüber dem später tatsächlich feststehenden Endergebnis.

Was lernen wir draus? - Es gibt immer noch genügend unaufgeklärte Amerikaner und Statistikern wird für alle Zeiten die Arbeit nicht ausgehen, selbst wenn die Statistiken nicht so wahnsinnig viel aussagen mögen.  :wink:
Titel: Statistik ?
Beitrag von: colourize am 05 August 2005, 17:33:38
Zitat von: "Thomas"
Woher will man realistisch gesehen wissen, das sich 1000 andere, ebenso gleich verteilte Befragte nicht gänzlich anders geäußert hätten ?

Man *weiss* es nicht. Aber: Wenn die 1000 Einen genauso sind wie die 1000 Anderen (= Zufallsauswahl aus der Grundgesamtheit), dann kann man errechnen, mit welcher Vertrauenssicherheit die einen 1000 sich so äußern wie die anderen 1000.

Je komplexer die Fragestellung und die Antwortoptionen, desto mehr Personen müssen befragt werden um Aussagen mit der gleichen Vertrauenssicherheit treffen zu können.


Zitat von: "Thomas"
Sprich, wie kommst du auf einen Vertrauensbereich, der dir sagt, wie die Quote "in wirklichkeit" sein könnte ? Rechnerisch ist das mit der Formel machbar, aber wie legst du fest, das sich die Formel mit der Wirklichkeit deckt ?

Wenn es sich um eine Zufallsauswahl handelt, bildet die Stichprobe die Grundgesamtheit ("Wirklichkeit") ab.

Zitat von: "Thomas"
Ich halte diese rechnerische "wahrscheinlichkeitsermittlung" für zu wenig realistisch, da die vielen "vieleicht's" des Lebens nicht mit einkalkuliert werden.Das ist vermutlich auch der Grund, warum man an fast jeder Statistik solange herumrechnen kann, bis ein subjektiv akzeptables Ergebniss dabei herauskommt.

Die Praxis gibt aber mehr den statistischen Prognosen als Deiner Skepsis recht. ;)

Bei einer einfachen "Ja/Nein-Frage" bleibt nicht viel Spielraum zum Tricksen mit Statistik. Du hast recht - es gibt ein paar ganz nette statistische Taschenspielertricks. Bei der konkreten Frage kann zumindest ich aber keine solchen erkennen; und ich denke mal, dass mir die meisten ebensolchen schon einmal untergekommen sind. ;)
Titel: Statistik ?
Beitrag von: SuperTorus am 05 August 2005, 21:55:58
Man kann die Fehlerquote ja aus Erfahrung abschätzen.

Wenn man am Tag der Wahl eine Umfrage macht, das Ergebniss aber um x abweicht, dann kann man daraus den durchschnittlichen Vertrauensbereich für Fragen dieses Themas rechnen.

Hat man mehrere dieser "Umfrage + Wirklichkeit" Daten zur Verfügung kann man zusätzlich noch Alter der Daten gewichtet mit hinneinrechnen und bekommt sogar Trends in der Veränderung der Vertrauensbereiche in den Griff.

Mathematik ist toll.
Titel: Statistik ?
Beitrag von: colourize am 05 August 2005, 22:21:04
Ja.. ich weiss zwar nicht, wie diese Formel zu Stande gekommen ist, aber so wie von Supertorus beschrieben könnte sie in der Tat empirisch entwickelt worden sein.
Titel: Statistik ?
Beitrag von: SuperTorus am 05 August 2005, 22:41:24
so würd ich's zumindest machen: Gauss-sche Gewichtung über die vorherigen Messreihen unter quadratischer Minimierung des Gesammtfehlers *aller* Messreihen.

Das ist das Optimum was man als Mathematiker machen kann ohne esoterisch zu werden.
Titel: Statistik ?
Beitrag von: colourize am 05 August 2005, 23:15:43
So.. ich habe gerade in der Badewanne nochmal über das Problem nachgegrübelt, und festgestellt, dass es eine mathematische Lösung gibt, die vollkommen unabhängig von irgendwelchen empirischen Befunden besteht. Dementsprechend gibt es auch überhaupt keine Veränderung der Vertrauensbereiche im zeitlichen Verlauf. Die Formel gilt universell, und zwar für sämtliche Messungen (und damit auch für sämtliche Zufallsstichproben).

Nehmen wir an, dass wir einen Sachverhalt messen wollen, für den wir wissen, dass eine Fiffty-Fiffty Chance besteht (z.B. Münzwurf). Nehmen wir ferner an, dass wir mit einem 100%igen Fehler leben könnten (also das uns mit anderen Worten scheissegal ist, ob wir richtig messen). Setzen wir die Werte in obige Formel ein, sieht das so aus:

=((2*((0,5*0,5)^0,5))/1)^2

(2 Freiheitsgrade, 50/50 Chance, die 1 im Nenner besagt 100% Fehler, mit dem wir leben können)

Was kommt da raus: Wie zu erwarten war: 1

D.h. wir müssen genau 1 mal die Münze werfen, wenn es uns scheissegal ist, ob wir uns "vermessen" (d.h. eine 100%ige Irrtumswahrscheinlichkeit in Kauf nehmen). Mathematisch ist das btw. interessant: Bei einer gezinkten Münze mit einer 30 zu 70 Chance müssten wir bei einem in Kauf genommenen Fehler von 100% nur 0,84 mal werfen ;) )

Aber denken wir das Ding mal weiter: Münzwurf, 50-50 Chance, Vertrauensbereich: 50%
(D.h. für uns wäre ok, wenn wir zu 50% daneben liegen).

Formel in diesem Fall:

=((2*((0,5*0,5)^0,5))/0,5)^2

Ergebnis: Wir müssen 4 mal werfen...

Denken wir mal weiter: Münzwurf, 50-50 Chance, Vertrauensbereich 0% - das heißt, wir lassen keinen Fehler zu. Nun, wie oft wir werfen müssen, kann uns die Formel nicht sagen - weil wir durch 0 nicht dividieren können.

Offenkundig geht aber bei einem minimalen Vertrauensbereich die Zahl der nötigen Messungen gegen unendlich.
Titel: Statistik ?
Beitrag von: Bombe am 05 August 2005, 23:23:12
Irgendwer hat neulich mal eine Methode entwickelt, um Umfragen dieser Art noch genauer zu machen... wenn ich mich richtig entsinne (ich hab leider voll keine Quelle dafür im Kopf), belief sich das ganze darauf, dass zwei Fragen gestellt wurden: Einmal nach dem, was man wissen will, und dann nochmal danach, was die befragte Person glaubt, wieviele Personen ebenfalls so antworten.

Aus den Daten, die sich aus der Antwort auf die zweite Frage ergeben, kann man dann irgendwie die Fehlerquote bei der ersten Frage minimieren. Oder so.
Titel: Statistik ?
Beitrag von: SuperTorus am 05 August 2005, 23:25:56
Das ist klar, Colourize. Solange die Warscheinlichkeit  berechenbar ist ist auch alles ganz einfach.

Es gibt ja immer einen Unterschied zwischen wählen und "nur so tun als ob".  Wenn's hart auf hart kommt, dann landet das Kreuz halt doch mal da, wo's letztes mal auch war, auch wenn man auf der Straße sein Maul aufreißt.

In der Fehlerquote liegt da ein systematischer Fehler, den Du zwar abschätzen, aber niemals rausrechnen kannst. Nichtmal wenn Du alle Wähler fragst und faktisch eine Phantom-Wahl durchführst.

Um auf's Thema zurückzukommen: 1000 Befrage sind m.E. eine lächerliche Stichprobe um eine Prognose zu stellen.
Titel: Statistik ?
Beitrag von: colourize am 05 August 2005, 23:26:44
:shock:

Torus... ähmm.. hast Du meine Postings von oben gelesen? 8)

edit:
Du hast sicher recht, dass die Umfrageergebnisse nicht mit dem tatsächlichen Abstimmungergebnis übereinstimmen müssen. Das ist aber keine Frage des Stichprobenumfangs (Repräsentativität der Stichprobe für Rückschlüsse auf die Grundgesamtheit), sondern eine Frage der Messsicherheit ("Validität" genannt). Wie viele Personen man befragt ist davon vollkommen unabhängig.

"Validität" bezeichnet, ob in einer sozialwissenschaftlichen empirischen Erhebung das gemessen wurde, was vorgeblich gemessen werden soll. D.h. für den konkreten Fall, dass man mit der Frage "Sind Sie mit der Irak-Politik des Präsidenten einverstanden?" vielleicht nicht die tatsächliche Zustimmung erhebt, sondern vielleicht eher so etwas wie den "Unmut in der gesamten Bevölkerung".

Wie gesagt: Das ist eine vollkommen andere Problemlage als die Frage nach der Repräsentativität der Stichprobe! Man kann so viele Menschen befragen wie man will - man erhält durch die Erhöhung des Umfangs der Stichprobe keine Verbesserung der Validität, sondern nur eine Verbesserung der Aussagegenauigkeit (Vertrauensbereich).
Titel: Statistik ?
Beitrag von: colourize am 06 August 2005, 00:49:51
Zu diesem Thema noch einen Link zur Sonntagsfrage von Infratest dimap (http://www.infratest-dimap.de/?id=9), die ja die aktuellen Wahlumfragen, die u.a. in der Tagesschau genannt werden, erstellen.

Dort werden 1600 Personen befragt. In Folge dessen besteht eine Vertrauenssicherheit (hier umgangssprachlich als "Fehlertoleranz" bezeichnet" von  1,1 bis 2,5 Prozentpunkten. Die 1,1 gilt für gemessene Werte um 5%, die 2,5 für Werte um 50%.
Wenn man die Werte in die obige Formel einsetzt, stellt man - oh Wunder - fest, dass hier dieselbe Berechnung zu Grunde liegt. ;)