Stichprobengröße & Fehlermarge: Appinio-Online-Rechner für Umfragen
Appinio Research · 16.06.2026 · 15min Lesezeit
Inhalt
Du möchtest wissen, wie viele Befragte du für deine nächste Studie benötigst, um wirklich valide Daten zu erhalten? Die Berechnung der passenden Stichprobengröße und das Verständnis der Fehlermarge sind das Fundament jeder verlässlichen Forschung. In diesem Leitfaden erfährst du Schritt für Schritt, wie du die perfekte Stichprobe ermittelst und deine Ergebnisse repräsentativ gestaltest.
Ob es um die politische Meinung, die Kundenzufriedenheit, den Appinio Hype Tracker oder eine Mitarbeiterbefragung in einem Unternehmen geht: Umfragen sind das gängigste Mittel, um die öffentliche Stimmung, Meinungen, Überzeugungen und Tendenzen zu ermitteln. Und je mehr Menschen man befragt, desto näher kommt man natürlich an ein repräsentatives Ergebnis heran. Aber stelle dir vor, du würdest alle Menschen im Vereinigten Königreich befragen, um herauszufinden, wen sie bei der nächsten Wahl wählen würden – unmöglich!
An dieser Stelle kommt die Notwendigkeit einer repräsentativen Stichprobe ins Spiel.
Eine repräsentative Stichprobe konzentriert sich auf einen Teil der Bevölkerung und zielt darauf ab, die Ansichten der Allgemeinheit widerzuspiegeln. Aber woher weißt du, insbesondere in der Umfrageforschung, wie viele Befragte du benötigst, um eine repräsentative Stichprobe der Bevölkerung zu erhalten? Welche Variablen musst du berücksichtigen? In diesem Artikel zeigen wir dir, welche Schlüsselwerte du benötigst, um die perfekte Stichprobe für deine Studie zu berechnen und wie genau deine Ergebnisse die Bevölkerung repräsentieren.
Du willst den Stichprobenumfang für deine Studie schnell berechnen und hast bereits alle Eckwerte? Dann nutze unseren Online-Stichprobenberechner, um die benötigte Stichprobe zu ermitteln.
Stichproben-Rechner
Nutze unseren Rechner, um die Stichprobengröße für deine Studie schnell zu ermitteln. Gib einfach deine Werte ein und prüfe das Ergebnis. Alle im Rechner verwendeten Metriken werden im weiteren Verlauf des Artikels ausführlich erläutert. Wenn du weitere Fragen hast, kannst du dich gerne über den Chat an unsere Experten wenden.
Definition: Was ist eine Stichprobe?
Eine Stichprobe ist ein kleiner Teil oder eine kleine Menge, die zeigen soll, wie die Gesamtheit aufgebaut ist.
Es gibt verschiedene Methoden der Stichprobenerhebung, z.B. eine „Zufallsstichprobe“, bei der die Befragten rein zufällig aus der Gesamtbevölkerung ausgewählt werden, sodass jedes Mitglied der Gesamtbevölkerung die gleiche Chance hat, für die Studie ausgewählt zu werden.
Eine Zufallsstichprobe ist nützlich, wenn du explorative Marktforschung betreibst oder neue Ideen sammeln willst. Sie wäre aber nicht sinnvoll, wenn du wissen willst, wie viele Briten vegan leben, da deine Zufallsstichprobe einige Teilnehmer ausschließen könnte (z.B. nicht genügend Frauen) oder zu viele Personen aus derselben Gruppe einschließen könnte (z.B. zu viele Millennials). So wärst du nicht in der Lage, Erkenntnisse zu gewinnen, die auf deine gewünschte Zielgruppe oder die allgemeine Bevölkerung anwendbar sind.
Warum die Stichprobengröße wichtig ist
Gerade in der empirischen Forschung muss eine Stichprobe bestimmte Kriterien erfüllen und alle verschiedenen Gruppen – wie Frauen, Männer oder verschiedene Altersgruppen – im gleichen Verhältnis zur Gesamtbevölkerung enthalten. Außerdem sollte die Stichprobe groß genug sein, um nicht nur repräsentativ zu sein, sondern auch zuverlässige Aussagen zu erlauben. Bei der Auswahl einer Stichprobe ist es wichtig, ihre Zuverlässigkeit zu prüfen. Ist die Stichprobe zu klein, können die gesammelten Informationen unvollständig sein. Ist die Stichprobe hingegen zu groß, wäre dies eine Verschwendung von Ressourcen. Je größer die Gruppe ist, desto näher liegen die Ergebnisse am Zielmarkt, und desto weniger Zufallsfaktoren, Fehler und falsche Aussagen können das Ergebnis verzerren. Die Ergebnisse gelten als repräsentativ für die Gesamtheit, d. h. für die Allgemeinheit, wenn sie die Normalverteilung in der Population widerspiegeln.
Wenn du möglichst zuverlässige Umfragedaten erhalten willst, musst du dich bemühen, deine Umfrage repräsentativ zu gestalten. In der Marktforschung musst du Daten von der Zielgruppe sammeln, bevor du ein Produkt auf den Markt bringst, damit du ein Produkt anbieten kannst, das die Verbraucher auch kaufen oder benutzen wollen. Du kannst jedoch nicht jeden potenziellen Käufer nach seiner Meinung fragen, das wäre einfach zu zeitaufwändig und nicht kosteneffizient. Zudem ist es unmöglich, die Größe der potenziellen Käufergruppe exakt vorab zu bestimmen. Daher musst du, bevor du deine Umfrage an die Befragten verschickst, eine Stichprobengröße festlegen, die deine Zielpopulation so gut wie möglich und in all ihren Facetten repräsentiert.
Wie groß sollte eine Stichprobe sein?
Je größer die Stichprobe ist, desto genauer sind die Ergebnisse, richtig?
Im Allgemeinen gilt: Je größer die Stichprobe, desto repräsentativer ist sie.
Die Ergebnisse einer Umfrage gelten als repräsentativ, wenn die Ergebnisse der Umfrage die Gesamtbevölkerung genau widerspiegeln. Das bedeutet, dass du zuverlässige Schlussfolgerungen über die allgemeine Bevölkerung ziehen kannst, da alle Merkmale der Zielbevölkerung auch in deiner Stichprobe vorhanden sind.
Mit einer größeren Stichprobe ist es also einfacher, Repräsentativität zu erreichen. Aber andererseits ist die Erhebung umso teurer und zeitaufwändiger, je größer die Stichprobe ist. Wie kannst du also Kosten und Repräsentativität optimal in Einklang bringen?
Dazu musst du einen Kompromiss zwischen der Größe der Stichprobe und der Fehlermarge eingehen. Das heißt, du musst eine Stichprobengröße finden, die groß genug ist, um das gewünschte Präzisionsniveau zu erreichen und innerhalb einer akzeptablen Fehlermarge zu bleiben.
Werfen wir einen Blick auf die Fehlerspannungsmetrik und darauf, welche Fehlermarge als akzeptabel angesehen wird.
Was ist die Fehlermarge?
Die Fehlermarge (oder der marginale Fehler) ist eine Statistik, die den Umfang des Stichprobenfehlers in den Ergebnissen einer Umfrage angibt. Je größer die Fehlermarge ist, desto weniger Vertrauen sollte man haben, dass ein Umfrageergebnis das exakte Ergebnis einer Volkszählung der gesamten Bevölkerung widerspiegelt.
Die Fehlermarge bezieht sich auf die Größe deiner Stichprobe und die Differenz zwischen den Ergebnissen deiner Umfragedaten und denen der Gesamtbevölkerung (Normalverteilung); sie gibt an, wie nahe deine Ergebnisse den Ansichten der Gesamtbevölkerung kommen.
Nehmen wir ein Beispiel.
Wie das Wort Marge schon sagt, handelt es sich bei der Fehlermarge um einen Wertebereich um den Stichprobenmittelwert.
Bei einer Umfrage unter 1.000 Personen hast du beispielsweise eine Fehlermarge von 5 %, d. h. die Ergebnisse liegen in 95 % der Fälle innerhalb eines Bereichs von 5 % dessen, was sie wären, wenn du jede einzelne Person deiner Zielpopulation befragt hättest. Wenn also aus deinen Umfragedaten hervorgeht, dass 40 % der Gesamtbevölkerung etwas gutheißen oder ablehnen, bedeutet die Fehlermarge, dass du zu 95 % sicher sein kannst, dass die wahre Zahl zwischen 35 % und 45 % liegt.
Der marginale Fehler gibt an, wie nahe die Ergebnisse der Stichprobe an der Realität liegen. Er kann unter Berücksichtigung des Stichprobenumfangs, der Fehlermarge und des Konfidenzniveaus berechnet werden. Der marginale Fehler sollte nicht zu hoch sein, da er sonst zu falschen Schlussfolgerungen führen kann, die schwerwiegende Folgen für deine Geschäftsentscheidungen haben könnten. Eine akzeptable Fehlermarge, die von den meisten Umfrageforschern verwendet wird, liegt in der Regel zwischen 4 % und 8 % bei einem Konfidenzniveau von 95 %.
Es ist wichtig, die Fehlermarge so gering wie möglich zu halten. Denn je kleiner die Fehlermarge ist, desto mehr Vertrauen kannst du in deine Ergebnisse haben. Je größer die Fehlermarge ist, desto weiter können sie von den Ansichten der Gesamtbevölkerung abweichen, was deine Ergebnisse im schlimmsten Fall unbrauchbar macht.
Als Faustregel gilt, dass der marginale Fehler mit zunehmender Stichprobengröße abnimmt. Doch ist zu beachten, dass eine zu große Stichprobengröße die Erhebung teurer und zeitaufwändiger macht. Daher ist es wichtig, ein stabiles Gleichgewicht zwischen dem Grenzfehler und dem Stichprobenumfang zu finden. Mit der richtigen Planung kannst du sicherstellen, dass deine Stichprobe repräsentativ für die Zielpopulation ist und der Grenzfehler so gering wie möglich bleibt, damit deine Ergebnisse präzise und zuverlässig sind.
Was als akzeptabler Wert gilt, hängt auch von der Art der Forschung ab, die du durchführst. Aus offensichtlichen Gründen gelten für medizinische Studien und Versuche höhere Standards und strengere Kriterien für die Stichprobenziehung als für die Erforschung des Kaufverhaltens der Verbraucher im Marketing.
Rechner für die Fehlermarge
Nutze unseren Rechner, um die Fehlermarge für deine Studie schnell zu überprüfen. Gib einfach deine Werte ein und prüfe das Ergebnis. Alle im Rechner verwendeten Metriken werden weiter unten im Detail erklärt. Wenn du weitere Fragen hast, kannst du dich gerne über den Chat an unsere Experten wenden.
Eine akzeptable Fehlermarge, die von den meisten Forschern verwendet wird, liegt in der Regel zwischen 3 % und 6 % bei einem Konfidenzniveau von 95 %.
Die Schlüsselwerte zur Berechnung von Stichprobenumfang und Fehlermarge
Die Schlüsselwerte zur Bestimmung des optimalen Stichprobenumfangs und/oder der Fehlermarge sind die Gesamtbevölkerung N, die Standardabweichung p, das Konfidenzintervall (CI) und der Z-Wert z.
Hier eine kurze Erklärung für jede Kennzahl.
Standardabweichung, p
Bei der Betrachtung von Umfrageergebnissen solltest du in der Lage sein, allgemeine Aussagen zu treffen, wie z. B. „xx % stimmen dem zu“. Dies kann jedoch von Befragten zu Befragten stark variieren, weshalb wir auch die Standardabweichung berücksichtigen müssen.
Die Standardabweichung wird in Prozent ausgedrückt und gibt den Bereich der wahrscheinlichen Antworten für jede Frage an. Je höher dieser Wert ist, desto mehr Teilnehmer werden benötigt, um ein genaues Ergebnis zu erhalten.
Der Wert der Standardabweichung wird in der Regel auf 0,5 festgelegt und gibt an, wie groß die erwartete Streuung bei den Antworten der Befragten ist.
Hier ein Beispiel dafür, wie eine hohe Standardabweichung bei der Verwendung einer Frage mit Likert-Skala auftreten kann:
Stelle dir vor, es wird eine Umfrage durchgeführt, um die Meinung der Menschen über ein neues Produkt zu ermitteln. Eine der Fragen lautet: Wie wahrscheinlich ist es, dass du dieses Produkt einem Freund empfiehlst? Die Befragten antworten mittels einer Likert-Skala mit fünf Optionen: „Sehr unwahrscheinlich“, „Unwahrscheinlich“, „Neutral“, „Wahrscheinlich“, „Sehr wahrscheinlich“.
Von 100 Befragten entscheiden sich 50 für „Sehr unwahrscheinlich“ und die anderen 50 für „Sehr wahrscheinlich“. Das bedeutet, dass es bei den Antworten kein Mittelding gibt, sondern dass sie sich alle auf eines der beiden Extreme beziehen.
Da die Hälfte der Befragten das eine Extrem und die andere Hälfte das andere Extrem wählt, sind die Antworten nicht gleichmäßig verteilt und die Standardabweichung wäre viel höher, um den großen Unterschied oder die Streuung zwischen den Antworten anzuzeigen.
Diese hohe Standardabweichung ist ungewöhnlich, wenn man sie mit einer „normalen“ Verteilung der Beantwortungen vergleicht, bei der man erwarten würde, dass die meisten Beantwortungen in der Nähe des Durchschnitts liegen und weniger Beantwortungen an den Extremen.
Es ist wichtig zu beachten, dass eine Standardabweichung von 0,5 ein üblicher Wert ist und in der Regel nur in Grenzfällen, wie dem in diesem Beispiel genannten, angepasst werden muss.
Wenn du einen bestimmten Anwendungsfall vor Augen hast und dir nicht sicher bist, welche Art von Standardabweichung zu erwarten ist, kannst du dich auch an unsere Experten wenden, um Unterstützung zu erhalten.
Z-Score, z, und Konfidenzintervall (CI)
Der Z-Wert misst, wie gut die Stichprobe die Gesamtpopulation repräsentiert (einschließlich der Fehlermarge) und beschreibt die Abweichung eines Wertes vom Durchschnitt deiner Stichprobe. Oder mit anderen Worten: Der Z-Wert gibt an, wie sicher du sein kannst, dass deine Studienergebnisse der Realität entsprechen.
Da er greifbarer ist, werden Konfidenzintervalle, die einen bestimmten Z-Wert darstellen, in der Regel zur Berechnung einer gewünschten Stichprobengröße oder Fehlermarge verwendet. Diese Tabelle zeigt die Z-Werte für die gebräuchlichsten Konfidenzintervalle.
| Konfidenzintervall | Z-Wert |
| 80% | 1,28 |
| 85% | 1,44 |
| 90% | 1,65 |
| 95% | 1,96 |
| 99% | 2,58 |
Ein Konfidenzintervall ist ein aus einer Stichprobe abgeleiteter Wertebereich, der zur Schätzung eines unbekannten Populationsparameters verwendet wird. Es bietet einen Grad an Sicherheit oder Vertrauen, dass der wahre Populationsparameter innerhalb des Intervalls liegt.
Das Intervall wird berechnet, indem eine Stichprobenstatistik (z. B. der Mittelwert oder der Anteil) genommen und eine Fehlermarge addiert und subtrahiert wird, die durch das gewünschte Konfidenzniveau und den Stichprobenumfang bestimmt wird. Das Konfidenzniveau wird in der Regel als Prozentsatz ausgedrückt, z. B. 90 %, 95 % oder 99 %.
Das Konfidenzintervall ist der Wertebereich, in dem du erwartest, dass deine Schätzung bei einer Wiederholung des Tests innerhalb eines bestimmten Konfidenzniveaus liegen wird.
Nehmen wir ein anschauliches Beispiel mit einer Normalverteilung:

So beträgt beispielsweise die Wahrscheinlichkeit, dass der Mittelwert der Gesamtbevölkerung zwischen -1,96 und +1,96 Standardabweichungen (Z-Scores) vom Stichprobenmittelwert liegt, 95 %.
Dementsprechend besteht eine 5 %ige Chance, dass der Mittelwert der Gesamtbevölkerung außerhalb des oberen und unteren Konfidenzintervalls liegt (wie durch die 2,5 % Ausreißer auf beiden Seiten des Z-Scores von 1,96 veranschaulicht).
Gesamtbevölkerung, N
Im alltäglichen Sprachgebrauch steht das Wort Bevölkerung meist für eine Gruppe von Menschen oder zumindest für eine Gruppe von Lebewesen. Statistiker und Forscher bezeichnen jedoch jede Gruppe, die sie untersuchen, als Population.
Die Gesamtbevölkerung einer Studie könnten Mütter von Kindern unter 5 Jahren, Ärzte oder Nutzer eines bestimmten Produkts sein.
Um möglichst genaue Schlussfolgerungen ziehen zu können, müssten die Statistiker und Forscher alle Merkmale der Personen in der gewünschten Population kennen, was jedoch in den meisten Fällen unmöglich oder unpraktisch ist, da die Populationen in der Regel recht groß sind.
Deshalb wählen sie Stichproben der Bevölkerung, d. h. eine kleinere Gruppe aus der Gesamtbevölkerung, die die Merkmale der gesamten Bevölkerung aufweist, sodass die Beobachtungen und Schlussfolgerungen, die anhand der Stichprobendaten gemacht werden, auf die Gesamtbevölkerung übertragen werden können.
In unserem Appinio-Rechner berücksichtigen wir nicht die Gesamtbevölkerung, da bei den meisten Studien die Gesamtbevölkerung so groß ist (z. B. alle Deutschen), dass sie keinen Einfluss auf die erforderliche Stichprobengröße oder Fehlermarge hat. Nur wenn die zu untersuchende Population extrem klein ist – wie alle männlichen Zahnärzte in London – muss die Gesamtpopulation berücksichtigt werden. In diesem Fall kannst du dir unsere erweiterte Formel ansehen oder direkt unsere Experten um Hilfe bitten.
Der Fall einer unbekannten Population
In den meisten Fällen ist es nicht möglich, den Umfang der Gesamtbevölkerung genau zu bestimmen, da diese zu groß und zu breit ist. In diesen Fällen kannst du nur den oberen Teil der Standardformel zur Berechnung der Mindeststichprobengröße verwenden:

Formel zur Bestimmung der Stichprobengröße
Der Vollständigkeit halber zeigen wir dir auch, wie du die angemessene Stichprobengröße mithilfe der erweiterten Formel berechnen kannst. Wenn du jedoch kein Fan von Mathematik bist und Formeln Erinnerungen an die Schulzeit wecken, die du lieber für dich behalten möchtest, verwende einfach unsere obigen Appinio-Rechner.
Sobald du alle oben genannten Schlüsselwerte ermittelt hast, kannst du die nachstehende Gleichung zur Bestimmung der optimalen Stichprobengröße verwenden. Die folgende Standardformel ist am besten für kleine bis mittlere Populationsgrößen geeignet.
Ein Berechnungsbeispiel: Ausgangspunkt ist eine Gesamtpopulation N = 500, eine Fehlermarge von 0,1, eine Standardabweichung p von 0,5 und ein Z-Wert von 1,96 (basierend auf einem Konfidenzniveau von 95%). Dann ergibt sich die folgende Berechnung:
Damit die Ergebnisse für eine Gesamtpopulation von 500 Befragten repräsentativ sind, liegt die optimale Stichprobengröße bei mindestens 80 Befragten.
Zusammenfassung
Zusammenfassend lässt sich sagen, dass eine zuverlässige Stichprobengröße entscheidend ist, um genaue, repräsentative und aussagekräftige Schlussfolgerungen bei der Durchführung von Erhebungen zu ziehen. Dadurch wird sichergestellt, dass marginale Fehler minimiert werden und dass die Ergebnisse mit größerer Sicherheit auf die Gesamtbevölkerung extrapoliert werden können. Anhand der skizzierten Formel kannst du die optimale Stichprobengröße für deine Studie ermitteln, um valide Daten zu gewährleisten.
Wir haben den marginalen Fehler, den Stichprobenumfang und die Berechnung des Z-Wertes besprochen. Um den Stichprobenumfang für eine Umfrage zu bestimmen, musst du die Standardformel verwenden und drei Schlüsselwerte berücksichtigen: Irrtumswahrscheinlichkeit, Standardabweichung und Z-Wert. In speziellen Anwendungsfällen, in denen du eine sehr kleine Population repräsentieren möchtest, muss die Populationsgröße zusätzlich berücksichtigt werden.
Wenn du diese Formel befolgst, kannst du die Genauigkeit und Zuverlässigkeit deiner Umfrageergebnisse im interaktiven Dashboard gewährleisten. Der marginale Fehler ist ein Maß, das beschreibt, wie gut eine Stichprobe die Gesamtbevölkerung repräsentiert, und bezieht sich auf die Wahrscheinlichkeit des Auftretens eines Fehlers. Der Z-Wert wird auf der Grundlage des Konfidenzniveaus berechnet und gibt an, wie sicher du sein kannst, dass deine Ergebnisse der Realität entsprechen. Schließlich sollte der Stichprobenumfang anhand der Standardformel bestimmt werden, um marginale Fehler zu minimieren und die Ergebnisse genau auf die Gesamtpopulation zu extrapolieren.
Möchten Sie Ihre eigene Umfrage starten, wissen aber nicht genau, wie?
Werf einen Blick auf den Appinio Hype Tracker Report!
Für die Appinio Hype Tracker Reports untersuchen wir eine nach Alter und Geschlecht repräsentative Grundgesamtheit.
Finde alle Appinio Hype Tracker Bände auf unserer Report-Seite und registriere dich hier kostenlos für unser Dashboard, um deine eigenen Insights zu generieren.
Fakten, die im Kopf bleiben 🧠
Interessiert an weiteren Insights? Dann sind unsere Reports genau das richtige, mit Trends und Erkenntnissen zu allen möglichen Themen.