Die empirische Sozialforschung benötigt Daten, die zu interessierenden Fragestellungen vorliegen. Sind solche für Populationen nicht vorhanden, dann sind Stichprobenerhebungen aus der betreffenden Population eine sinnvolle Alternative der Datenerhebung.
Verschiedene Gründe sprechen dafür, eine solche Population vor der Stichprobenauswahl in der Designphase einer Stichprobenerhebung in Schichten und/oder Klumpen von Erhebungseinheiten zu zerlegen. Solche Gründe können sein, dass Schätzer bestimmter Genauigkeit innerhalb verschiedener Teilmengen der Population (zum Beispiel Alters- oder Bildungskategorien) benötigt werden oder dass die Population aus organisatorischen Gründen in geografisch abgegrenzte Teile mit eigener Stichprobenorganisation zerlegt werden soll. Ferner bieten solche Vorgehensweisen die Möglichkeit, dass im Vergleich zur einfachen Zufallsziehung der Erhebungseinheiten ein Genauigkeitsgewinn erzielt werden kann. Beispiele für institutionalisierte Anwendungen komplexer Stichprobendesigns sind der österreichische Mikrozensus oder die PISA-Studie. Auch in den Sozialwissenschaften ist die Anwendung solcher Designs aus oben genannten Gründen durchaus üblich.
Den auf diese Weise erhobenen Daten selbst sieht man nicht an, auf welche Weise sie erhoben wurden. Ihre formale Behandlung mit der ? häufig auch in Statistikprogrammpaketen standardmäßig eingestellten ? Theorie für einfache Zufallsauswahlen führt dann zu verzerrten Schätzern für die interessierenden Parameter, ungültigen Konfidenzintervallen, deren angegebenes Sicherheitsniveau nicht zutrifft, und ? nicht zuletzt ? falschen p-Werten beim statistischen Hypothesentesten und somit zu falschen Testergebnissen.
Im Workshop soll auf diese unvermeidlichen Auswirkungen der Nichtberücksichtigung des tatsächlich verwendeten Stichprobendesigns aufmerksam gemacht werden. In den Beiträgen setzen sich Experten aus diesem Bereich auf anschauliche Weise theoretisch mit der Problematik auseinander.