Dr. Kajetan Hinner


Rheinland-Pfalz Germany 

Rheinland-Pfalz

Universität Mainz

Soziologie

Universität Mainz

Sommersemester 2003

Übung: Einführung in das Arbeiten mit SPSS

 (nur Studierende im Hauptfach Soziologie)

Termine: Wöchentlich, Dienstag, 17.15 bis 18.45 Uhr. GEOpool, N131

Teilnehmer:

Ausschließlich Hauptfach-Soziologen/-innen im Magister oder Diplomstudiengang

Zugangsvoraussetzungen:

Erfolgreich abgeschlossener "Grundkurs" (Protokoll der Sitzung des Leitungsgremiums des Instituts für Soziologie am 25.10.2000, TOP 16) und  Besuch der Veranstaltung "Statistik"

Teilnahmebegrenzung: 30 Personen pro Kurs

Ziel der Veranstaltung ist die Einführung in die sozialwissenschaftliche Datenanalyse mit Hilfe des Programms SPSS („Statistical Package for the Social Sciences“) für Windows.
Dabei sollen die Teilnehmer in die Lage versetzt werden, vorhandene Daten aufzubereiten (Kodierung und Strukturierung von Daten), uni- und bivariate Auswertungen eines Datensatzes vorzunehmen und die Ergebnisse sachgerecht zu interpretieren.

Jeder Interessierte sollte sich vor Beginn der Lehrveranstaltung mit der Benutzung der PCs im GEO-Pool (auf jeden Fall eigene Benutzerkennung beantragen) und den Grundlagen der Statistik vertraut machen. ZDV-Zugänge müssen spätestens in der Woche nach der ersten Veranstaltung freigeschaltet sein, um an der SPSS-Einführung teilzunehmen. Sie müssen Ihren Benutzernamen und ihr Passwort kennen. Bitte gehen Sie vor dem Beginn der SPSS-Veranstaltungen in den GEOpool und testen, ob Sie sich einloggen können.

Terminübersicht

29.4.2003 Einführung, Organisatorisches, Vorstellung Windows 2000 Grundlagen, Windows-Explorer, Netzwerklaufwerke (u:\; \\young). Selbständiges Durcharbeiten des SPSS-Tutorials. SPSS im Überblick (Kapitel 4 und 4.1 Bühl/Zöfel).
6.5.2003 Daten-Editor, Codierung und Code-Plan; (Kapitel 3.1, 4.2 Bühl/Zöfel) Beispieldatei wahl.sav (Adresse: ftp://ftp.sowi.uni-mainz.de/spss bzw. CD-ROM). Erklärung statistischer Grundbegriffe (Unabhängigkeit, Mittelwert, Median, Varianz); Kapitel 5 Bühl/Zöfel. Beispielhafte Häufigkeitsauszählungen, Erstellung von Kreuztabellen.
13.5.2003 Evaluations-Fragebogen übungshalber selbst ausfüllen und gemeinsam codieren. Fragebögen eingeben, überprüfen, verbessern. Datensatz sortieren. Aufgabe bis 20.5.: Selbständige Erfassung des eigenen Evaluations-Fragebogens in einer SPSS-Datei.
20.5.2003 Fragebögen eingeben, Daten vergleichen und verbessern. Systemdateien zusammenfügen (Merge), Dateien-Management mit Windows-Explorer.
27.5.2003 Kreuztabellen (Kapitel 11): Ausführliche Interpretation; erwartete Häufigkeiten, beobachtete Häufigkeiten, Berechnung erw. Häufigkeiten und stand. Residuen. Chi-Quadrat-Wert nach Pearson. [Trockenkurs, weil sämtliche Rechner im GEOPool nicht einsetzbar waren].
3.6.2003 Erzeugen eines Datensatzes aller Evaluationsfragebögen. Die einzelnen Datensätze finden sich unter ftp://ftp.sowi.uni-mainz.de/spss/eval/sose_2003/
Datensätze z.B. über Daten/Dateien zusammenfügen/Fälle hinzufügen erzeugen. Sinnvoll ist als Ausgangsdatei der "eigene" Datensatz - weil man weiß, daß die Definitionen (Labels, Variablen) stimmen. Problem ungepaarter Variablen (paaren mit Strg-Klick oder Anpassen der Variablennamen oder -definition in der zweiten Datei) oder doppelter Datensätze (einfacher über Daten/Fälle sortieren). Einfachster Weg, den Datensatz zusammenzufügen: Zwei SPSS-Programme starten und die fehlenden Fragebögen über Copy/Paste der ganzen Zeile übertragen.
Beginn der Hausaufgabe bis zum 17.6.: Quantitative Auswertung der Evaluations-Fragebögen, Erstellung einer kurzen Präsentation in Word.
10.6.2003 Entfällt [Pfingstferien]
17.6.2003 SPSS-Syntax. Einführung in Programmiersprachen allgemein. 
24.6.2003 Inglehart-Index (Kapitel 8.4.2); SPSS-Syntax abtippen. Selbständig Fehler bereinigen und Programm zum Laufen bringen. Aufgabe: Einfachere Programmierung mit ""or"" oder entsprechenden Umstellungen.
1.7.2003 Übung: Datensatz im ASCII-Format über Excel in SPSS einlesen. Variablen umbenennen, Labels definieren, Datensatz bereinigen, elementare Auswertungen. Beispieldatensatz: Inglehart-Index des Kurses (http://www.hinner.com/inglehart). Berechnung des Inglehart-Indexes für die Kursteilnehmer. Auswertung nach Geschlecht. Kapitel 13: Mittelwertvergleiche. Hausaufgabe (bis 15.7.): Word-Datei mit einer Auswertung des Inglehart-Index des Kurses und der Vorkurse in Mainz und Rostock (Daten unter ftp://ftp.sowi.uni-mainz.de/spss/inglehart).
8.7.2003 Kapitel 15 Bühl/Zöfel: Korrelationen (Pearson, Spearman und Kendall), partielle Korrelationen, Distanz- und Ähnlichkeitsmaße. Bivariate Korrelationen; Streuungsdiagramm, Lineare Regression, Regressionsgerade. 
15.7.2003 Bivariate Korrelationen; Streuungsdiagramm, Regressionsgerade, Kapitel 15 Bühl/Zöfel. Multiple lineare Regression. Besprechung der Übungsaufgabe „Zahnmedizinische Untersuchung“ (Datei zahn.sav, Signifikanztest bzgl. Putzhäufigkeit und Zahnbürstenwechsel nach Schulbildung). Berechnung des eigenen cpitn-Wertes. Anlegen einer neuen Variablen (Transformieren/Berechnen) mit der Regressionsformel. Berechnung einer neuen Variablen für die Differenz zwischen tatsächlichem und vorhergesagtem Wert. Interpretation. Einfachere Berechnung dieser Variablen über "Speichern..." im Regressionsmenue (Residuen).
Hausaufgabe (bis 22.7.): Analyse von Mehrfachantworten (Kapitel 12 Bühl/Zöfel); Datei kenia.sav; Variablen-Set. Beispiele im Buch selbständig nacharbeiten. Schriftliche Abgabe: Übungsbeispiel 12.3 durchrechnen und interpretieren.
22.7.2003 Kapitel 8 Bühl/Zöfel: Berechnung von neuen Variablen; Umkodieren von Werten; 8.7: Gewichten und Repräsentativität
Abschlußsitzung. ""Spielereien"" mit SPSS, graphische Auswertungen spielerisch erarbeiten, Gelegenheit zu allgemeinen Fragen.
29.7.2003 [Klausur: 80 Minuten] 
Links:
ftp://ftp.sowi.uni-mainz.de/incoming/
ftp://ftp.sowi.uni-mainz.de/pub/spss/kurs/ 
http://bompf.sowi.uni-mainz.de/cgi-bin/rst_main.cgi?_surveycfg=fk2002us 
http://bompf.sowi.uni-mainz.de/cgi-bin/rst_main.cgi?_surveycfg=fk2002de 

Literatur:


Seminar: Datenanalyse mit SPSS für Fortgeschrittene: PISA / Das Sozio-oekonomische Panel.

Wöchentlich, Donnerstag 18.45 bis 20.15 Uhr. GEOpool, N131

(ab 3. Semester; Studierende im Haupt- und Nebenfach Soziologie). Zugelassen sind nur Studenten mit SPSS-Kenntnissen.

Das Ziel dieser Veranstaltung ist eine eingehendere Beschäftigung mit der computergestützten Datenanalyse. Deshalb sind grundlegende SPSS-Kenntnisse, wie sie in den einführenden Methodenveranstaltungen vermittelt werden, für die Teilnahme erforderlich.
Nach einer kleinen Wiederholung und Rekapitulierung der SPSS-Basis-Anwendungen werden wir uns um kompliziertere und inhaltlich ergiebige aktuelle Datensätze kümmern. Dies soll anhand der Datensätze zum SOEP und zur PISA-Studie geschehen.
Das SOEP ist eine seit 1984 jährliche Wiederholungsbefragung von Deutschen, Ausländern und Zuwanderern in den alten und neuen Bundesländern. Die Stichprobe umfasste im Erhebungsjahr 2000 etwa 12.000 Haushalte mit mehr als 20.000 Personen. Themenschwerpunkte sind unter anderem Haushaltszusammensetzung, Erwerbs- und Familienbiographie, Erwerbsbeteiligung und berufliche Mobilität, Einkommensverläufe, Gesundheit und Lebenszufriedenheit.
Mit PISA wollen sich die Teilnehmerstaaten regelmäßig ein Bild davon machen, wie gut es ihren Schulen gelingt, Schülerinnen und Schüler auf die Herausforderungen der Zukunft vorzubereiten. Im Mittelpunkt steht dabei weniger das Faktenwissen der Jugendlichen,  sondern es werden Basiskompetenzen untersucht, die in modernen Gesellschaften für eine Teilhabe am gesellschaftlichen, wirtschaftlichen und politischen Leben notwendig sind. Es wird gefragt, inwieweit Jugendliche diese Kompetenzen erworben haben und inwieweit soziale Ungleichheiten im Bildungserfolg bestehen. Um weiterhin möglichen Ursachen für gefundene Unterschiede auf die Spur zu kommen, werden wichtige Aspekte schulischer und außerschulischer Lern- und Lebensbedingungen analysiert. Damit erhält die aktuelle bildungspolitische Diskussion eine breite empirische Grundlage. In unserem Seminar wollen wir uns um eine Analyse der öffentlich freigegebenen PISA-Datensätze kümmern.

Scheinerwerb (Seminarschein): Teilnahme an allen Sitzungen bis auf einer, Referat/Artikelzusammenfassung, Hausarbeit.

Terminübersicht (Beginn der Veranst.: am 8.5. um 19.15 Uhr, ab 15.5. ab 19.00 Uhr)

 
1.5.2003 Entfällt [Maifeiertag]
8.5.2003 19.15 Uhr Einführung. Wiederholung SPSS Grundlagen. SOEP - FAQ lesen auf der DIW-Homepage. DTC herunterladen. Knappe Einführung. Aufgabe: DTC lesen bis 15.5. SOEPInfo: SPSS-Syntax für die Variable pp0101 anfordern. Häufigskeitsauszählung zu pp0101 über SOEPInfo. Beispiele: Verfremdeter Datensatz zu SOEP. 
Aufgabe: Fünfminütiges Referat über einen beliebigen Artikel zum SOEP am 15.5/22.5. [da wir keine Zeit haben für ein Referat von allen Personen, bitte ich Sie, eine knappe Zusammenfassung des Artikels auf einer DIN-A4-Seite anzufertigen und diese Seite bis 15.5. bzw. 22.5. mitzubringen - evtl., falls Zeit ist, können Sie den von Ihnen bearbeiteten Artikel vorstellen].
15.5.2003 19.00 s.t. Vorstellung einiger Artikelzusammenfassungen. Unterschreiben der Datenschutzerklärungen. Einarbeitung in das SOEP. Aufbau, Struktur. Analyse des verfremdeten Datensatzes. Weiteres Arbeiten mit SOEPinfo und erstes Analysieren der erzeugten SPSS-Syntax.
22.5.2003 19.00 s.t.
  • Nochmaliger Hinweis zum Datenschutz, prüfen der Datenschutzerklärungen aller Teilnehmer: Verpflichtung zur Wahrung des Datengeheimnisses.
  • Sichten der Artikelzusammenfassungen der Teilnehmer.
  • Arbeit mit den SOEP-Daten für die Lehre, dazu Netzlaufwerk verbinden (o:) mit dem Rechner \\GEHEIM und dem in der Veranstaltung vereinbarten Passwort. - Hier die einzelnen Schritte: 1) Rechte Maustaste über Start, Windows-Explorer starten. Als Adresse in die Zeile den Namen des Rechners hinter zwei Backslash eintippen (\\GEHEIM - der Rechner heißt natürlich nicht GEHEIM). 2) Jetzt kommt im Auswahlfenster das Verzeichnis SOEP. Dieses mit der linken Maustaste anklicken, dann mit der rechten Maustaste "Netzlaufwerk verbinden" auswählen. Hier Laufwerk "o:" eintragen und mit "OK" bestätigen. Bei der entsprechenden Nachfrage mit dem in der Veranstaltung vereinbarten Passwort die Verbindung herstellen. 3) Nun wird ein neuer Laufwerksbuchstabe o: erzeugt, über den Sie auf die SOEP-Daten zugreifen können. Falls das aus irgend einem Grund nicht funktioniert: Windows-Explorer wie bei 1) starten, dann mit der linken Maustaste Laufwerk o: anklicken und mit der rechten Maustaste auf "Netzlaufwerk trennen" auswählen. Anschließend versuchen Sie wieder, die Verbindung herzustellen wie bei 1). Wenn es immer noch nicht funktioniert, verwenden Sie bitte einen anderen Rechner im GEOPool.
  • Erzeugen der SPSS-Syntax für die Datei pp0101 über SOEPinfo (Pfad: "o:\soep\lehre\", Temp Pfad "u:\temp\" - vorher dieses Verzeichnis anlegen, Individual, Unbalanced, All Sample Members, Both, A/B/C/D/E, Both). Diese Syntax in ein SPSS-Syntax Fenster kopieren und laufen lassen. Erzeugt wird ein Datensatz new.sav mit den Variablen hhnr, persnr, pp0101, etc. Schauen Sie nach, was die Variablen bedeuten (z.B. über SOEPinfo, DTC). Achtung: Auch dieser Datensatz unterliegt natürlich dem Datenschutz. Sie dürfen ihn nicht weitergeben, veröffentlichen, "irgendwo installieren", etc!
  • Ausführliche Erläuterungen finden Sie nun unter www.hinner.com/soep/
  • Aufgabe bis 5.6.: Forschungsfrage: Wie hat sich die Zufriedenheit mit der Gesundheit in Deutschland entwickelt? Prüfen Sie diese Frage anhand geeigneter Variablen der SOEP-Daten, geben Sie eine Entwicklung über die Jahre und beide Geschlechter. Vergessen Sie nicht, zu gewichten - sehen Sie hierzu im SPSS-Buch und im DTC nach. Veröffentlichen Sie ihre Ergebnisse im ReaderPlus ab 3.6. - fühlen Sie sich nicht eingeschränkt und verknüpfen Sie die Fragestellung mit anderen möglichen Einflußvariablen (Krankheit, Geschlecht, Alter).
29.5.2003 Entfällt [Feiertag Christi Himmelfahrt]
5.6.2003 Einzelbesprechung von bereits ausgearbeiteten Aufgaben der Kursteilnehmer. Allgemein: Wiederholung technischer Schritte vom 22.5. Vorführung der Schritte, um den entsprechenden Datensatz zu erzeugen (siehe www.hinner.com/soep/).
12.6.2003 Entfällt [Pfingstferien]
19.6.2003 Entfällt [Fronleichnam]
26.6.2003 Zusammenfassende Besprechung der Vorgehensweise zur Berechnung der individuellen Zufriedenheit mit der Gesundheit (wie unter  www.hinner.com/soep/). Gelegenheit zu eigenen Berechnungen.
3.7.2003 Korrelationen, Vorstellung eines exemplarischen Referats (Vgl. Sitzung vom 8.5.): Zustimmungstendenzen beim SOEP.
Gruppenarbeit: Aufteilung des Kurses in drei 4er-Gruppen, die jeweils eigene Fragestellungen verfolgen.
  • Gibt es eine Generation Golf?
  • Ost/West-Deutschland: Unterschiedliche psychische Lage
  • Einkommensverteilung: Werden die reichsten 10% immer reicher und die ärmsten 10% immer ärmer?
Aufgabe für jede Arbeitsgruppe bis zur Sitzung am 10.7.: Erstellung des Datensatzes
10.7.2003 Besprechung der Ergebnisse der Gruppen - freie Analysearbeit. Korrektur der mit SOEP-Info erstellten Syntax (fehlerhaft bei einigen Variablen des HH-Datensatzes). 
17.7.2003 Besprechung der Ergebnisse der Gruppen - freie Analysearbeit. 
24.7.2003 Datensatz zu PISA. Beispielaufgabe aus PISA
30.7.2003 Abschlußsitzung.

Link zum Reader-Plus

Link zum FTP-Server der Soziologie Universität Mainz - mit den vorbereiteten Datensätzen

Basisliteratur:

Technische Hinweise für andere Dozenten mit ähnlichen Veranstaltungen

Die SOEP-Daten liegen auf einem FreeBSD 4.7 Server. Der Zugriff ist nur möglich von den Rechnern des GEO-Pools (PC-Übungsraum), dies wurde durch "hosts allow" in der Datei smb.conf und den entsprechenden IP-Adressen realisiert. Zusätzlich wurde die Freigabe (security=share) über ein Passwort geschützt, das nur den Kursteilnehmern bekannt ist (smbpasswd -a). Sämtliche Kursteilnehmer haben die Datenschutzerklärung unterschrieben.