Home
IBM SPSS Categories 19
Contents
1. W hlen Sie Numerisch als optimales Messniveau f r die Skalierung Klicken Sie auf Weiter 110 Kapitel 9 gt Wahlen Sie Package design aus und klicken Sie im Dialogfeld Kategoriale Regression auf Skala definieren Abbildung 9 11 Dialogfeld Skala definieren E Kategoriale Regression Skala definieren X rMessniveau der optimalen Skalierung Spline ordinal Ordinal Spline nominal Nominal Numerisch Spline Ca tome Wahlen Sie Nominal als optimales Messniveau f r die Skalierung gt Klicken Sie auf Weiter W hlen Sie Brand name bis Money back guarantee aus und klicken Sie im Dialogfeld Kategoriale Regression auf Skala definieren Abbildung 9 12 Dialogfeld Skala definieren E Kategoriale Regression Skala definieren ee rMessniveau der optimalen Skalierung Spline ordinal Ordinal Spline nominal Nominal Numerisch Spline Innere Knoten Wahlen Sie Numerisch als optimales Messniveau f r die Skalierung gt Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Kategoriale Regression auf Ausgabe 111 Abbildung 9 13 Dialogfeld Ausgabe Tabellen Muttiples R ANOVA Koeffizienten kterationsprotokoll Fi Korrelationen der Originalvariablen Fi Korrelationen der transformierten Variablen A Normalisierte Modelle und Koeffizienten Kategoriale Regressi
2. 213 Zentroide und projizierte Zentroide eet eens 214 Eine alternative Analyse 0 0 0 cece cee een 216 Allgemeine Vorschl ge 0 0 ccc ee een tence tent e nen ees 221 Empfohlene Literatur 1 een eee teen e eee eee ene 222 12 Korrespondenzanalyse 223 Normalisierung ein aa Hk eels a te rere ae 224 Beispiel Wahrnehmung von Kaffeemarken 0 0 ccc cece eee eee eee 225 Durchf hren der Analyse 000 c cece ttt teens 225 Dimensionalitat sate ssaa pa a web eae han oe bad dae deg eek Codes han ana 229 Beitr ge Correspondence Analysis 00 0c cece eect een eens 230 Diagramme eked ose Ueda ead ee aida ad as ee be es 232 Symmetrische Normalisierung 0000 cece eee eee teen eee 233 Empfohlene Literatur 00 naea aea ea teen ete tenes 235 13 Mehrfachkorrespondenzanalyse 236 Beispiel Eigenschaften von Eisenwaren 0 c ccc cece eee tenes 236 Durchf hren der Analyse 00 0 0c e cette tenes 237 Modell bersicht scien sade teed ala aa a Ha I bi a 240 bjektwerte iu an en ne nee 241 Diskriminationsma e ee ee eet n tent n ene 242 Kategorienquantifikationen 0 eect tenes 243 Genauere Untersuchung der Objektwerte 0 0000 cece eects 245 Ausschlu von Ausrei ern 2 0 0 cc tenet tenn nee 248 Empfohlene Literatur 00 00 c cc tenet ete eens 251 14 Multidimensionale Skalier
3. Kapitel 10 Abbildung 10 18 Ausgabeverwaltungssystem OMS Bedienfeld Ausgabeverwaltungssystem Bedienfeld Anforderungen Status ID Typen Befehle Beschriftungen Ziel Beenden Alle beenden L schen Ds Neue Anforderung Um eine Anforderung hinzuzuf gen w hlen Sie mindestens einen Eintrag aus den unten stehenden Listen sowie f Hinzuf gen alle sonstigen gew nschten Eigenschaften aus und klicken Sie auf Hinzuf gen Unter Tabellenuntertypen werden nur Untertypen angezeigt die f r mindestens eine der ausgew hlten Prozeduren verf gbar sind Optionen Tip You can use Ctrl 4 to select all the entries in a list Ausgabetypen Befehls IDs Tabellen Untertypen f r ausgew hlte Befehle Ausgabeziele u Descriptive statistics paume Iteration History aren Diagramme Model Summary Peis Modelle Notes Basierend auf Objektnamen Protokolle Object Scores Ordner re Text ificati ii Guantifications Neues Datenblatt Warnungen Variance Accounted For berschriften ificati Warnings _ Aus Viewer ausschlie en gt Wahlen Sie Tabellen als Ausgabetyp W hlen Sie CATPCA als Befehl W hlen Sie Projizierte Zentroide als Tabellentyp W hlen Sie im Gruppenfeld Ausgabeziele die Option Datei und geben Sie als Dateinamen projected_centroids sav ein Klicken Sie auf Optionen 165 Abbildung 10 19 Dialogfeld Optionen ce ee dons r Grafikbilder BH Bilder einschlie en Format JPG Gr
4. W hlen Sie Pets owned und Newspaper read most often als Variablen f r das zweite Set aus W hlen Sie pet aus und klicken Sie auf Bereich und Skala definieren 203 Nichtlineare kanonische Korrelationsanalyse Abbildung 11 6 Dialogfeld Bereich und Skala definieren FF OVERALS Bereich und Skala Minimum 1 Maximum Messniveau Ordinal Mehrfach nominal Einzeln nominal Diskret numerisch Ci an e Geben Sie 5 als H chstwert f r diese Variable ein W hlen Sie Mehrfach nominal als Messniveau aus Klicken Sie auf Weiter W hlen Sie im Dialogfeld Nichtlineare kanonische Korrelationsanalyse die Variable news aus und klicken Sie auf Bereich und Skala definieren Abbildung 11 7 Dialogfeld Bereich und Skala definieren fff OVERALS Bereich und Skala Minimum 1 Maximum Messniveau Ordinal Mehrfach nominal Einzeln nominal Diskret numerisch Covet aeerecren tre Geben Sie 5 als H chstwert f r diese Variable ein W hlen Sie Einzeln nominal als Messniveau aus Klicken Sie auf Weiter Klicken Sie im Dialogfeld Nichtlineare kanonische Korrelationsanalyse auf Weiter um das letzte Variablen Set zu definieren 204 Kapitel 11 Abbildung 11 8 Dialogfeld Nichtlineare kanonische Korrelationsanalyse a Nichtlineare kanonische Korrelationsanalyse OVERALS X rSet 3 von3 cil Math test score math Zur ck
5. W hlen Sie eine Zeilenvariable aus W hlen Sie eine Spaltenvariable aus Definieren Sie die Bereiche f r die Variablen Klicken Sie auf OK 53 Korrespondenzanalyse Definieren des Zeilenbereichs bei der Korrespondenzanalyse Sie m ssen einen Bereich f r die Zeilenvariable angeben Die angegebenen Minimal und Maximalwerte m ssen ganzzahlig sein Gebrochene Datenwerte werden in der Analyse abgeschnitten Ein Kategoriewert der au erhalb des angegebenen Bereiches liegt wird in der Analyse ignoriert Abbildung 5 2 Dialogfeld Zeilenbereich definieren FH Korrespondenzanalyse Zeilenbereich definieren rKategorienbereich f r Zeilenvariable staff Minimalwert Maximalwert rNebenbedingungen f r Kategorien Keine nse WN Kategorien m ssen gleich sein Erg nzende Kategorie C een ate Alle Kategorien sind zun chst aktiv und nicht durch Nebenbedingungen eingesch nkt Sie k nnen festlegen dass bestimmte Zeilenkategorien anderen Zeilenkategorien entsprechen m ssen Au erdem k nnen Sie eine Zeilenkategorie als erg nzende Kategorie definieren m Kategorien m ssen gleich sein Die Kategorien m ssen gleiche Werte haben Verwenden Sie Gleichheitsbeschr nkungen wenn die erhaltene Ordnung der Kategorien nicht erw nscht oder nicht intuitiv ist Die maximale Anzahl der Zeilenkategorien f r die Gleichheitsbeschr nkungen festgelegt werden k nnen entsp
6. am meisten bevorzugt bis 15 am wenigsten bevorzugt zu ordnen Diese Informationen finden Sie in der Datei breakfast_overall sav F r weitere Informationen siehe Thema Beispieldateien in Anhang A in JBM SPSS Categories 19 Die Ergebnisse der Studie stellen ein typisches Beispiel des in den meisten Algorithmen f r die multidimensionale Entfaltung anzutreffenden Degenerationsproblems dar das durch Penalisieren des Variationskoeffizienten f r die transformierten hnlichkeiten gel st wird Busing Groenen als auch Heiser 2005 Es wird eine degenerierte L sung vorgestellt und erl utert wie das Problem mit der multidimensionalen Entfaltung gel st werden kann Auf diese Weise k nnen Sie die Unterscheidung der einzelnen Personen zwischen den Fr hst cksartikeln ermitteln Syntax mit denen Sie diese Analysen nachvollziehen k nnen befindet sich in der Datei prefscal_breakfast overall sps Erstellen einer degenerierten L sung gt Um eine Analyse vom Ty Multidimensionale Entfaltung durchzuf hren w hlen Sie die folgenden Befehle aus den Men s aus Analysieren gt metrisch gt Multidimensionale Entfaltung PREFSCAL Copyright SPSS Inc 1989 2010 272 273 Multidimensionale Entfaltung Abbildung 15 1 Hauptdialogfeld Multidimensionale Entfaltung hnlichkeiten 8 Gender gender Gewichtungen Is Zeilen Saas Quellen gt W hlen Sie Toast pop up bis Corn muffin and b
7. vomit und purge was bedeutet dass diese Gruppe von Variablen nicht mit der Gruppe der Bulimie Variablen korreliert ist Die Variablen Friends Freunde Mental state mood psychische Verfassung Stimmung und Hyperactivity Hyperaktivit t scheinen nicht sehr gut in die L sung zu passen Sie k nnen dies am Diagramm sehen indem Sie die L nge der einzelnen Vektoren beobachten Die Vektorl nge einer Variablen entspricht ihrer Anpassung und die genannten Variablen haben die k rzesten Vektoren Auf der Grundlage einer Zwei Komponenten L sung w rden Sie diese Variablen vermutlich aus einer potentiellen Symptomatologie f r E st rungen herausnehmen In einer h herdimensionierten L sung k nnen sie jedoch besser passen 179 Kategoriale Hauptkomponentenanalyse Die Variablen Sexual behavior Sexualverhalten Preoccupation with food and weight Besch ftigung mit Essen und Gewicht und Body perception K rperwahrnehmung bilden eine andere theoretische Symptomgruppe die damit zu tun hat wie der Patient seinen K rper erlebt Diese Variablen sind zwar mit den beiden im rechten Winkel zueinander stehenden Variablenb ndeln korreliert weisen jedoch ziemlich lange Vektoren auf und sind eng mit der ersten Dimension verbunden weshalb sie einige n tzliche Informationen ber den gemeinsamen Faktor liefern k nnen Objektwerte Die folgende Abbildung zeigt ein Diagramm der Objektwerte bei denen dei Subjekte mit ih
8. 70 Kapitel 6 Mehrfachkorrespondenzanalyse Objektdiagramme Im Dialogfeld Objektdiagramme k nnen Sie festlegen welche Diagramme und f r welche Variablen die Diagramme erstellt werden sollen Abbildung 6 9 Dialogfeld Objektdiagramme FEA Mca Objektdiagramme Diagramme T Objektpunkte E Objekte und Zentroide Biplot rBiplot Yariablen rObjekte beschriften Verf gbar Ausgew hlt Beschriften anhand Fallnummer e Variable List cen im Objektpunkte Es wird ein Diagramm der Objektpunkte angezeigt Objekte und Zentroide Biplot Die Objektpunkte werden mit den Variablen Zentroiden geplottet Biplot Variablen Die Biplots k nnen auf allen Variablen oder einer Teilmenge der Variablen basieren Objekte beschriften Objekte k nnen mit den Kategorien ausgew hlter Variablen im Dialogfeld Kategoriale Hauptkomponenten Optionen k nnen Sie Kategorienummern oder Wertelabels w hlen oder den Fallnummern beschriftet werden Wenn Variable ausgew hlt ist wird pro Variable ein Diagramm erstellt Mehrfachkorrespondenzanalyse Variablendiagramme Im Dialogfeld Variablendiagramme k nnen Sie festlegen welche Diagramme und f r welche Variablen die Diagramme erstellt werden sollen 71 Mehrfachkorrespondenzanalyse Abbildung 6 10 Dialogfeld Variablendiagramme FA Mca Variablendiagramme Kategoriendiagra
9. a Jali 15 10 05 00 05 10 1 u Dimension 1 L nge in cm weist f nf Kategorien auf von denen drei im oberen Bereich des Diagramms gruppiert sind Die beiden anderen Kategorien befinden sich in der unteren H lfte des Diagramms wobei die Kategorie 2 5 cm sehr weit von der Gruppe entfernt liegt Die gro e Diskrimination f r die L nge entlang Dimension 2 ergibt sich aus der Tatsache da sich diese eine Kategorie sehr stark von den anderen L ngenkategorien unterscheidet hnlich liegt bei Kopfform die Kategorie KREUZ sehr weit von den anderen Kategorien entfernt und bietet ein gro es Diskriminationsma entlang der zweiten Dimension Diese Muster k nnen nicht in einem Diagramm der Diskriminationsma e dargestellt werden Die Verteilung der Kategorienquantifikationen f r eine Variable ber cksichtigt die Varianz und zeigt so an wie gut diese Variable in den einzelnen Dimensionen diskriminiert ist In Dimension 1 liegen die Kategorien f r Gewinde weit auseinander Entlang Dimension 2 jedoch liegen die Kategorien f r diese Variable sehr eng beieinander Gewinde weist also in Dimension 1 eine bessere Diskrimination auf als in Dimension 2 Die Kategorien f r Kopfform sind in beiden Dimensionen weit verstreut was nahelegt dass diese Variable in beiden Dimensionen eine gute Diskrimination bietet Zus tzlich zur Bestimmung der Dimensionen entlang denen eine Variable Diskriminationen bietet und der Art und Weise in der sie diskr
10. Kriterien Sie k nnen die maximale Anzahl von Iterationen festlegen die in der nichtlinearen kanonischen Korrelationsanalyse bei den Berechnungen durchlaufen werden Au erdem k nnen Sie einen Wert f r das Konvergenzkriterium ausw hlen Die Analyse wird abgebrochen wenn die Differenz der Gesamtanpassung zwischen den letzten zwei Iterationen kleiner als der Konvergenzwert ist oder die Maximalzahl von Iterationen erreicht wurde Zus tzliche Funktionen beim Befehl OVERALS Sie k nnen die kategoriale Hauptkomponentenanalyse an Ihre Bed rfnisse anpassen indem Sie Ihre Auswahl in ein Syntax Fenster einf gen und die daraus resultierende Befehlssyntax f r OVERALS bearbeiten Mit der Befehlssyntax Sprache verf gen Sie au erdem ber folgende M glichkeiten m Festlegen der in Diagrammen darzustellenden Dimensionspaare anstelle der Darstellung aller extrahierten Dimensionen unter Verwendung des Schl sselwortes NDIM f r den Unterbefehl PLOT m Festlegen der Zeichenanzahl f r Wertelabels zur Beschriftung der Punkte in den Diagrammen mit dem Unterbefehl PLOT m Festlegen von mehr als f nf Variablen f r die Diagramme der Objektwerte mit dem Unterbefehl PLOT m Auswahl von in der Analyse verwendeten Variablen als Beschriftungsvariablen f r die Diagramme der Objektwerte mit dem Unterbefehl PLOT m Auswahl von Variablen als Punktbeschriftungen f r die Diagramme der Quantifikationswerte mit dem Unterbefehl PLOT m Festlege
11. Ausgabe Ef Multidimensionale Skalierung Ausgabe Anzeige V Gemeinsame Raumkoordinaten m A N F tterationsprotokoll A elle Ra ngen Multiple Stressma e _ Distanzen IM Stress Zerlegung a Transformierte hnlichkeiten Transformierte unabh ngige Variablen I Eingabedaten Yariablen und Dimensionskorrelationen min neuer Datei speichern Gemeinsame Raumkoordinaten A T Distanzen E Transformierte hnlichkeiten E Transformierte unabh ngige Variablen C een an Anzeigen W hlen Sie mindestens eine der folgenden Anzeigeoptionen aus Gemeinsame Raumkoordinaten Zeigt die Koordinaten des gemeinsamen Raums an Individuelle Raumkoordinaten Zeigt nur dann die Koordinaten der individuellen R ume an wenn das Modell kein Identit tsmodell ist Individuelle Raumgewichtungen Zeigt nur dann die individuellen Raumgewichtungen an wenn eines der Modelle f r individuelle Differenzen angegeben ist Je nach Modell werden die Raumgewichtungen in Rotations und Dimensionsgewichtungen zerlegt die ebenfalls angezeigt werden Distanzen Zeigt die Distanzen zwischen den Objekten in der Konfiguration an Transformierte hnlichkeiten Zeigt die transformierten hnlichkeiten zwischen den Objekten in der Konfiguration an Eingabedaten Schlie t die urspr nglichen hnlichkeiten und sofern vorhanden die Datengewichtungen die Ausgangskonfiguration und die festen Koordinaten
12. Barlow R E D J Bartholomew D J Bremner als auch H D Brunk 1972 Statistical inference under order restrictions New York John Wiley and Sons Benz cri J P 1969 Statistical analysis as a tool to make patterns emerge from data In Methodologies of Pattern Recognition S Watanabe Hg New York Academic Press Bishop Y M S E Feinberg als auch P W Holland 1975 Discrete multivariate analysis Theory and practice Cambridge Massachusetts MIT Press De Leeuw J 1984 The Gifi system of nonlinear multivariate analysis In Data Analysis and Informatics III E Diday et al Hg De Leeuw J 1990 Multivariate analysis with optimal scaling In Progress in Multivariate Analysis S Das Gupta als auch J Sethuraman Hgg Kalkutta Indian Statistical Institute De Leeuw J als auch J Van Rijckevorsel 1980 HOMALS and PRINCALS Some generalizations of principal components analysis In Data Analysis and Informatics E Diday et al Hg Amsterdam North Holland De Leeuw J F W Young als auch Y Takane 1976 Additive structure in qualitative data An alternating least squares method with optimal scaling features Psychometrika 41 Gifi A 1990 Nonlinear multivariate analysis Chichester John Wiley and Sons 15 Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten Heiser W J als auch J J Meulman 1995 Nonlinear methods for the analysis of homogen
13. DEPENDNT rStreudiagramm 1 von 1 Zur ck Y ADJPRED SRESID SDRESID Diagramme der standardisierten Re _ Alle partiellen Diagramme erzeugen Histogramm Normalverteilungsdiagramm W hlen Sie ZRESID als y Variable aus W hlen Sie ZPRED als x Variable aus Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Lineare Regression auf Speichern 104 Kapitel 9 Abbildung 9 3 Speichern Vorhergesagte Werte Residuen Nicht standardisiert Nicht standardisiert E Standardisiert _ Korrigiert Studentisiert F Standardfehler des Mittelwerts Ausgeschlossen Studentisiert ausgeschl Distanzen Einflussstatistiken Mahalanobis _ DfBeta nach Cook __ Standardisierte s DfBeta Hebelwerte DfFit Vorhersageintervalle Standardisiertes DfFit Mittelwert E Individuell Kovarianzverhattnis Konfidenzintervall Koeffizientenstatistik 0 Koeffizientenstatistik erstellen Neues Datenblatt erstellen Datenblatt Name Neue Datendatei schreiben Modellinformation in XML Datei exportieren ue iv Kovarianzmatrix speichern wetter J Abbrechen __Hite _ W hlen Sie in der Gruppe Residuen die Option Standardisiert gt Klicken Sie auf Weiter Klicken Sie im Dialogfeld Line
14. customers_new sav Diese Datei enth lt hypothetische Daten zu Einzelpersonen die potenzielle Kandidaten f r Marketingkampagnen sind Zu diesen Daten geh ren demografische Informationen und eine bersicht ber die bisherigen Eink ufe f r jede Person Jeder Fall entspricht einer Einzelperson debate sav Hierbei handelt es sich um eine hypothetische Datendatei die gepaarte Antworten auf eine Umfrage unter den Zuh rern einer politischen Debatte enth lt Antworten vor und nach der Debatte Jeder Fall entspricht einem Befragten debate_aggregate sav Hierbei handelt es sich um eine hypothetische Datendatei in der die Antworten aus debate sav aggregiert wurden Jeder Fall entspricht einer Kreuzklassifikation der bevorzugten Politiker vor und nach der Debatte demo sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um eine Kundendatenbank geht die zum Zwecke der Zusendung monatlicher Angebote erworben wurde Neben verschiedenen demografischen Informationen ist erfasst ob der Kunde auf das Angebot geantwortet hat demo_cs_1 sav Hierbei handelt es sich um eine hypothetische Datendatei f r den ersten Schritt eines Unternehmens das eine Datenbank mit Umfrageinformationen zusammenstellen m chte Jeder Fall entspricht einer anderen Stadt Au erdem sind IDs f r Region Provinz Landkreis und Stadt erfasst demo_cs_2 sav Hierbei handelt es sich um eine hypothetische Datendatei f r den zweiten Schritt eines Untern
15. m Verwenden Sie die Mehrfachkorrespondenzanalyse zur Analyse einer Matrix mit kategorialen multivariaten Daten wenn Sie von keiner st rkeren Annahme ausgehen m chten als von der dass alle Variablen auf dem nominalen Niveau analysiert werden m Verwenden Sie die multidimensionale Skalierung zur Analyse von hnlichkeitsdaten um eine Darstellung einer einzelnen Gruppe von Objekten in einem schwachdimensionierten Raum mithilfe der Methode der kleinsten Quadrate zu finden m Verwenden Sie die multidimensionale Entfaltung zur Analyse von hnlichkeitsdaten um eine Darstellung zweier Gruppen von Objekten in einem schwachdimensionierten Raum mithilfe der Methode der kleinsten Quadrate zu finden 8 Kapitel 1 Kategoriale Regression Die Verwendung der kategorialen Regression ist am besten geeignet wenn das Ziel der Analyse darin besteht eine abh ngige Response Variable aus einem Set unabh ngiger Einflu Variablen vorherzusagen Wie bei allen Prozeduren f r die optimale Skalierung werden jeder Kategorie jeder Variablen Skalenwerte zugewiesen dergestalt dass diese Werte in Bezug auf die Regression optimal sind Die L sung einer kategorialen Regression maximiert die quadrierte Korrelation zwischen der transformierten Responsevariablen und der gewichteten Kombination transformierter Einflu variablen Beziehung zu anderen Prozeduren von Categories Die kategoriale Regression mit optimaler Skalierung ist vergleichbar mit der kanon
16. 1 trifft berhaupt nicht zu bis 6 trifft vollst ndig zu zu bewerten Die Werte werden ber die einzelnen Personen gemittelt und als hnlichkeiten verwendet Mit der Prozedur Multidimensionale Entfaltung finden Sie Gruppen von hnlichen Modellen sowie von Attributen mit denen diese am ehesten in Verbindung gebracht werden Statistiken und Diagramme Mit der Prozedur Multidimensionale Entfaltung k nnen Sie ein Iterationsprotokoll Stressma e Stress Zerlegung Koordinaten des gemeinsamen Raums Objektdistanzen innerhalb der endg ltigen Konfiguration individuelle Raumgewichtungen individuelle R ume transformierte Distanzen Stress Diagramme Streudiagramme des gemeinsamen Raums Streudiagramme der individuellen Raumgewichtungen Streudiagramme des individuellen Raums Transformationsdiagramme und Shepard Residuen Diagramme erstellen Daten Die Daten werden in Form von rechtwinkligen Distanzmatrizen bereitgestellt Jede Spalte wird als separates Spaltenobjekt betrachtet Jede Zeile einer Distanzmatrix wird als separates Zeilenobjekt betrachtet Wenn es mehrere Quellen f r die Distanzen gibt werden die Matrizen gestapelt Annahmen Es m ssen mindestens zwei Variablen angegeben werden Die Anzahl der Dimensionen in der L sung darf die Anzahl der Objekte minus 1 nicht bersteigen Wenn nur eine Quelle angegeben ist sind alle Modelle quivalent zum Identit tsmodell In diesem Fall wird f r die Analyse standardm
17. Age in yearsa Marital statusa Pets ownedb Newspaper read most often Music preferreda Neighborhood preferences a Optimales Skalierungsniveau Einfach nominal b Optimales Skalierungsniveau mehrfach nominal Betrachten Sie das Transformationsdiagramm f r Age in years Die Quantifikationen f r eine nominale Variable sind unbeschr nkt der nicht abnehmende Trend der bei der ordinalen Behandlung von Age in years vorlag ist daher nicht mehr vorhanden Bis zum Alter von 40 Jahren besteht ein abnehmender Trend ab diesem Alter liegt ein ansteigender Trend vor Dies 218 Kapitel 11 entspricht einer U f rmigen quadratischen Beziehung Die beiden Kategorien mit den h heren Altersgruppen erhalten weiterhin hnliche Werte und in nachfolgenden Analysen k nnen diese Kategorien ggf kombiniert werden Abbildung 11 28 Transformationsdiagramm f r Age in years nominal 2 0 2 in 0 0 Kategorienquantifikationen von Age in years 20 25 26 30 31 35 36 40 41 45 46 50 51 55 56 60 61 65 66 70 Age in years 219 Nichtlineare kanonische Korrelationsanalyse Hier wird das Transformationsdiagramm f r Neighborhood preference dargestellt Die nominale Behandlung von Age in years wirkt sich nicht nennenswert auf die Quantifikationen f r Neighborhood preference aus Die mittlere Kategorie erh lt die niedrigste Quantifikation die u eren Kategorien dagegen gro e positive Werte Abbildung 11 29 Tran
18. IBM SPSS Categories 19 Jacqueline J Meulman Willem J Heiser SPSS Inc ull Note Before using this information and the product it supports read the general information under Notices auf S 319 This document contains proprietary information of SPSS Inc an IBM Company It is provided under a license agreement and is protected by copyright law The information contained in this publication does not include any product warranties and any statements provided in this manual should not be interpreted as such When you send information to IBM or SPSS you grant IBM and SPSS a nonexclusive right to use or distribute the information in any way it believes appropriate without incurring any obligation to you Copyright SPSS Inc 1989 2010 Vorwort IBM SPSS Statistics ist ein umfassendes System zum Analysieren von Daten Das optionale Zusatzmodul Categories bietet die zus tzlichen Analyseverfahren die in diesem Handbuch beschrieben sind Die Prozeduren im Zusatzmodul Categories m ssen zusammen mit SPSS Statistics Core verwendet werden Sie sind vollst ndig in dieses System integriert Uber SPSS Inc ein Unternehmen von IBM SPSS Inc ein Unternehmen von IBM ist ein f hrender globaler Anbieter von Analysesoftware und l sungen zur Prognoseerstellung Mit der vollst ndigen Produktpalette des Unternehmens Datenerfassung Statistik Modellierung und Bereitstellung werden Einstellungen und Meinungen von
19. Tabelle 14 1 Quellstruktur der Verwandtschaftsdaten Quelle Geschlecht Bedingung Stichprobenumfang 1 Weiblich Einfache 85 Sortierung 2 M nnlich Einfache 85 Sortierung 3 Weiblich Erste 80 Sortierung 4 Weiblich Zweite 80 Sortierung Copyright SPSS Inc 1989 2010 253 254 Kapitel 14 Quelle Geschlecht Bedingung Stichprobenumfang 5 M nnlich Erste 80 Sortierung 6 M nnlich Zweite 80 Sortierung Jede Quelle entspricht einer hnlichkeitsmatrix mit 15 x 15 Elementen Die Anzahl der Zellen ist dabei gleich der Anzahl der Personen in einer Quelle minus der Anzahl der Platzierungen der Objekte in diese Quelle Dieses Daten Set finden Sie in kinship_dat sav F r weitere Informationen siehe Thema Beispieldateien in Anhang A in IBM SPSS Categories 19 Festlegen der Anzahl der Dimensionen Entscheiden Sie selbst wie viele Dimensionen die L sung erhalten soll Ein Screeplot kann Sie bei dieser Entscheidung unterst tzen Zum Erstellen eines Screeplots w hlen Sie die folgenden Befehle aus den Men s aus Analysieren gt metrisch gt Multidimensionale Skalierung PROXSCAL Abbildung 14 1 Dialogfeld Datenformat E Multidimensionale Ska lierung Datenformat rDatenformat Anzahl der Quellen Daten sind hnlichkeiten Eine Matrixquelle hnlichkeiten aus Daten erstellen Mehrere Matrixquellen rEine Quelle rMehrere Quellen hnlichkeiten stammen aus mehreren Spalten in gestapelten Mat
20. Zusatzvariablen Skala definieren Beschriftungsvariablen a Dimensionen in der L sung b W hlen Sie Intensit t bis Formalit t als Analysevariablen aus Klicken Sie auf Skala und Gewicht definieren 151 v v v Kategoriale Hauptkomponentenanalyse Abbildung 10 3 Skala und Gewichtung definieren Kategoriale Hauptkomponenten Skala und Gewichtung definieren X Variablengewichtung Messniveau der optimalen Skalierung Spline ordinal Ordinal Spline nominal Nominal Mehrfach nominal Numerisch Spline p ad i Knoten inner E mesen un W hlen Sie im Gruppenfeld Messniveau der optimalen Skalierung die Option Ordinal Klicken Sie auf Weiter W hlen Sie im Dialogfeld Kategoriale Hauptkomponenten die Variable Cluster als Beschriftungsvariable aus Klicken Sie auf Ausgabe 152 Kapitel 10 Abbildung 10 4 Dialogfeld Ausgabe E Kategoriale Hauptkomponenten Ausgabe Tabellen V Objektwerte Korrelationen der Originalvariablen Ko Y Fi Komponentenladungen E C terationsprotokoll EJ rrelationen der transformierten Variablen arianz ber cksichtigt f r Quartifizierte Variablen r Optionen f r Objektwerte Diese Kategorien ber cksichtigen Beschriftungsvariablen cluster Objektwerte bechriften mit gt eter _ a treeten Hate W hlen Sie im
21. ig das Identit tsmodell verwendet So lassen Sie eine multidimensionale Entfaltung berechnen W hlen Sie die folgenden Befehle aus den Men s aus Analysieren gt metrisch gt Multidimensionale Entfaltung PREFSCAL Copyright SPSS Inc 1989 2010 89 90 Kapitel 8 Abbildung 8 1 Hauptdialogfeld Multidimensionale Entfaltung E Multidimensionale Entfaltung hnlichkeiten E Gender gender all Toast pop up TP lj Buttered toast BT Bl English muffin and oll Jelly donut uo Quellen Yo W hlen Sie zwei oder mehre Variablen aus mit denen die Spalten in der rechtwinkligen Distanzmatrix identifiziert werden Jede Variable stellt ein separates Spaltenobjekt dar W hlen Sie optional Gewichtungsvariablen aus Die Anzahl der Gewichtungsvariablen muss der Anzahl der ausgew hlten Spaltenobjektvariablen entsprechen Die Reihenfolge der Gewichtungsvariablen muss mit der Reihenfolge der Spaltenobjekte bereinstimmen die sie gewichten W hlen Sie optional eine Zeilenvariable aus Die Werte oder Wertelabels dieser Variable werden verwendet um die Zeilenobjekte in der Ausgabe zu beschriften gt Wenn mehrere Quellen vorhanden sind w hlen Sie bei Bedarf eine Quellenvariable aus Die Anzahl der F lle in der Datendatei muss der Anzahl der Zeilenobjekte multipliziert mit der Anzahl der Quellen entsprechen Dar ber hinaus k nnen Sie ein Modell f r die multidimens
22. 1 2 2 1 3 Dieses Diagramm zeigt dass beim ersten Zeitpunkt das Symptom Binge eating Fre attacken die Bulimie Patienten 2 und 3 von den anderen 1 und 4 trennt die sexuelle Einstellung trennt die anorektischen und atypischen Patienten 1 und 2 von den anderen 2 und 3 Preoccupation with food and weight Besch ftigung mit Essen und Gewicht bietet keine Trennung der Patienten Bei vielen Anwendungen w rde dieses Diagramm ausreichen um die Beziehung zwischen den Symptomen und der Diagnose zu beschreiben aufgrund der h heren Komplexit t durch die Zeitpunkte wird das Bild jedoch unklar 187 Kategoriale Hauptkomponentenanalyse Um diese Projektionen im Verlauf der Zeit zu betrachten m ssen Sie in der Lage sein den Inhalt der Tabelle der projizierten Zentroide grafisch darzustellen Dies wird durch die OMS Anforderung erm glicht mit der diese Informationen in der Datei projected_centroids sav gespeichert wurden Abbildung 10 45 Projected_centroids sav 1 projected_centroids sav Daten Editor Datei Bearbeiten Ansicht Daten Transformieren Analysieren Grafiken Extras Add Ons Fenster Hilfe Bingeeating Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids Projected Centroids oon onnkown Zlslslol oln e w n
23. 1975 die Sie in der Datei screws sav finden F r weitere Informationen siehe Thema Beispieldateien in Anhang A in IBM SPSS Categories 19 Dieses Daten Set enth lt Informationen zu den Eigenschaften von Schrauben Bolzen Muttern und Rei n geln Die folgende Tabelle zeigt die Variablen mit den zugeh rigen Variablenlabels und den Wertelabels die den Kategorien jeder Variablen im Daten Set f r Eisenwaren von Hartigan zugeordnet sind Tabelle 13 1 Daten Set f r Eisenwaren von Hartigan Variablenname Variablenlabel Wertelabel gewinde Gewinde Ja Nein kopf Head form Kopfform flach konisch rund gew lbt zylinderf rmig kerbe Einkerbung des Schlitz keine Kreuz Kopfes form Grundform flach scharf l nge L nge in cm 0 5 cm 1 cm 1 5 cm 2 cm 2 5 cm messing Messing Nein Ja object Objekt Rei nagel Nagell Nagel2 Nagel3 Nagel4 Nagel5 Nagel6 Nagel7 Nagel8 Schraubel Schraube2 Schraube3 Schraube4 Schraube Bolzenl Bolzen2 Bolzen3 Bolzen4 Bolzen5 Bolzen6 Nagell nagel2 Nagelb Schraubeb Copyright SPSS Inc 1989 2010 236 237 Mehrfachkorrespondenzanalyse Durchf hren der Analyse Zum Erstellen einer Mehrfachkorrespondenzanalyse w hlen Sie die folgenden Befehle aus den Men s aus Analysieren gt Dimensionsreduzierung gt Optimale Skalierung Abbildung 13 1 Dialogfeld Optimale Skalierung E Optimale Skalierung Messniveau der optimalen Skalier
24. Blueberry muffin and margarine Cinnamon bun g7 19 20 o 1 o o 28 a Jelyidanutionut 4 2021 28 199 Gantes party la 1735 44 S 9 0038 305 8 340 oo o 6 00 o 0 0 o 12 5 14 3 17 71342 970 4 E o O 31 24 35 o A 29 36 o Oo 4p 1 019 39 o 37 320 O O Buttere Buttered toast and jelly ered9A fol s and butter 2 O Toast and marmalade o Toast and margarine o Toast pop up 2 1 0 1 N w Dimension 1 Das gemeinsame Diagramm des gemeinsamen Raums weist eine endg ltige Konfiguration auf die der Analyse mit klassischer Spearman Ausgangskonfiguration hnelt Die Spaltenobjekte Fr hst cksartikel befinden sich jedoch im Umkreis der Zeilenobjekte Personen anstatt mit diesen vermischt zu sein 293 Multidimensionale Entfaltung Individueller Raum Abbildung 15 21 Dimensionsgewichtungen f r Ausgangskonfiguration mit Korrespondenzanalyse Spezifit t Overall preference 279 Breakfast with juice bacon and eggs and beverage Breakfast with juice cold cereal and beverage 636 263 Breakfast with juice pancakes sausage and 389 beverage Breakfast with beverage only Snack with beverage only 552 Wichtigkeitb 351 a Die Spezifit t gibt an wie typisch eine Quelle ist Der Bereich f r die Spezifit t liegt zwischen null und eins Dabei weist null auf eine durchschnittliche Quelle mit identischen Dimensionsgewichtungen hin Eins weist auf eine sehr spezifis
25. Centroids Projected on 3 Lemyrandlung amp Centroids Projected on Aktuelles Datum aktuelle Uhr 2 time Funktionen und Sondervariablen optionale Fallauswahlbedingung te gt Rufen Sie das Dialogfeld Variable berechnen auf Geben Sie diagnosis als Zielvariable ein gt Geben Sie mod casenum 1 4 1 als numerischen Ausdruck ein Klicken Sie auf OK 190 Kapitel 10 Abbildung 10 48 Projected_centroids sav 3 projected_centroids sav DatenSet4 Daten Editor Datei Bearbeiten Ansicht Daten Transformieren Analysieren Grafiken Extras Fenster Hilfe 2 HA oo BE A ae Numeric Table ae None None Nominal _ String None None Nominal String None None Nominal String None None Nominal String None None Nominal Numeric Centroids Proj None None i Scale Numeric Centroids Proj None None i Scale i Numeric Centroids Proj None None i Scale Numeric None None i Scale i Numeric None None ight O v 19 Metrisch Ordinal Pes Nominal N N w w w Prozessor ist bereit ndern Sie in der Variablenansicht das Ma f r diagnosis Diagnose von Metrisch in Nominal 191 Kategoriale Hauptkomponentenanalyse Abbildung 10 49 Diagrammerstellung a Diagrammerstellung X Variablen Diagrammvorschau verwendet Beispleidaten amp Table Number TableNu da Command_ i i diagnosis a S
26. Datei Durchsuchen Modelle roc EECA A Protokolle Tabellen Texte Warnungen berschriften bia Elta alls E Aus Viewer ausschlie en Basierend aut Objektnamen Ordner chen Neues Datenblatt Klicken Sie auf Beenden Klicken Sie auf OK und dann zur Best tigung noch einmal auf OK Transformationsdiagramme Die Transformationsdiagramme zeigen die urspr ngliche Kategorienummer auf den horizontalen Achsen an die vertikalen Achsen zeigen die optimalen Quantifizierungen 176 Kapitel 10 Abbildung 10 32 Transformationsdiagramm f r die Menstruation Transformation Menstruation 004 Quantifizierungen 1 2 w Kategorien Einige Variablen wie Menstruation Menstruation ergaben fast lineare Transformationen Daher k nnen Sie sie in dieser Analyse als numerisch interpretieren Abbildung 10 33 Transformationsdiagramm f r School employment record schulische berufliche Leistungen Transformation Schoollemployment record Quantifizierungen in 1 2 3 Kategorien Die Quantifizierungen f r andere Variablen wie School employment record schulische berufliche Leistungen ergaben keine linearen Transformationen und sollten auf dem ordinalen Skalierungsniveau interpretiert werden Der Unterschied zwischen der zweiten und der dritten Kategorie ist wesentlich wichtiger als der Unterschied zwischen der ersten und der zweiten Kategorie 177 Abbildung
27. F J M Van Tuijl als auch J J Meulman 2000 Macro and micro goal setting In search of coherence Applied Psychology 49 De Leeuw J 1982 Nonlinear principal components analysis In COMPSTAT Proceedings in Computational Statistics Wien Physica Verlag De Leeuw J 1984 Canonical analysis of categorical data 2nd Hg Leiden DSWO Press De Leeuw J 1984 The Gifi system of nonlinear multivariate analysis In Data Analysis and Informatics III E Diday et al Hg De Leeuw J als auch W J Heiser 1980 Multidimensional scaling with restrictions on the configuration In Multivariate Analysis Vol V P R Krishnaiah Hg Amsterdam North Holland De Leeuw J als auch J Van Rijckevorsel 1980 HOMALS and PRINCALS Some generalizations of principal components analysis In Data Analysis and Informatics E Diday et al Hg Amsterdam North Holland Copyright SPSS Inc 1989 2010 321 322 Bibliografie De Leeuw J F W Young als auch Y Takane 1976 Additive structure in qualitative data An alternating least squares method with optimal scaling features Psychometrika 41 De Leeuw J 1990 Multivariate analysis with optimal scaling In Progress in Multivariate Analysis S Das Gupta als auch J Sethuraman Hgg Kalkutta Indian Statistical Institute Eckart C als auch G Young 1936 The approximation of one matrix by another one of lower rank Psychometrika 1 Fisher R
28. Fo Lt E Daily ozone level Quan Unabh ngige Variable n 8 Inversion base height ibh Nominal E Pressure gradient mm dpg Nominal 2 Visibility miles Quanti temp Ordinal 8E Temperature degrees 8 Day of the year Quanti Deaktivieren Sie die Eintr ge Visibility miles und Day of the year als unabh ngige Variablen gt Klicken Sie auf OK 137 Kategoriale Regression Abbildung 9 46 Modellzusammenfassung f r die kategoriale Regression von drei Einflussgr en Offensichtlich er Korrigiertes Vorhersagefe Multiples R R Quadrat R Quadrat hler Abhangige Variable Daily ozone level Einflu variablen Inversion base height Pressure gradient mm Hg Temperature degrees F Die kategoriale Regressionsanalyse ergibt eine Anpassungsg te von 0 796 also einen besseren Wert als bei der G te 0 732 Dies belegt die Eigenschaft der Skalierung dass die in der urspr nglichen Regression erzielten Quantifikationen nur dann optimal sind wenn alle f nf Variablen im Modell ber cksichtigt werden Auswirkungen von Transformationen Beim Transformieren der Variablen wird eine nichtlineare Beziehung zwischen der urspr nglichen Antwort und der urspr nglichen Gruppe von Einflussgr en in eine lineare Beziehung f r die transformierten Variablen umgewandelt Wenn jedoch mehrere Einflussgr en vorliegen werden paarweise Beziehungen durch die anderen Variablen im Modell durcheinandergebracht Soll
29. J Ravesloot als auch J J Meulman 2000 The role of parents and peers in the leisure activities of young adolescents Journal of Leisure Research 32 Kapitel Nichtlineare kanonische Korrelationsanalyse Die nichtlineare kanonische Korrelationsanalyse dient zur Bestimmung wie hnlich zwei oder mehr Gruppen von Variablen einander sind Wie bei der linearen kanonischen Korrelationsanalyse ist das Ziel die Varianz in den Beziehungen unter den Gruppen in einem flachdimensionierten Raum so gut wie m glich zu ber cksichtigen Anders als bei dei der linearen kanonischen Korrelationsanalyse wird bei der nichtlinearen kanonischen Korrelationsanalyse nicht von einem linearen Messniveau oder von linearen Beziehungen ausgegangen Ein weiterer wichtiger Unterschied besteht darin dass bei der nichtlinearen kanonischen Korrelationsanalyse die hnlichkeit zwischen den Gruppen durch den gleichzeitigen Vergleich linearer Kombinationen der Variablen in jeder Gruppe mit einer unbekannten Gruppe durchgef hrt wird Objektwerte Beispiel Analyse der Umfrageergebnisse Das Beispiel in diesem Kapitel stammt aus einer Umfrage Verdegaal 1985 Die Antworten von 15 Subjekten auf 8 Variablen wurden aufgezeichnet Die Variablen Variablenlabels und Wertelabels Kategorien im Daten Set werden in der folgenden Tabelle angezeigt Tabelle 11 1 Umfragedaten Variablenname Variablenlabel age Age in years marital Marital status pet Pets owned news
30. Kategoriale Regression Abbildung 9 24 Residuen bei der kategorialen Regression 0 604 o 0 404 o o 0204 8 o E o 3 o Pr omw 9 i 8 8 a x o o 0 20 o 0 40 o o 0 60 T T T T T 1 00 0 50 0 00 0 50 1 00 Package design Quantifikation Beispiel Ozondaten In diesem Beispiel werden die Auswahl und die Auswirkungen von Transformationen mit optimaler Skalierung anhand eines gr eren Daten Sets verdeutlicht Die Daten umfassen 330 Beobachtungen f r sechs meteorologische Variablen die unter anderem bereits von Breiman und Friedman Breiman als auch Friedman 1985 sowie von Hastie und Tibshirani Hastie als auch Tibshirani 1990 analysiert wurden In der nachstehenden Tabelle werden die urspr nglichen Variablen beschrieben Die kategoriale Regression soll die Ozonkonzentration aus den verbleibenden Variablen vorhersagen Bei fr heren Untersuchungen fanden Wissenschaftler einige Nichtlinearit ten unter diesen Variablen die die Standardverfahren bei der Regression behindern Tabelle 9 2 Urspr ngliche Variablen Variable Beschreibung ozon daily ozone level kategorisiert in eine von 38 Kategorien ibh inversion base height dpg pressure gradient mm Hg vis visibility miles temp temperature degrees F doy day of the year 122 Kapitel 9 Dieses Daten Set finden Sie in ozone sav F r weitere Informationen siehe Thema Beispieldateien in Anhang A in IBM SPSS Categories 19 Diskretisierung
31. Money back guarantee Dimension Eigenwert Abbildung 9 17 Korrelationen transformierter Einflussvariablen Good Package Housekee Money back design Brand name ping seal guarantee Package design Brand name Price Good Housekeeping seal Money back guarantee Dimension Eigenwert Die Interkorrelationen der Einflussgr en f r die nicht transformierten und die transformierten Einflussgr en werden dargestellt Alle Werte liegen nahe 0 dies bedeutet dass Multi Kollinearit t zwischen einzelnen Variablen kein Problem ist Beachten Sie dass ge nderte Korrelationen nur bei Package design auftreten Alle anderen Einflussgr en werden numerisch behandelt die Differenzen zwischen den Kategorien und die Reihenfolge der Kategorien bleiben f r diese Variablen also erhalten Das bedeutet wiederum dass die Korrelationen sich nicht ndern Anpassungsg te des Modells und Koeffizienten Die Prozedur Kategoriale Regression liefert einen Wert von 0 948 f r R2 Dies bedeutet dass nahezu 95 der Varianz in der Einstufung der transformierten Bevorzugung durch die Regression der optimal transformierten Einflussgr en erkl rt werden Durch Transformieren der Einflussgr en erzielen Sie eine h here Anpassungsg te im Vergleich zum Standardverfahren Abbildung 9 18 Modellzusammenfassung f r kategoriale Regression Korrigiertes Multiples R R Quadrat R Quadrat Abhangige Variable Preference Einflu variable
32. amp Diagnosis diag2 di time2 Skala und Gewicht definieren Zusatzvariablen Beschriftungsvariablen a Dimensionen in der L sung W hlen Sie Time of interview Zeitpunkt der Befragung bis Patient Number Patientennummer als Beschriftungsvariablen aus Klicken Sie auf Optionen 170 Kapitel 10 Abbildung 10 26 Dialogfeld Optionen Normalisierungsmethode Bess Bereich von F llen Letzter Benutzerdefinierter Wert Einzelner Fall Kriterien Konvergenz Maximalzahl der Iterationen Diagramme beschriften mit Variablen oder Wertelabels enzung f r Beschriftungen 29 Variablennamen oder Werte rDiagrammdimensionen Alle Dimensionen in der L sung anzeigen Anzahl der Dimensionen beschr nken Niedrigste Dimension H chste Dimension rKonfiguration W hlen Sie Variablennamen oder Werte als Option f r die Diagrammbeschriftung Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Kategoriale Hauptkomponenten auf Ausgabe 171 vv v vy y Abbildung 10 27 Dialogfeld Ausgabe iii Kategoriale Hauptkomponenten Ausgabe X Tabellen M Objektwerte Fi Komponentenladungen E terationsprotokoll _ Korrelationen der Originalvariablen Ti Korrelationen der transformierten variablen E Varianz ber cksichtigt f r Quartifizierte Variablen Kategorienquantifika
33. auf Kategorie 154 Kapitel 10 Abbildung 10 6 Kategoriendiagramme E Kategoriale Hauptkomponenten Kategoriendiagramme Kategoriendiagramme Verbundene Kategoriendiagramme _ 5 r Transformationsdiagramme BB Resicu r Zertroide projizieren von Aktivieren Sie die Erstellung von verbundenen Kategoriendiagrammen f r intensit Intensit t bis formal Formalit t Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Kategoriale Hauptkomponenten auf OK Anzahl der Dimensionen Die folgenden Abbildungen zeigen einen Teil der urspr nglichen Ausgabe f r die kategoriale Hauptkomponentenanalyse Nach dem Iterationsprotokoll des Algorithmus wird die Modellzusammenfassung einschlie lich der Eigenwerte der einzelnen Dimensionen angezeigt Diese Eigenwerte entsprechen denen der klassischen Hauptkomponentenanalyse Es gibt Ma e daf r wie die Varianz von den einzelnen Dimensionen ber cksichtigt wird 155 Kategoriale Hauptkomponentenanalyse Abbildung 10 7 Iterationsprotokoll Yarianz ber cksichtigt Verlustfunktion Beschrankung des Zentroidko Zentroids auf die Iterationszahl Zunahme ordinaten Yektorkoordinaten 0a 4 515315 000000 5 484685 4 075583 1 409101 316 4 726009 000008 5 273991 4 273795 1 000196 a Iteration 0 zeigt die Statistik der L sung mit allen als numerisch behandelten variablen au er solchen mit dem Me niveau der optimalen Skalierun
34. cksichtigt Gesamt Eigenwert Tr gheit der Varianz Cronbachs Dimension Alpha 1 2 Gesamt Mittelwert a Der Mittelwert von Cronbachs Alpha basiert auf dern Mittelwert der Eigenwerte Die Eigenwerte sind leicht verschoben Die erste Dimension erkl rt nun einen etwas gr eren Teil der Varianz 250 Kapitel 13 Abbildung 13 16 Diskriminationsma e 10 0 8 L nge in cm messing Dimension 2 0 4 Fikmin dere K nde 0 0 0 0 0 2 0 4 0 6 0 8 1 0 Dimension 1 Wie im Diskriminationsdiagramm gezeigt bietet Einkerbung des Kopfes keine Diskrimination in der zweiten Dimension mehr w hrend Messing nun nicht mehr wie zuvor gar keine Diskrimination aufweist sondern zumindest in der zweiten Dimension eine Diskrimination bietet Die Diskrimination f r die brigen Variablen bleibt weitgehend unver ndert Abbildung 13 17 Objektwerte beschriftet mit Messing nach der Entfernung des Ausrei ers 5 Nein e Nein Nein Nein Nein i 0 Nein Nein o o9 S Nein 2 Nein A 0H Nein o B Nein Neln Nein o a Nein e Nein 1 Ja Ja Ja o e iy Em ee aay ee Naess ber 15 140 05 00 0 1 0 1 in 5 Dimension 1 Das Objektwertediagramm mit der Beschriftung Messing zeigt da die vier Messingobjekte alle ziemlich weit unten im Diagramm erscheinen drei Objekte nehmen exakt dieselbe Position ein was eine hohe Diskrimination entlang der zweiten Dimension anzeigt W
35. die f r die Analyseeinheiten verf gbar sind Im vorliegenden Fall kennen Sie die Klassifikation der Objekte In anderen F llen k nnen Sie zur Beschriftung der Objekte Zusatzvariablen verwenden Sie sehen au erdem dass die kategoriale Hauptkomponentenanalyse MOBS nicht von PRIMARY GROUPS trennt Obwohl die meisten Personen ihre Familie nicht als Mob bezeichnen w rden haben diese beiden Gruppen bei vier der f nf verwendeten Variablen dieselbe Wertung erhalten Offensichtlich sollten die verwendeten Variablen und Kategorien auf m gliche Schw chen untersucht werden Beispielsweise haben hohe Interaktionsintensit t und nicht f rmliche Beziehung f r diese beiden Gruppen nicht dieselbe Bedeutung Alternativ k nnte die Verwendung einer L sung mit mehr Dimensionen in Erw gung gezogen werden Komponentenladungen Diese Abbildung zeigt das Diagramm der Komponentenladungen Die Vektoren Linien sind relativ lang was wiederum anzeigt dass der Gro teil der Varianz aller quantifizierten Variablen auf die ersten beiden Dimensionen entf llt In der ersten Dimension haben alle Variablen hohe positive Komponentenladungen Die zweite Dimension ist haupts chlich mit den quantifizierten Variablen Zugeh rigkeit und Entfernung in entgegengesetzte Richtungen korreliert Das bedeutet dass Objekte mit einem hohen negativen Wert in Dimension 2 einen hohen Wert f r das Zugeh rigkeitsgef hl und einen niedrigen Wert f r die physische N he
36. die zweite Variable entspricht den Koordinaten der zweiten Dimension usw Ein fehlender Wert zeigt an dass eine Koordinate in einer Dimension frei ist Die Anzahl der ausgew hlten Variablen muss der angegebenen H chstanzahl von Dimensionen entsprechen Die Anzahl der F lle jeder Variablen muss der Anzahl der Objekte entsprechen Multidimensionale Entfaltung Optionen Im Dialogfeld Optionen k nnen Sie die Ausgangskonfiguration ausw hlen Iterations und Konvergenzkriterien angeben und den Penalisierungsterm f r den Stress festlegen 94 Kapitel 8 Abbildung 8 4 Dialogfeld Optionen E Multidimensionale Entfaltung Optionen rAusgangskonfiguration ____ rIterationskriterien Klassisch Stress Konvergenz 000001 Berechnung nach Spearma Mindest Stress 0001 Ross Cliff Maximalzahl der tterationen 5000 Korrespondenz Zentroide rPenalisierungsterm St rke 5 Zufallsstarts ii Bereich 0 Anpassen rAngepasste Konfiguration Ausgangskonfiguration W hlen Sie eine der folgenden Optionen Klassisch Die rechtwinklige Distanzmatrix wird verwendet um die Zwischenbl cke Werte zwischen Zeilen und zwischen Spalten der vollst ndig symmetrischen MDS Matrix zu erg nzen Sobald die vollst ndige Matrix gebildet ist wird als Ausgangskonfiguration eine klassische Skalierungsl sung verwendet Die Zwisch
37. entspricht die Anzahl der Kategorien der Anzahl der unterschiedlichen Werte Werte von String Variablen werden immer in positive ganze Zahlen umgewandelt indem in aufsteigender alphanumerischer Reihenfolge Kategorienummern zugewiesen werden Die Diskretisierung von String Variablen erfolgt anhand dieser Ganzzahlen Andere Variablen werden in der Standardeinstellung nicht modifiziert Die diskretisierten Variablen werden dann in der Analyse verwendet Abbildung 3 4 Diskretisierung H Kategoriale Hauptkomponenten Diskretisierung Variablen weight Nicht angegeben o fast Nicht angegeben binge Nicht angegeben vomit Nicht angegeben purge Nicht angegeben hyper Nicht angegeben fami Nicht angegeben eman Nicht angegeben frie Nicht angegeben Gruppieren Anzahl Kategorien Verteilung Normalverteilung Gleichvertverteilung Gleiche Intervalle Methode Verf gbar sind die Optionen Gruppieren Einstufen oder Multiplizieren 33 Kategoriale Hauptkomponentenanalyse CATPCA Gruppierung Hierbei werden die Daten in eine bestimmte Anzahl von Kategorien oder nach Intervall umkodiert m Einstufen Die Variable wird durch Bilden einer Rangfolge diskretisiert Multiplizieren Die aktuellen Werte der Variablen werden standardisiert mit 10 multipliziert und gerundet Anschlie end wird eine Konstante zu den Werten addiert sodass der niedrigste diskretisierte Wert 1
38. erhalb des f r die Variable definierten Bereichs liegen werden in den Diagrammen jedoch angezeigt Nichtlineare kanonische Korrelationsanalyse Optionen Das Dialogfeld Optionen erm glicht Ihnen die Auswahl von optionalen Statistiken und Diagrammen die Speicherung von Objektwerten als neue Variablen in der Arbeitsdatei die Angabe von Iterations und Konvergenzkriterien sowie die Angabe einer Ausgangskonfiguration f r die Analyse 49 Nichtlineare kanonische Korrelationsanalyse OVERALS Abbildung 4 5 Dialogfeld Optionen fF OVERALS Optionen Anzeige Fi H ufigkeiten Fi Einfache und mehrfache Anpassung T Zentroide IM Kategorienquantifikationen Fi Gewichte und Komponentenladungen terationsprotokoll Objektwerte r Diagramm E Kategorienkoordinsten Kategorienzentroide V Objektwerte Transformationen IM Komponentenladungen _ Objektwerte speichern Pi Zuf llige Anfangskonfiguration verwenden Kriterien Anzahl der tterationen Konvergenz Cis rn im Anzeigen Die verf gbaren Statistiken umfassen marginale H ufigkeiten Zentroide Iterationsprotokoll Gewichte und Komponentenladungen Kategorienquantifikationen Objektwerte und einfache und mehrfache Anpassung Zentroide Kategorienquantifikationen sowie die prognostizierten und tats chlichen Mittelwerte der Objektwerte f r die in jedem Set enthaltenen Objekt
39. lt ist die Analyse identisch mit der kategorialen Regression mit optimaler Skalierung So berechnen Sie eine nichtlineare kanonische Korrelationsanalyse W hlen Sie die folgenden Befehle aus den Men s aus Analysieren gt Dimensionsreduktion gt Optimale Skalierung Abbildung 4 1 Dialogfeld Optimale Skalierung EH Optimale Skalierung rMessniveau der optimalen Skalierung Alle Variablen sind mehrfach nominal Einige Variablen sind nicht mehrfach nominal rAnzahl der Variablen Sets Ein Set Mehrere Sets rAusgew hlte Analyse Nichtlineare kanonische Korrelation Gi aan me W hlen Sie entweder Alle Variablen sind mehrfach nominal oder Einige Variablen sind nicht mehrfach nominal aus 46 Kapitel 4 W hlen Sie Mehrere Sets Klicken Sie auf Definieren Abbildung 4 2 Dialogfeld Nichtlineare kanonische Korrelationsanalyse OVERALS E Nichtlineare kanonische Korrelationsanalyse OVERALS amp Pets owned pet R a u wetter amp Newspaper read most amp Music preferred music Variablen amp Neighborhood prefere cil Math test score math ail Language test score l Beschriftung f r Diagramme der Objektwerte a Dimensionen in der L sung Definieren Sie mindestens zwei Variablen Sets W hlen Sie die Variablen aus die in das erste Set aufgenommen werden sollen Um zum
40. nkungsvariablen variablen einlesen aus Datei C Program Files SPSSinc PASVVSt kinship_var sav Verf gbar Ausgew hlt Fr o o o Transformationen f r unabh ngige Variablen terval ooo T Lweter_ antrecnen _tite_ Einschr nkungen im gemeinsamen Raum Geben Sie die gew nschte Art der Einschr nkung an m Keine Einschr nkungen Es werden keine Einschr nkungen f r den gemeinsamen Raum festgelegt m Einige Koordinaten sind fest Die erste ausgew hlte Variable enth lt die Koordinaten der Objekte in der ersten Dimension die zweite Variable entspricht den Koordinaten der zweiten Dimension usw Ein fehlender Wert zeigt an dass eine Koordinate in einer Dimension frei ist Die Anzahl der ausgew hlten Variablen muss der angegebenen H chstanzahl von Dimensionen entsprechen m Lineare Kombination der unabh ngigen Variablen Der gemeinsame Raum muss eine lineare Kombination der ausgew hlten Variablen sein Einschr nkungsvariablen W hlen Sie die Variablen aus die die Einschr nkungen f r den gemeinsamen Raum definieren Wenn Sie eine lineare Kombination angegeben haben geben Sie f r die Einschr nkungsvariablen eine Intervall Nominal Ordinal oder Spline Transformation an Die Anzahl der F lle muss in jedem Fall der Anzahl der Objekte entsprechen Multidimensionale Skalierung Optionen Das Dialogfeld Optionen erm glicht Ihnen die Auswahl der Anfangskonfiguration die Angabe von
41. o u le aunt 5 gauntethei o uncle cousin a i a is a 5 null er a bs ephsiiece gsiayigh Dimension 1 Dimension 2 Dimension 3 Betrachten Sie die endg ltigen Koordinaten f r die Objekte in den Dimensionen 1 und 3 dies ist das Diagramm im unteren linken Bereich der Streudiagramm Matrix Dieses Diagramm zeigt dass Dimension 1 auf der x Achse mit der Variablen gender korreliert Dimension 3 auf der y Achse dagegen mit der Variablen gener Von links nach rechts wird ersichtlich dass Dimension 1 die weiblichen und m nnlichen Bezeichnungen trennt die im Grunde genommen geschlechtslose Bezeichnung Cousin befindet sich in der Mitte Steigende Werte entlang der Achse von unten nach oben im Diagramm geh ren zu Bezeichnungen lterer Familienmitglieder Betrachten Sie nun die endg ltigen Koordinaten f r die Objekte in den Dimensionen 2 und 3 dies ist das Diagramm im mittleren rechten Bereich der Streudiagramm Matrix Aus diesem Diagramm geht hervor dass die zweite Dimension auf der y Achse der Variablen degree entspricht gr ere Werte an der Achse entsprechen dabei Bezeichnungen au erhalb der Kernfamilie Dreidimensionale L sung mit nicht standardm igen Transformationen Bei der vorangegangenen L sung wurde die Verh ltnistransformation nach dem Standardverfahren f r hnlichkeiten verwendet sowie Intervalltransformationen f r die unabh ngigen Variablen gener und degree Die Ergebnisse sind schon recht gut mit anderen Transfor
42. oO oO oO oO o oO oO oO oO oO oO oO oO Kategorien Das Transformationsdiagramm von Temperature zeigt ein anderes Muster In h heren Kategorien steigen auch die Quantifikationen Das bedeutet Wenn Temperature ansteigt steigen auch die vorhergesagten Ozonwerte Aus diesem Muster geht hervor dass eine Skalierung von Temperature auf ordinalem Messniveau empfehlenswert w re 131 Kategoriale Regression Abbildung 9 36 Transformationsdiagramm von Day of the year nominal Transformation Day ofthe year N Quantifikationen LL 00 EO ta c6L 00 8 T ZST 00 EFT 4 ZEZ 00 EZ 00Z1 00 00 ZE 00 EZ 0076 00 ra rr 00 222 00 E87 00 ZEL O0 E 007ZSL 00 Er 00 Z221 00 9 00 00 01z 00 0z 00 Z6Z 00 8z 00 72 LE 00 0 00 ZSE 00 Er 007 00 00 Kategorien Diese Abbildung zeigt das Transformationsdiagramm von Day ofthe year Die Quantifikationen steigen bis zum Mittelpunkt der Grafik an und sinken dann wieder ab So ergibt sich eine umgedrehte U Form Unter Ber cksichtigung des Vorzeichens beim Regressionskoeffizienten f r Day ofthe year erhalten die urspr nglichen Kategorien jeweils eine Quantifikation die sich senkend auf den vorhergesagten Ozonwert auswirkt Bei den mittleren Kategorien erh hen sich die Auswirkungen der Quantifikationen auf den vorhergesagten Ozonwert wobei etwa um den Mittelpunkt der Grafik ein Maximum erreicht wird Nach diesem Punkt f hren die Quant
43. vater Gro mutter Enkel und Schwester in Verbindung bringen Die beiden Quellen die den gr ten Teil des Stresses liefern sind die beiden Gruppen die die Bezeichnungen nur einmal sortiert hatten Diese Information legt nahe dass die Studenten beim Sortieren der Bezeichnungen mehrere Faktoren in Betracht gezogen hatten und dass sich die Studenten die die Bezeichnungen zweimal sortierten bei der ersten Sortierung auf einen Teil dieser Faktoren konzentrierten und dann die verbleibenden Faktoren bei der zweiten Sortierung anwendeten Die Objekte mit dem gr ten Anteil am Stress sind die Objekte mit einem Wert von 2 f r degree also Verwandte die nicht zur Kernfamilie geh ren Mutter Vater Tochter Sohn aber dennoch n her verwandt sind als andere Diese Mittelposition k nnte leicht eine differentielle Sortierung dieser Terme verursachen Endg ltige Koordinaten des gemeinsamen Raums Im Diagramm mit dem gemeinsamen Raum werden die Beziehungen zwischen den Objekten anschaulich dargestellt 266 Kapitel 14 Abbildung 14 15 Koordinaten des gemeinsamen Raums brotbi ntheephawle de rmnkew grande _ owa 0000000 c ath gson Cousin father 2 5 o man Ocousin c o amp motkapother aunt niece aungmother owo 0090090 i kitter NIECE gdaughdau isieither en cousin a BARE nephew nigephew ge Ne eg RE S grira her Higher o gmat RAE etter gdaud sister ratier daughter son giaughter 0 gmother gfather greater
44. werden Werte au erhalb dieses Bereichs werden als fehlende Werte betrachtet Der minimale Kategoriewert ist immer 1 Der maximale Kategoriewert wird vom Benutzer angegeben Dieser Wert gibt nicht die Anzahl der Kategorien f r eine Variable an sondern den gr ten Kategoriewert In der Tabelle beispielsweise weist Schema A einen maximalen Kategoriewert von 3 und Schema B einen maximalen Kategoriewert von 7 auf obwohl beide Schemata dieselben drei Kategorien kodieren Der Variablenbereich bestimmt welche Kategorien aus der Analyse ausgeschlossen werden Alle Kategorien mit Codes au erhalb des definierten Bereichs werden aus der Analyse ausgeschlossen Dies ist eine einfache Methode f r den Ausschluss von Kategorien die jedoch zu unerw nschten Analysen f hren kann Wenn der maximale Kategoriewert falsch definiert ist werden m glicherweise g ltige Kategorien aus der Analyse ausgeschlossen Beispiel Bei Schema B wird durch die Festsetzung des maximalen Kategoriewerts auf den Wert 3 angegeben dass f r T tigkeit Kategorien von 1 bis 3 kodiert sind Die Kategorie Manager wird als fehlend behandelt Da tats chlich keine Kategorie als 3 kodiert wurde enth lt die dritte Kategorie in der Analyse keine F lle Wenn Sie alle Managerkategorien ausschlie en m chten ist diese Analyse geeignet Wenn die Manager eingeschlossen sein sollen muss der maximale Kategoriewert als 7 definiert sein und fehlende Werte m ssen mit Werten ber 7 oder unter 1
45. 00 Er 00Z21 00 E9 00 26 1 00 8 00 ZET 00 pZ 00 Z57 00 Er 00 227 00 E37 00 ZEZ 00 ES 00ZLE OD EO 00 ZEE OD EZ 00 ZSE 00 Er 00 S9E 00 E9E 0 Kategorien Diese Abbildung zeigt das Transformationsdiagramm von Day of the year Die Extremwerte f r Day of the year erhalten jeweils negative Quantifikationen die zentralen Werte besitzen dagegen positive Quantifikationen Mithilfe dieser Transformation zeigen die hohen und niedrigen Werte f r Day of the year hnliche Auswirkungen auf den vorhergesagten Wert f r Daily ozone level 145 Kategoriale Regression Abbildung 9 56 Diagrammerstellung Variablen Diagrammvorschau verwendet Beispleidaten YY Cany ULUNG IEYEI S 8 Inversion base heig E Pressure gradient visibility miles Qu Temperature degre L Day of the year Qu 2 Daily ozone level Q 8E Inversion base heig E Pressure gradient E Temperature degre L Daily ozone level Q amp Day of the year Qu X Daily ozone level Quantifi CE arm een Can Can Zum Anzeigen eines Streudiagramms f r die transformierten Variablen ffnen Sie erneut die Diagrammerstellung und klicken Sie auf Zur cksetzen Die bisherige Auswahl wird gel scht W hlen Sie die GalerieStreu Punktdiagramm aus und w hlen Sie die Option Einfaches Streudiagramm Wahlen Sie Daily ozone level Quantification TRA1_3 als y Achsen Variable aus und Day of the
46. 10 34 Transformationsdiagramm f r Binge eating Fre attacken Transformation Binge eating Kategoriale Hauptkomponentenanalyse Quantifizierungen a _ 1 2 Kategorien Ein interessanter Fall ergibt sich bei den Quantifizierungen f r Binge eating Fre attacken Die erzielte Transformation ist linear f r die Kategorien 1 bis 3 doch die quantifizierten Werte f r die Kategorien 3 und 4 sind gleich Dieses Ergebnis zeigt dass die Werte f r 3 und 4 zu keiner Unterscheidung zwischen den Patienten f hren und deutet darauf hin dass Sie das numerische Skalierungsniveau in einer Zwei Komponenten L sung verwenden k nnten indem Sie die Werte f r 4 als Werte f r 3 aufzeichnen Modell bersicht Abbildung 10 35 Modellzusammenfassung Modellzusammenfassung Varianz ber cksichtigt Cronbachs Gesamt Dimension Alpha Eigenwert 1 874 5 550 2 522 1 957 Gesamtwert 9252 7 508 a Die Summe von Cronbachs Alpha basiert auf der Summe der Eigenwerte Um zu sehen wie gut das Modell an die Daten angepa t ist untersuchen wir die Modellzusammenfassung Etwa 47 der gesamten Varianz wird durch das Zwei Komponenten Modell erkl rt 35 durch die erste Dimension und 12 durch die zweite Also wird fast die H lfte der Variabilit t auf der Ebene der einzelnen Objekte durch das Zwei Komponenten Modell erkl rt 178 Kapitel 10 Komponentenladungen Zu Beginn der Interpretation der beiden D
47. 2 Laugh e oC y Talk Elevator 0 Fight Jump Room i 0 o Sleep o Bus ln Belch Oo O Lounge Mumble Argue Read Restroom a f Write Class o 4 Church o Dimension 1 Die horizontale Dimension scheint enger mit den Spaltenobjekten Verhalten zusammenzuh ngen und unterscheidet zwischen unangemessenem Verhalten fighting belching und angemessenerem Verhalten Die vertikale Dimension scheint enger mit den Zeilenobjekten Situationen zusammenzuh ngen und gibt verschiedene Beschr nkungen zwischen Verhalten und Situation vor Am unteren Ende der vertikalen Dimension befinden sich Situationen church class in denen das Verhalten auf die ruhigeren introspektiven Verhaltensweisen read write beschr nkt ist Diese Verhaltensweisen sind daher auf der vertikalen Achse weiter unten zu finden Am oberen Ende der vertikalen Dimension befinden sich Situationen movies game date in denen das Verhalten auf die sozialen extrovertierten Verhaltensweisen eat kiss laugh beschr nkt ist Diese Verhaltensweisen sind daher auf der vertikalen Achse weiter oben zu finden In der Mitte der vertikalen Dimension werden Situationen in der horizontal Dimension entsprechend der allgemeinen Eingeschr nktheit der Situation unterteilt Die von den Verhaltensweise weiter entfernten interview sind am meisten eingeschr nkt w hrend die n her an den V
48. Arbeit Mittel bis gut Schulische berufliche abgebrochen Leistungen satt Sexual attitude Sexuelle Inadequate Adequate Angemessen Einstellung Unangemessen sbeh Sexual behavior Inadequate Can enjoy sex Kann Sex Sexualverhalten Unangemessen genie en mood Mental state mood Very depressed Sehr Normal Psychische Verfassung niedergeschlagen Stimmung preo Preoccupation with Complete Vollst ndig No preoccupation Keine food and weight Besch ftigung Besch ftigung mit Essen und Gewicht body Body perception Disturbed Gest rt Normal K rperwahrnehmung F r diese Situation ist die Hauptkomponentenanalyse ideal da der Zweck der Studie darin besteht die Beziehungen zwischen den Symptomen und den verschiedenen Klassen von E st rungen zu bestimmen Au erdem ist die kategoriale Hauptkomponentenanalyse wahrscheinlich n tzlicher als die klassische Hauptkomponentenanalyse da die Wertung f r die Symptome auf einer ordinalen Skala erfolgt Durchf hren der Analyse Um die Struktur des Krankheitsverlaufs f r die einzelnen Diagnosen ordnungsgem besser untersuchen zu k nnen sollten Sie die Ergebnisse der Tabelle der projizierten Zentroide als Daten f r Streudiagramme verf gbar machen Sie k nnen dies mithilfe des Ausgabeverwaltungssystems OMS erreichen gt Um eine OMS Anforderung zu starten w hlen Sie die folgenden Befehle aus den Men s aus Extras gt OMS Steuerung 164
49. Dadurch wird der Penalisierungsterm deaktiviert Klicken Sie auf Weiter Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf OK Im Folgenden finden Sie die durch diese Optionen generierte Befehlssyntax PREFSCAL VARIABLES TP BT EMM JD CT BMM HRB TMd BTJ TMn CB DP GD CC CMB INITIAL CLASSICAL SPEARMAN TRANSFORMATION NONE PROXIMITIES DISSIMILARITIES CRITERIA DIMENSIONS 2 2 DIFFSTRESS 000001 MINSTRESS 0001 MAXITER 5000 PENALTY LAMBDA 0 5 OMEGA 1 0 278 Kapitel 15 PRINT MEASURES COMMON PLOT COMMON m Die einzige nderung besteht im Unterbefehl PENALTY LAMBDA wurde auf 0 5 und OMEGA auf 1 0 die Standardwerte festgelegt Me werte GLM Repeated Measures Abbildung 15 6 Ma e f r nicht degenerierte L sung lterationen 157 Endg ltiger Funktionswert 6948930 Wertteile der Funktion Stressteil 2428268 Penalisierungsteil 9317409 Fehlende Anpassung Normalisierter Stress 0583589 Stress Inach Kruskal 2415758 Stress Il nach Kruskal 5875599 Stress nach Young 3446361 5 Stress Il nach Young 6030127 G te der Anpassung Erkl rte Streuung 9416411 Erkl rte Yarianz 7651552 Ermittelte 7818594 Bevorzungsordnungen Spearman Rho 8179181 Kendall Tau b 6916725 Variationskoeffizienten Variation der Ahnlichkeiten 5590170 Variation der transformierten 6006156 hnlichkeiten Variation der Distanzen 4833617 Indizes f r Quadrat
50. Diagramm Editor Was die Fre attacken betrifft so ist klar dass die anorektischen Gruppen andere Anfangswerte aufweisen als die bulimischen Gruppen Dieser Unterschied nimmt im Laufe der Zeit ab da sich die anorektischen Gruppen kaum ndern w hrend bei den bulimischen Gruppen ein Fortschritt zu verzeichnen ist 193 Kategoriale Hauptkomponentenanalyse Abbildung 10 51 Diagrammerstellung Variablen Diagrammvorschau verwendet Beispleidaten amp Table Number TableNu Be da Command_ a Subtype_ da Label_ da vart amp Centroids Projected on amp Centroids Projected on amp Centroids Projected on E time diagnosis E Category 1 E Category 2 Gam Rufen Sie die Diagrammerstellung erneut auf Heben Sie die Auswahl von Centroids Projected on Binge eating Zentroide auf Fre attacken projiziert als y Achsen Variable auf und w hlen Sie statt dessen Centroids Projected on Sexual attitude Zentroide auf sexuelle Einstellung projiziert als y Achsen Variable aus Klicken Sie auf OK 194 Kapitel 10 Abbildung 10 52 Auf Sexual attitude sexuelle Einstellung projizierte Zentroide des Diagnosezeitpunkts im Verlauf der Zeit E Diagramm Editor l I ole Datei Bearbeiten Ansicht Optionen Elemente Hilfe 0 IX Ye Mi nile Zee a9 w v 3 k 3 x w 7 c o o w o 2 o a u 3 o _ u c w H 376 5 B 470 2
51. Diagramme der Komponentenladungen Copyright SPSS Inc 1989 2010 28 29 Kategoriale Hauptkomponentenanalyse CATPCA Daten Werte von String Variablen werden immer in aufsteigender alphanumerischer Reihenfolge in positive Ganzzahlen umgewandelt Benutzerdefinierte und systemdefinierte fehlende Werte sowie Werte kleiner als 1 werden als fehlend betrachtet Sie k nnen die Daten umkodieren oder eine Konstante zu Variablen mit Werten kleiner als 1 addieren um die Werte als nichtfehlend zu deklarieren Annahmen Die Daten m ssen mindestens drei g ltige F lle enthalten Die Analyse basiert auf Daten die aus positiven ganzen Zahlen bestehen Mit der Option zur Diskretisierung werden Variablen mit Dezimalwerten automatisch kategorisiert indem die Werte in Kategorien gruppiert werden die nahezu normalverteilt sind und die Werte von String Variablen automatisch in positive Ganzzahlen umgewandelt Sie k nnen andere Diskretisierungsmethoden bestimmen Verwandte Prozeduren Eine Skalierung aller Variablen auf numerischem Niveau entspricht der normalen Hauptkomponentenanalyse Wenn Sie die transformierten Variablen in einer normalen linearen Hauptkomponentenanalyse verwenden stehen Ihnen andere Diagrammfunktionen zur Verf gung Wenn alle Variablen ein mehrfach nominales Skalierungsniveau besitzen ist die kategoriale Hauptkomponentenanalyse identisch mit der Mehrfachkorrespondenzanalyse Wenn Variablen Sets untersucht werden sollen verw
52. E F lle ausw hlen X rAusw hlen Thread thread Alle F lle 5 Head form head Indentation of head in er amp Bottom shape bottom amp Brass brass Zufallsstichprobe amp Length in half inches I Stichprobe amp object Nach Zeit oder Fallbereich Bereich J Fitervariable verwenden ME 22 rAusgabe Nicht ausgew hlte F lle filtern Ausgew hlte F lle in neues Datenblatt kopieren Datenblatt Name Nicht ausgew hlte F lle l schen Aktueller Status F lle nicht filtern gt Aktivieren Sie das Optionsfeld Falls Bedingung zutrifft Klicken Sie auf Falls 249 vv v y Abbildung 13 14 Dialogfeld Falls 6 Thread thread amp Head form head amp Bottom shape bottom amp Brass brass amp object Geben Sie object 16 als Bedingung ein Klicken Sie auf Weiter Klicken Sie im Dialogfeld F lle ausw hlen auf OK amp Indentation of head in amp Length in halt inches II Mehrfachkorrespondenzanalyse fa F lle ausw hlen Falls K Funktionsguppe Alle Arithmetisch Yerteilungsfunktionen Umwandlung Aktuelles Datumsaktuelle Uhr Funktionen und Sondervariablen Rufen Sie schlie lich das Dialogfeld Mehrfachkorrespondenzanalyse auf und klicken Sie auf OK Abbildung 13 15 Modellzusammenfassung nach der Entfernung des Ausrei ers Varianz ber
53. Eigenwert Tr gheit der Varianz 1 2 Gesamt Mittelwert a Der Mittelwert von Cronbachs Alpha basiert auf dem Mittelwert der Eigenwerte Fast die gesamte Varianz der Daten wird durch die L sung erkl rt 62 1 durch die erste Dimension und 36 8 durch die zweite Zusammen bieten die beiden Dimensionen eine Interpretation hinsichtlich der Distanzen Wenn Variablen gute Unterscheidungen bieten befinden sich die Objekte nahe bei den Kategorien zu denen sie geh ren Idealerweise befinden sich Objekte in derselben Kategorie nahe beieinander sie sollten also hnliche Bewertungen aufweisen und Kategorien mit unterschiedlichen Variablen befinden sich nahe beieinander wenn Sie zu denselben Objekten geh ren d h zwei Objekte die hnliche Werte f r eine bestimmte Variable aufweisen sollten auch hnliche Bewertungen f r die anderen Variablen in der L sung aufweisen Objektwerte Nach der Untersuchung der Modellzusammenfassung sollten Sie sich den Objektwerten zuwenden Sie k nnen eine oder mehrere Variablen f r die Beschriftung des Objektwertediagramms angeben Jede Beschriftungsvariable erzeugt ein separates Diagramm das mit den Werten dieser Variablen beschriftet ist Wir betrachten das Diagramm der Objektwerte das anhand der Variablen Objekt beschriftet ist Dies ist nur eine Fallidentifizierungsvariable die nicht bei Berechnungen verwendet wurde Die Distanz von einem Objekt bis zum Ursprung zeigt die Variati
54. Gegensatz zu den Regressionskoeffizienten definiert diese Messzahl die Wichtigkeit der Einflussgr en additiv Die Wichtigkeit einer Gruppe von Einflussgr en entspricht also der Summe der einzelnen Werte f r die Wichtigkeit dieser Einflussgr en Pratts Ma ist gleich dem Produkt des Regressionskoeffizienten und der Korrelation nullter Ordnung f r eine Einflussgr e Diese Produkte werden zu R addiert und anschlie end durch R dividiert dies ergibt die Summe 1 Die Gruppe der Einflussgr en Package design und Brand name besitzt beispielsweise eine Wichtigkeit von 0 654 Die h chste Wichtigkeit liegt bei Package design vor Package design 117 Kategoriale Regression Price und Good Housekeeping seal tragen 95 der Wichtigkeit in dieser Kombination von Einflussgr en bei Multi Kollinearit t Hohe Korrelationen zwischen Einflussgr en f hren zu einer drastisch niedrigeren Stabilit t des Regressionsmodells Die korrelierten Einflussgr en resultieren in instabilen Parametersch tzungen Die Toleranz gibt wieder inwieweit ein linearer Zusammenhang zwischen den unabh ngigen Variablen besteht Diese Messzahl ist der Anteil an der Varianz einer Variablen der durch die anderen unabh ngigen Variablen in der Gleichung nicht erkl rt wird Falls die anderen Einflussgr en einen gro en Teil der Varianz einer Einflussgr e erkl ren k nnen wird diese Einflussgr e im Modell nicht ben tigt Ein Toleranzwert nahe 1 bede
55. Kapitel 15 MAXITER 5000 PENALTY LAMBDA 0 5 OMEGA 1 0 PRINT MEASURES COMMON PLOT COMMON WEIGHTS INDIVIDUAL ALL m Mit dieser Syntax wird eine Analyse der Variablen tp Toast pop up bis cmb Corn muffin and butter angegeben Mit der Variablen srcid werden die Quellen identifiziert m Der Unterbefehl INITIAL gibt an dass die Startwerte mithilfe der Spearman Distanzen festgelegt werden sollen m Der Unterbefehl MODEL gibt ein gewichtetes euklidisches Modell an bei dem in jedem individuellen Raum die Dimensionen des gemeinsamen Raums unterschiedlich gewichtet werden k nnen m Mit dem Unterbefehl PLOT werden Diagramme des gemeinsamen Raums individuelle R ume und individuelle Raumgewichtungen angefordert m F r alle anderen Parameter gelten die Standardwerte Me werte GLM Repeated Measures Abbildung 15 12 Me werte GLM Repeated Measures lterationen 481 Endg ltiger Funktionswert 8199642 Wertteile der Funktion Stressteil 3680994 Penalisierungsteil 1 8265211 Fehlende Anpassung Normalisierter Stress 1335343 Stress Inach Kruskal 3654234 Stress Il nach Kruskal 9780824 Stress nach Young 4938016 5 Stress Il nach Young 6912352 Gite der Anpassung Erklarte Streuung Erklarte Varianz Ermittelte 024853 Bevorzungsordnungen 7025321 Spearman Rho 6271702 Kendall Tau b 4991188 Variationskoeffizienten Variation der hnlichkeiten 5590170 Variation der transformierten Ahnlichkeiten Variation
56. Kategoriale Regression 114 Komponentenladungen in der Kategorialen Hauptkomponentenanalyse 37 158 161 178 in Nichtlineare kanonische Korrelationsanalyse 48 210 Komponentenladungsdiagramme in der Kategorialen Hauptkomponentenanalyse 42 Konfidenzstatistik in der Korrespondenzanalyse 56 Korrelationen in Multidimensionale Skalierung 86 Korrelationen nullter Ordnung in Kategoriale Regression 115 Korrelationsdiagramme in Multidimensionale Skalierung 84 Korrelationsmatrix bei der Mehrfachkorrespondenzanalyse 67 in der Kategorialen Hauptkomponentenanalyse 37 Korrespondenzanalyse 51 53 54 56 57 223 225 Beitr ge 230 Dimensionen 229 Grafik 51 Normalisierung 224 Spaltenwertdiagramme 232 Statistik 51 Zeilenwertdiagramme 232 zus tzliche Funktionen beim Befehl 59 Lasso in Kategoriale Regression 23 legal notices 319 Mehrfachkorrespondenzanalyse 60 65 236 Ausrei er 248 Diskriminationsma e 242 Kategorienquantifikationen 243 Messniveau der optimalen Skalierung 62 Modellzusammenfassung 240 Objektwerte 241 245 Variablen speichern 69 zus tzliche Funktionen beim Befehl 72 Messniveau der optimalen Skalierung bei der Mehrfachkorrespondenzanalyse 62 in der Kategorialen Hauptkomponentenanalyse 30 Modellzusammenfassung bei der Mehrfachkorrespondenzanalyse 240 329 Multidimensionale Entfaltung 89 272 295 hnlichkeitstransformationen 302 306 Ausgabe 97 degenerierte L su
57. Kategorie schlie lich die h chste Quantifikation Die Variable wird zwar als nominal skaliert die Reihenfolge der Kategorien wird jedoch in den Quantifikationen beibehalten Abbildung 11 19 Transformationsdiagramm f r Newspaper read most often nominal I 1 0 g Qa Qa uw 3 0 5 z 5 gt g c oS 0 0 ot Bo xE ETU o5 2 S amp S c o s E 2 1 0 i o D a u uci x None Telegraaf Volkskrant NRC Other Newspaper read most often Abbildung 11 20 Transformationsdiagramm f r Age in years ordinal 21 1 871 Kategorienquantifikationen von Age in years oO a 1 70 ui 20 25 26 30 31 35 36 40 41 45 46 50 51 55 56 60 61 65 66 70 Age in years Das Transformationsdiagramm f r Age in years zeigt eine S f rmige Kurve Die vier beobachteten Kategorien mit dem niedrigsten Alter erhalten jeweils dieselbe negative Quantifikation die beiden Kategorien mit dem h chsten Alter dagegen hnliche positive Werte In diesem Fall k nnten die niedrigeren Altersgruppen in einer gemeinsamen Kategorie z B unter 50 und die 213 Nichtlineare kanonische Korrelationsanalyse beiden h heren Altersgruppen in einer zweiten Kategorie zusammengefasst werden Die genaue bereinstimmung der Quantifikationen f r die niedrigeren Altersgruppen weist jedoch darauf hin dass eine Einschr nkung der Quantifikationen auf die Reihenfolge der urspr nglichen Kategorien ggf nicht empfe
58. Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Kategoriale Regression auf Diagramme 113 Kategoriale Regression Abbildung 9 15 Dialogfeld Diagramme EH Kategoriale Regression Diagramme M Transformationsdiagramme Residuen Diagramme Legen Sie fest dass Transformationsdiagramme f r Package design und Price angelegt werden sollen Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Regression auf OK Interkorrelationen ber die Interkorrelationen zwischen den Einflussgr en wird die Multi Kollinearit t in der Regression ersichtlich Hoch korrelierte Variablen f hren zu instabilen Regressionssch tzungen Durch die hohe Korrelation w rde das Auslassen einer dieser Variablen aus dem Modell die Vorhersage jedoch nur minimal beeinflussen Die Varianz in der Antwort die sich aus der ausgelassenen Variablen ergibt kann durch die verbleibende korrelierte Variable erkl rt werden Korrelationen nullter Ordnung sind allerdings empfindlich gegen ber Ausrei ern Auch die Multi Kollinearit t aufgrund einer hohen Korrelation zwischen einer Einflussgr e und einer Kombination anderer Einflussgr en kann nicht erkannt werden 114 Kapitel 9 Abbildung 9 16 Korrelationen der urspr nglichen Einflussgr en Good Package Housekee Money back design Brand name Price ping seal guarantee Package design Brand name Price Good Housekeeping seal
59. N Yariablenansicht Die Variablen Bingeeating Sexualattitude und Preoccupationwithfoodandweight enthalten die Werte der Zentroide die auf die einzelnen relevanten Symptome projiziert wurden Die Fallnummer 1 bis 16 entspricht Time diagnosis interaction Zeit Diagnose Interaktion Sie m ssen neue Variablen berechnen die die Zeit und Diagnosewerte trennen W hlen Sie die folgenden Befehle aus den Men s aus Transformieren gt Variable berechnen 188 Kapitel 10 Abbildung 10 46 Dialogfeld Variable berechnen Zielvariable Numerischer Ausdruck trunc casenum 1 4 1 da ormand Funktionsguppe da Subtype_ da Label_ E Ale da Yari Arithmetisch E Centroids Projected on Yerteilungsfunktionen E Centroids Projected on Umwandlung Centroids Projected on ne Aktuelles Datum aktuelle Uhr Funktionen und Sondervariablen Eais rtionaie Fallauswahlbedingung gt Geben Sie time als Zielvariable ein gt Geben Sie trunc casenum 1 4 1 als numerischen Ausdruck ein gt Klicken Sie auf OK 189 Kategoriale Hauptkomponentenanalyse Abbildung 10 47 Dialogfeld Variable berechnen Zielvariable Numerischer amp usdruck modtScasenum t 4 1 amp Table Number TableNu da Command_ Funkdi amp a i unktionsquppe da Label_ f is ot a Vard x Arithmetisch amp Centroids Projected on Yerteilungsfunktionen amp
60. O Newspaper read Single most often e Telegraaf 66 70 no Music preferred Neighborhood q O preference Dimension 2 oO oO 054 Volkskrant NRC Married 5p 60 Country O cat s Classical 2 1 0 1 n Dimension 1 215 Nichtlineare kanonische Korrelationsanalyse Wenn Sie Diagramme der Zentroide anfordern werden auch Diagramme mit einzelnen Zentroiden und mit projizierten Zentroiden f r jede Variable erstellt und jeweils mit den Wertelabels beschriftet Die projizierten Zentroide befinden sich auf einer Linie im Objektraum Abbildung 11 23 Zentroide und projizierte Zentroide fur Newspaper read most often Zentroide ja Telegraaf O Projektiert o O Tats chlich 0 4 Telegraaf N c 02 n 5 Other Other E 0 0 d A None None 0 2 0 4 0 5 00 05 10 Dimension 1 Die eigentlichen Zentroide werden auf die Vektoren projiziert die durch die Komponentenladungen definiert sind Diese Vektoren wurden in die Diagramme der Zentroide aufgenommen um so leichter zwischen den projizierten Zentroiden und den eigentlichen Zentroiden unterscheiden zu k nnen Die projizierten Zentroide fallen in einen von vier Quadranten die aus der Verl ngerung zweier lotrechter Referenzlinien durch den Urspung gebildet werden Die Interpretation der Richtung von einzeln nominalen ordinalen oder numerischen Variablen ergibt sich aus der Position der projizierten Zentroide Beispiel Die Variable New
61. Skalierungsniveau k nnen Sie die gew nschte Anzahl von Dimensionen angeben Pro Dimension wird ein Diagramm erstellt Sie k nnen au erdem festlegen dass f r jede ausgew hlte Variable ein Diagramm der Residuen ausgegeben wird 42 Kapitel 3 Zentroide projizieren von Sie k nnen eine Variable ausw hlen und ihre Zentroide auf ausgew hlte Variablen projizieren Es kann jedoch nicht auf Variablen mit mehrfach nominalem Skalierungsniveau projiziert werden Wenn dieses Diagramm angefordert wird wird au erdem eine Tabelle mit den Koordinaten der projizierten Zentroiden ausgegeben Kategoriale Hauptkomponentenanalyse Ladungsdiagramme Im Dialogfeld Ladungsdiagramme k nnen Sie die Variablen angeben die in das Diagramm aufgenommen werden sollen und festlegen ob Zentroide darin aufgenommen werden sollen Abbildung 3 11 Dialogfeld Ladungsdiagramme Ei Kategoriale Hauptkomponenten Ladungsdiagramme Fi Komponentenladungen anzeigen rLadungsvariablen Verf gbar Ausgew hlt EinschlieBen O Alle Variablen Ausgew hlte Variablen E Zentroide einschlie en Era ee Komponentenladungen anzeigen Bei Auswahl dieser Option wird ein Diagramm der Komponentenladungen angezeigt Ladungsvariablen Das Komponentenladungsdiagramm kann auf allen Variablen oder einer Teilmenge der Variablen basieren Zentroide einschlie en Bei Variablen mit mehrfach nominalem Skalierungsniveau s
62. Standardabweichung f r Preference ist 6 44 Preference steigt somit um 0 056 x 6 44 0 361 nderungen an Package design bewirken die gr ten nderungen bei der vorhergesagten Bevorzugung Residuen Streudiagramme Abbildung 9 6 Residuen im Vergleich zu vorhergesagten Werten Abh ngige Variable Preference E 5 o o ao x o o ce a n o o g o o P so s o a o o 3 o S a 7 o o0 c 2 Du a o 2 o D a a T T T T 2 1 0 1 2 Regression Standardisierter gesch tzter Wert Die standardisierten Residuen werden anhand der standardisierten vorhergesagten Werte geplottet Bei einer hohen Anpassungsg te des Modells sollten keine Muster entstehen Hier ist eine U Form sichtbar bei der sowohl hohe als auch niedrige standardisierte vorhergesagte Werte positive Residuen besitzen Die standardisierten vorhergesagten Werte nahe 0 weisen eher negative Werte auf Zum Erstellen eines Streudiagramms der Residuen nach der Einflussgr e Package design w hlen Sie die folgenden Befehle aus den Men s aus Grafiken gt Diagrammerstellung 107 Kategoriale Regression Abbildung 9 7 Diagrammerstellung Variablen Diagrammvorschau verwendet Beispieidaten amp Package design packa amp Brand name brand amp Price price amp Good Housekeeping amp Money back guarantee ail Preference pref E Standardized Residual Wahlen Sie die GalerieStreu Punktdiagramm aus und wahlen
63. Stress Il nach Young Erklarte Streuung Erklarte Varianz Ermittelte Bevorzungsordnungen Spearman Rho Kendall Tau b Variation der hnlichkeiten Variation der transformierten Ahnlichkeiten Variation der Distanzen Quadratsumme von DeSarbos Indizes f r Vermischung Shepards Index f r Nicht Degeneration 268 6044671 1747239 2 0911875 0305285 1747239 4444641 2707147 3978003 9694715 6454483 8574206 9032676 7532788 5138436 4930018 4284849 3610680 7469043 Der Algorithmus konvergiert nach 268 Iterationen bei einem endgiiltigen penalisierten Stress von 0 6044671 Diese Statistik und die anderen Ma e sind f r diese L sung etwas besser geeignet als die entsprechenden Werte bei einer linearen Transformation der Ahnlichkeiten 305 Multidimensionale Entfaltung Gemeinsamer Raum Abbildung 15 33 Verbundenes Diagramm des gemeinsamen Raums f r eine L sung mit ordinaler Transformation 150 100 MoviesO Eat o Dinner 50 o Date Shout Game Baro Sidewalk Interview Ofi O Opak Fight Kiss Laugh OTalk Elevator o Run Jump Restroom Belch CYO Room BE Lounge Sleep O o fe Argue Mumble amp Class Read Write o Dimension 2 o o Bus Church 150 150 100 50 0 50 100 150 Dimension 1 Die Interpretation des gemeinsamen Raums ist bei beiden L sungen identisch M glicherweise weist diese L sung mit ordinaler Transformation relativ geringere
64. Verwenden Sie diese Normalisierungsmethode wenn Sie haupts chlich an den Beziehungen zwischen den Objekten und den Variablen interessiert sind m Unabh ngig Verwenden Sie diese Normalisierungsmethode wenn Sie die Distanzen zwischen den Objekten und die Korrelationen zwischen den Variablen getrennt untersuchen m chten m Benutzerdefiniert Sie k nnen einen beliebigen reellen Wert aus dem abgeschlossenen Intervall 1 1 eingeben Der Wert 1 entspricht der Methode Objektprinzipal der Wert 0 der Methode Symmetrisch und der Wert 1 der Methode Variablenprinzipal Bei Werten gr er als 1 und kleiner als 1 wird der Eigenwert sowohl ber Objekte als auch Variablen gestreut Mit dieser Methode k nnen Sie Biplots und Triplots genau an Ihre Bed rfnisse anpassen Kriterien Sie k nnen die maximale Anzahl von Iterationen festlegen die in der Prozedur bei den Berechnungen durchlaufen werden Au erdem k nnen Sie einen Wert f r das Konvergenzkriterium ausw hlen Die Prozedur wird abgebrochen wenn die Differenz der Gesamtanpassung zwischen den letzten zwei Iterationen kleiner als der Konvergenzwert ist oder die Maximalzahl von Iterationen erreicht wurde Diagramme beschriften mit Hiermit k nnen Sie festlegen ob in den Diagrammen Variablen und Wertlabels oder Variablennamen und Werte verwendet werden sollen Sie k nnen auch eine H chstl nge f r die Beschriftungen festlegen Diagrammdimensionen Hiermit legen Sie
65. Vol V P R Krishnaiah Hg Amsterdam North Holland Heiser W J 1981 Unfolding analysis of proximity data Leiden Department of Data Theory Universitat Leiden 271 Multidimensionale Skalierung Heiser W J als auch F M T A Busing 2004 Multidimensional scaling and unfolding of symmetric and asymmetric proximity relations In Handbook of Quantitative Methodology for the Social Sciences D Kaplan Hg Thousand Oaks Kalifornien Sage Publications Inc Kruskal J B 1964 Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis Psychometrika 29 Kruskal J B 1964 Nonmetric multidimensional scaling A numerical method Psychometrika 29 Shepard R N 1962 The analysis of proximities Multidimensional scaling with an unknown distance function I Psychometrika 27 Shepard R N 1962 The analysis of proximities Multidimensional scaling with an unknown distance function II Psychometrika 27 Kapitel Multidimensionale Entfaltung In der Prozedur Multidimensionale Entfaltung wird versucht eine gemeinsame quantitative Skala zu finden mit der Sie die Beziehung zwischen zwei Gruppen von Objekten visuell untersuchen k nnen Beispiel Bevorzugte Fr hst cksartikel In einer klassischen Studie Green als auch Rao 1972 wurden 21 MBA Studenten der Wharton School mit ihren Lebensgef hrten darum gebeten 15 Fr hst cksartikel in der Vorzugsreihenfolge von
66. angegeben werden sollte Sie k nnen die Daten so analysieren wie es sinnvoll erscheint und die Interpretation erleichtert Bei der Analyse einer Variablen mit eigentlich numerischem Niveau auf dem ordinalen Niveau kann durch die Verwendung einer nichtlinearen Transformation eine L sung in weniger Dimensionen m glich sein Die folgenden zwei Beispiele zeigen dass das naheliegendste Messniveau nicht unbedingt das beste Niveau f r die optimale Skalierung sein muss Angenommen eine Variable ordnet Objekte in Altersgruppen ein Alter kann zwar als numerische Variable skaliert werden aber dennoch steht Sicherheit f r Personen unter 25 Jahren m glicherweise in einer positiven Relation zum Alter wohingegen sie f r Personen ber 60 Jahren in einer negativen Relation zum Alter steht In diesem Fall kann es besser sein das Alter als nominale Variable zu behandeln Zweites Beispiel Eine Variable die Personen nach politischen Neigungen ordnet scheint ihrem Wesen nach nominal zu sein Wenn Sie jedoch die Parteien von politisch links nach politisch rechts sortieren w re es sinnvoll wenn die Quantifizierung der Parteien diese Reihenfolge ber cksichtigen w rde Dazu m te ein ordinales Niveau f r die Analyse verwendet werden Auch wenn es keine vordefinierten Eigenschaften gibt die eine Variable ausschlie lich einem bestimmten Messniveau zuordnen gibt es einige allgemeine Richtlinien nach denen sich unerfahrene Benutzer richten k nnen Bei ei
67. aus den quadrierten Differenzen von Zeilen und Spaltenpaaren Standardisierungsmethode W hlen Sie eine der folgenden Optionen Zeilen und Spaltenmittel werden entfernt Sowohl Zeilen als auch Spalten werden zentriert Diese Methode ist f r die Standard Korrespondenzanalyse erforderlich m Zeilenmittel werden entfernt Nur die Zeilen werden zentriert Spaltenmittel werden entfernt Nur die Spalten werden zentriert 56 Kapitel 5 Zeilensummen werden angeglichen und Mittelwerte entfernt Vor dem Zentrieren der Zeilen werden die Zeilenr nder angeglichen Spaltensummen werden angeglichen und Mittelwerte entfernt Vor dem Zentrieren der Spalten werden die Spaltenr nder angeglichen Normalisierungsmethode W hlen Sie eine der folgenden Optionen Symmetrisch F r jede Dimension sind die Zeilenwerte der gewichtete Durchschnitt der Spaltenwerte geteilt durch den entsprechenden Singul rwert und die Spaltenwerte sind der gewichtete Durchschnitt der Zeilenwerte geteilt durch den entsprechenden Singul rwert Verwenden Sie diese Methode wenn Sie die Unterschiede oder hnlichkeiten zwischen Kategorien der beiden Variablen untersuchen m chten Prinzipal Die Distanzen zwischen Zeilenpunkten und Spaltenpunkten sind Approximationen der Distanzen in der Korrespondenztabelle entsprechend dem gew hlten Distanzma Verwenden Sie diese Methode wenn Sie die Unterschiede zwischen Kategorien jeder einzelnen Variablen oder beider Variabl
68. ausw hlen m Ordinal Bei der beobachteten Variablen wird die Reihenfolge der Kategorien bei der quantifizierten Variablen beibehalten m Einzeln nominal Bei der quantifizierten Variablen erhalten Objekte der gleichen Kategorie den gleichen Wert m Mehrfach nominal Die Quantifikationen k nnen bei den einzelnen Dimensionen unterschiedlich sein m Diskret numerisch Die Kategorien werden als geordnet mit gleichen Abst nden behandelt Die Unterschiede zwischen den Kategorienummern und die Reihenfolge der Kategorien der beobachteten Variablen bleiben bei der quantifizierten Variablen erhalten 48 Kapitel 4 Bereich definieren Probit Analysis MANOVA Abbildung 4 4 Dialogfeld Bereich definieren fF OVERALS Bereich definieren Minimum 1 Maximum C C eten te Sie m ssen f r jede Variable einen Bereich definieren Der angegebene H chstwert muss eine Ganzzahl sein Gebrochene Datenwerte werden in der Analyse abgeschnitten Ein Kategoriewert der au erhalb des angegebenen Bereiches liegt wird in der Analyse ignoriert Um eine m glichst kleine Ausgabe zu erzielen erstellen Sie mithilfe der Funktion Automatisch umkodieren verf gbar im Men Transformieren aufeinander folgende Kategorien die mit 1 beginnen Ferner m ssen Sie einen Bereich f r jede Variable definieren mit deren Hilfe die Diagramme der Objektwerte beschriftet werden Beschriftungen f r Kategorien mit Datenwerten die au
69. der Distanzen 4484515 Indizes f r Quadratsumme von Degeneration DeSarbos Indizes f r Vermischung 2199287 Shepards Index f r Nicht Degeneration 7643613 8664657 6378878 285 Multidimensionale Entfaltung Der Algorithmus konvergiert nach 481 Iterationen bei einem endg ltigen penalisierten Stress von 0 8199642 Die Variationskoeffizienten und Shepards Index sind ausreichend gro und die Indizes nach DeSarbo ausreichend klein um den Schluss zuzulassen dass keine Degenerationsprobleme vorliegen Gemeinsamer Raum Abbildung 15 13 Verbundenes Diagramm des gemeinsamen Raums n 25 Jelly donut 26 30 14 Cinnamon bun 1 a een 135 0880 081596 100 821720 3g o Glazed donut 28 o 34 8 O Danish pastry ured 3318 N 53 160 2238 31 Coffeecake 4 0 2 22 5 Blueberry muffin and margarine O36 19 u Mo 24 42 o 27 Buttered toast and jelly 21 39 o English muffinand margarine o 1 cor Oo a muffin and b tter O Toast and marmalade o O Buttered toast 40 gt a Toastand margarine Toast ae DR 2 11 832 o Hard rolls and butter 37 2 1 0 1 N Dimension 1 Das verbundene Diagramm des gemeinsamen Raums zeigt eine endg ltige Konfiguration die der Zwei Weg Analyse der allgemeinen Bevorzugung stark hnelt wobei die L sung an der 45 Grad Achse gespiegelt ist Daher scheint nun die vertikale Dimension eine Unterscheidung zwischen weichem und harten Brot oder Toast aufzuweisen wobei die Artike
70. der ersten Stichprobenaufteilung das zweite Modell auf allen F llen mit Ausnahme der F lle in der zweiten Stichprobenaufteilung usw Bei jedem Modell wird jeweils der Vorhersagefehler gesch tzt Hierzu wird das Modell auf die Teilstichprobe angewendet die beim Erstellen des Modells ausgeschlossen war 632 Bootstrap Mit Bootstrap werden Beobachtungen zuf llig aus den Daten mit Zur cklegen gezogen Dieser Vorgang wird mehrmals wiederholt um eine Reihe von Bootstrap Stichproben zu bekommen Ein Modell eignet sich f r jede Bootstrap Stichprobe und der Vorhersagefehler f r jedes Modell wird durch sein angepasstes Modell gesch tzt und dann auf die F lle angewendet die sich nicht in der Bootstrap Stichprobe befinden Kategorienquantifikationen Tabellen mit den transformierten Werten der gew hlten Variablen werden angezeigt Deskriptive Statistiken Tabellen mit den H ufigkeiten fehlenden Werten und Modalwerten der gew hlten Variablen werden angezeigt 26 Kapitel 2 Kategoriale Regression Speichern Im Dialogfeld Speichern k nnen Sie festlegen dass die vorhergesagten Werte Residuen und transformierten Werte in der Arbeitsdatei gespeichert werden Au erdem k nnen die diskretisierten Daten die transformierten Werte die geregelten Modelle und die Koeffizienten und Vorzeichen der Regressionskoeffizienten in einer IBM SPSS Statistics Datendatei oder einem Daten Set gespeichert werden m Daten Sets sind in der akt
71. der unabh ngigen Variablen ein Stress f r Zufallstarts Zeigt den Startwert f r Zufallszahlen und den normalisierten Roh Stress Wert f r jeden Zufallsstart an Iterationsprotokoll Zeigt das Iterationsprotokoll des Hauptalgorithmus an Multiple Stressma e Zeigt verschiedene Stress Werte an Die Tabelle enth lt Werte f r normalisierten Roh Stress Stress I Stress II S Stress erkl rte Streuung und den Kongruenzkoeffizienten nach Tucker 88 Kapitel 7 Stress Zerlegung Zeigt eine Objekte und Quellenzerlegung des endg ltigen normalisierten Roh Stress einschlie lich des Durchschnitts pro Objekt und des Durchschnitts pro Quelle an Transformierte unabh ngige Variablen Wenn eine Einschr nkung der linearen Kombination ausgew hlt wurde werden die transformierten unabh ngigen Variablen und die entsprechenden Regressionsgewichtungen angezeigt Variablen und Dimensionskorrelationen Wenn eine Einschr nkung der linearen Kombination ausgew hlt wurde werden die Korrelationen zwischen den unabh ngigen Variablen und den Dimensionen des gemeinsamen Raums angezeigt In neuer Datei speichern Sie k nnen die Koordinaten des gemeinsamen Raums die individuellen Raumgewichtungen die Distanzen die transformierten hnlichkeiten und die transformierten unabh ngigen Variablen in eigenen IBM SPSS Statistics Datendateien speichern Zus tzliche Funktionen beim Befehl PROXSCAL Sie k nnen die kategoriale Hauptkomponentenanal
72. des Krankheitsverlaufs f r die verschiedenen Gruppen im Laufe der Zeit m glich Die Variable erhielt ein mehrfach nominales Skalierungsniveau Die Kategoriepunkte werden in der folgenden Abbildung angezeigt Abbildung 10 39 Kategoriepunkte f r Time diagnosis interaction Zeit Diagnose Interaktion 15 o1 10 BE 05 4 N 5 Bog 013 u oo 12 3 o a 016 10 05 0615 14o 011 104 02 03 Dimension 1 Ein Teil der Struktur ist aus diesem Diagramm ersichtlich Die Diagnosekategorien bei Zeitpunkt 1 trennen in der zweiten Dimension klar Anorexia nervosa und atypische E st rung von Anorexia nervosa mit Bulimia nervosa und Bulimia nervosa nach Anorexia nervosa Danach ist es etwas schwieriger die Muster zu sehen 182 Kapitel 10 Sie k nnen die Muster jedoch einfacher sichtbar machen indem Sie ein Streudiagramm auf der Grundlage der Quantifizierungen erstellen W hlen Sie hierzu die folgenden Befehle aus den Men s aus Diagramme gt Diagrammerstellung Abbildung 10 40 Galerie Streu Punktdiagramm Yariablen Diagrammvorschau verwendet Beispieldaten a Customer ID custid amp Geographic indicato dij Size of hometown p Sender gender Ziehen Sie ein Galeriediagramm als Ausgangspunkt 2 Age in years age hierher ofl Age category agec da Eirth month kirthmo Years of education Klicken Sie auf die Registerkarte Grundelemente al Level of education um ein
73. die Berechnung 1 Verlust pro Set Aufteilen der Anpassung und der Verluste Der Verlust in den einzelnen Sets wird bei der nichtlinearen kanonischen Korrelationsanalyse auf verschiedene Weise aufgeteilt Die Anpassungstabelle enthalt die Tabellen fiir Mehrfachanpassung Einzelanpassung und Einzelverlust die durch die nichtlineare kanonische Korrelationsanalyse fiir die Beispieluntersuchung erzeugt wurden Beachten Sie Die Mehrfachanpassung minus die Einzelanpassung ergibt den Einzelverlust Abbildung 11 16 Aufteilen der Anpassung und der Verluste Mehrfachanpassung Einzelne Anpassung Einzelne Verlustfunktion Dimension Dimension Dimension Summe 1 2 Summe 1 Summe Age in years4 Marital status Pets owned Newspaper read most often Music preferred Neighborhood preference a Optimales Skalierungsniveau Ordinal b Optimales Skalierungsniveau Einfach nominal Optimales Skalierungsniveau mehrfach nominal Der Einzelverlust zeigt den Verlust der sich aus dem Einschr nken der Variablen auf eine einzige Quantifikationsgruppe ergibt also einzeln nominal ordinal oder numerisch Liegt ein hoher Einzelverlust vor sollten die Variablen eher als mehrfach nominal behandelt werden In diesem Beispiel sind die Einzelanpassung und die Mehrfachanpassung jedoch nahezu identisch die Mehrfachkoordinaten liegen also nahezu auf einer geraden Linie in der Richtung die durch die Gewichtungen vorgegeben ist Die Mehrf
74. einen Teil der Variation bei der Einflussgr e oder der Antwort erkl ren k nnen erhalten Sie einen besseren Einblick inwieweit die Einflussgr e ihren Zweck erf llt 116 Kapitel 9 Abbildung 9 20 Korrelationen nullter Ordnung Teilkorrelationen und partielle Korrelationen transformierte Variablen Korrelationen Toleranz Nach Vor Nullte Transfor Transfor Ordnung Partiell Wichtigkeit mation mation Package design Brand name Price Good Housekeeping seal Money back guarantee Abh ngige Yariable Preference Andere Variablen im Modell k nnen die Wichtigkeit einer gegebenen Einflussgr e bei der Vorhersage der Antwort durcheinanderbringen Der partielle Korrelationskoeffizient beseitigt die linearen Auswirkungen anderer Einflussgr en sowohl aus der Einflussgr e als auch aus der Antwort Diese Messzahl entspricht der Korrelation zwischen den Residuen aus der Regression der Einflussgr en ber die anderen Einflussgr en und den Residuen aus der Regression der Antwort ber die anderen Einflussgr en Die quadrierte partielle Korrelation entspricht dem Anteil an der Varianz der relativ zur residuellen Varianz der Antwort erkl rt werden kann die wiederum nach dem Beseitigen der Auswirkungen auf die anderen Variablen verbleibt Beispiel Package design weist eine partielle Korrelation von 0 955 auf Werden die Auswirkungen der anderen Variablen entfernt erkl rt Package design 0 955 0 91 91 de
75. eines neuen DVD Spielers geht Mithilfe eines Prototyps hat das Marketing Team Zielgruppendaten erfasst Jeder Fall entspricht einem befragten Benutzer und enth lt demografische Daten zu dem Benutzer sowie dessen Antworten auf Fragen zum Prototyp german_credit sav Diese Daten sind aus dem Daten Set German credit im Repository of Machine Learning Databases Blake als auch Merz 1998 an der Universit t von Kalifornien in Irvine entnommen 312 Anhang A m grocery_1month sav Bei dieser hypothetischen Datendatei handelt es sich um die Datendatei grocery_coupons sav wobei die w chentlichen Eink ufe zusammengefasst sind sodass jeder Fall einem anderen Kunden entspricht Dadurch entfallen einige der Variablen die w chentlichen nderungen unterworfen waren und der verzeichnete ausgegebene Betrag ist nun die Summe der Betr ge die in den vier Wochen der Studie ausgegeben wurden grocery_coupons sav Hierbei handelt es sich um eine hypothetische Datendatei die Umfragedaten enth lt die von einer Lebensmittelkette erfasst wurden die sich f r die Kaufgewohnheiten ihrer Kunden interessiert Jeder Kunde wird ber vier Wochen beobachtet und jeder Fall entspricht einer Kundenwoche und enth lt Informationen zu den Gesch ften in denen der Kunde einkauft sowie zu anderen Merkmalen beispielsweise welcher Betrag in der betreffenden Woche f r Lebensmittel ausgegeben wurde guttman sav Bell Bell 1961 legte eine Tabelle zur
76. entztindungshemmendes Medikament zur Schmerzbehandlung bei chronischer Arthritis Von besonderem Interesse ist die Zeitdauer bis die Wirkung des Medikaments einsetzt und wie es im Vergleich mit bestehenden Medikamenten abschneidet patient_los sav Diese hypothetische Datendatei enth lt die Behandlungsaufzeichnungen zu Patienten die wegen des Verdachts auf Herzinfarkt in das Krankenhaus eingeliefert wurden Jeder Fall entspricht einem Patienten und enth lt diverse Variablen in Bezug auf den Krankenhausaufenthalt 314 Anhang A patlos_sample sav Diese hypothetische Datendatei enth lt die Behandlungsaufzeichnungen f r eine Stichprobe von Patienten denen w hrend der Behandlung eines Herzinfarkts Thrombolytika verabreicht wurden Jeder Fall entspricht einem Patienten und enth lt diverse Variablen in Bezug auf den Krankenhausaufenthalt polishing sav Hierbei handelt es sich um die Datendatei Nambeware Polishing Times aus der Data and Story Library Sie bezieht sich auf die Bem hungen eines Herstellers von Metallgeschirr Nambe Mills Santa Fe New Mexico zur zeitlichen Planung seiner Produktion Jeder Fall entspricht einem anderen Artikel in der Produktpalette F r jeden Artikel sind Durchmesser Polierzeit Preis und Produkttyp erfasst poll_cs sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um Bem hungen geht die ffentliche Unterst tzung f r einen Gesetzentwurf zu ermitteln bevor er im Parlam
77. erneut das Dialogfeld Korrespondenzanalyse und klicken Sie auf Modell W hlen Sie Symmetrisch als Normalisierungsmethode Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Korrespondenzanalyse auf OK Aus dem oberen linken Bereich des Biplot geht die Marke EE als einzige starke Marke f r die Arbeiterklasse hervor die zudem f r M nner ansprechend ist Die Marke AA ist die popul rste Marke und gilt au erdem als Marke mit dem h chsten Koffeingehalt Zu den s en dick 235 Korrespondenzanalyse machenden Marken z hlen die Marken BB und FF Die Marken CC und DD werden zwar als neu und gesund empfunden sind jedoch auch die unpopul rsten Marken Abbildung 12 13 Biplot der Marken und Attribute symmetrische Normalisierung O image pacer O marke M nner o 4 EEO Arbeit N o E pur o en oa A en a offein ap 2 o WARG bars 00 u Popul r maeh oo gesund E e oo aniv OO cc Aachen h sslich Frauen BB O g Yuppies pregjum OKinder 1 traditionel 00 O FF s ss Dimension 1 Zur weiteren Interpretation k nnen Sie eine Linie durch den Ursprung und die beiden Image Attribute M nner und Yuppies ziehen und dann die Marken auf diese Linie projizieren Die beiden Attribute stehen einander gegen ber Dies bedeutet dass das Assoziationsmuster der Marken f r M nner dem Muster f r Yuppies entgegen l uft M nner werden also am h ufigsten mit der Marke EE und am wenigsten h u
78. fehlenden VVerten f r diese Variable ausschlie en ver asreehen tens Strategie Fehlende Werte k nnen ausgeschlossen Passivbehandlung oder vorgeschrieben Aktivbehandlung werden oder Objekte mit fehlenden Werten k nnen ausgeschlossen werden listenweiser Fallausschluss m Fehlende Werte ausschlie en f r Korrelationen nach Quantifizierung vorschreiben Objekte mit fehlenden Werten bei der ausgew hlten Variablen tragen nicht zur Analyse dieser Variablen bei Wenn alle Variablen passiv behandelt werden werden Objekte mit fehlenden Werten f r alle Variablen als Zusatzobjekte behandelt Wenn im Dialogfeld Kategoriale Hauptkomponenten Ausgabe Korrelationen ausgew hlt sind werden fehlende Werte nach der Analyse anhand der h ufigsten Variablenkategorie Modalwert f r die Korrelationen der urspr nglichen Variablengesetzt Sie k nnen die Methode ausw hlen nach der Werte f r die Korrelationen der optimal skalierten Variablen gesetzt werden Wenn Sie Modalwert ausw hlen werden fehlende Werte durch den Modalwert der optimal skalierten Variablen ersetzt Wenn Sie Zusatzkategorie ausw hlen werden fehlende Werte durch die Quantifikation einer zus tzlichen Kategorie ersetzt Dies bedeutet aber auch dass Objekte mit einem fehlenden Wert f r diese Variable als zur gleichen Kategorie der zus tzlichen zugeh rig betrachtet werden 35 Kategoriale Hauptkomponentenanalyse CATPCA m Fehlende Werte vorschre
79. fest wie die Statistiken in der Ausgabe angezeigt werden Alle Dimensionen in der L sung anzeigen Alle Dimensionen in der L sung werden in einer Streudiagramm Matrix angezeigt m Anzahl der Dimensionen beschr nken Die angezeigten Dimensionen werden auf geplottete Paare beschr nkt Wenn Sie die Dimensionen beschr nken m ssen Sie die niedrigste und die h chste Dimension ausw hlen die jeweils geplottet werden soll Die niedrigste Dimension muss im Bereich von 1 bis zur Anzahl der Dimensionen in der L sung minus 1 liegen und wird gegen h here Dimensionen geplottet Der Wert f r die h chste Dimension muss im Bereich von 2 bis zur Anzahl der Dimensionen in der L sung liegen und gibt die h chste Dimension an die beim Plotten der Dimensionspaare verwendet wird Diese Spezifikation gilt f r alle angeforderten multidimensionalen Plots 37 Kategoriale Hauptkomponentenanalyse CATPCA Konfiguration Sie k nnen die Koordinaten einer Konfiguration aus einer Datei einlesen Die erste Variable in der Datei muss die Koordinaten der ersten Dimension die zweite Variable die Koordinaten der zweiten Dimension usw enthalten m Initial Die in der Datei angegebene Konfiguration wird als Ausgangspunkt f r die Analyse verwendet m Fest Die in der Datei angegebene Konfiguration wird zum Anpassen der Variablen verwendet Die Variablen die angepa t werden m ssen als Analysevariablen ausgew hlt werden Da die Konfiguration aber fest
80. gt Wenn Sie Distanzen zwischen Variablen erzeugen siehe Dialogfeld Distanzen aus Daten erstellen w hlen Sie mindestens drei Variablen aus Diese Variablen dienen zum Erstellen der Distanzmatrix oder Distanzmatrizen wenn mehrere Quellen vorhanden sind Bei der Erzeugung von Distanzen zwischen F llen wird nur eine Variable ben tigt gt Wenn mehrere Quellen vorhanden sind w hlen Sie eine Quellenvariable aus W hlen Sie bei Bedarf ein Ma f r die Erstellung der hnlichkeiten aus Dar ber hinaus k nnen Sie ein Modell f r die multidimensionale Skalierung angeben Einschr nkungen f r den gemeinsamen Raum festlegen Konvergenzkriterien festlegen die zu verwendende Ausgangskonfiguration angeben sowie Diagramme und die Ausgabe ausw hlen 79 Multidimensionale Skalierung PROXSCAL Distanzen aus Daten erstellen Abbildung 7 6 Dialogfeld Distanzen aus Daten erstellen E Multidimensionale Skalierung Distanzen aus Daten erstellen rMessniveau Intervall H ufigkeiten Binar Werte transformieren Distanzmatrix erstellen Standardisieren Keine 000 0m Zwischen den Variablen Zwischen den F llen a GE en ie Die multidimensionale Skalierung verwendet Un hnlichkeitsdaten um eine Skalierungsl sung zu erstellen Wenn Ihre Daten multivariate Daten darstellen Werte gemessener Variablen m ssen Sie Un hnlichkeitsdaten erstellen um eine multidim
81. hnlichkeiten verwendet Diese Informationen finden Sie in der Datei behavior sav F r weitere Informationen siehe Thema Beispieldateien in Anhang A in IBM SPSS Categories 19 Suchen Sie mithilfe der multidimensionalen Entfaltung Gruppen von hnlichen Situationen sowie die Verhaltensweisen mit denen sie am ehesten in Verbindung gebracht werden Syntax mit denen Sie diese Analysen nachvollziehen k nnen befindet sich in der Datei prefscal_behavior sps Durchf hren der Analyse gt Um eine Analyse vom Ty Multidimensionale Entfaltung durchzuf hren w hlen Sie die folgenden Befehle aus den Men s aus Analysieren gt metrisch gt Multidimensionale Entfaltung PREFSCAL 296 Kapitel 15 Abbildung 15 24 Hauptdialogfeld Multidimensionale Entfaltung Quellen zn W hlen Sie Laufen bis Schreien als hnlichkeitsvariablen aus W hlen Sie ZeilenID als Zeilenvariable aus Klicken Sie auf Modell Abbildung 15 25 Dialogfeld Modell Skalierungsmodell r hnlichkeitstransformationen Identit t Keine Euklidisch gewichtet Linear Euklidisch verallgemeinert Spline Grad hnlichkeiten Un hnlichkeiten hnlichkeiten Innere Knoten Glatt Ordinal Dimensionen Konstanten Term einschlie en ja Gebundene Beobachtungen l sen oe Transformationen zuweisen In jeder Zeile f r sich Getrennt in jeder Quelle Alle Quellen gleichzeiti
82. in drei Gruppen unterteilt sind erhalten jeweils eine Standardschulung Zus tzlich erh lt Gruppe 2 eine technische Schulung und Gruppe 3 eine Praxisschulung Die einzelnen Mitarbeiter wurden am Ende der Schulung einem Test unterzogen und die erzielten Punkte wurden erfasst Jeder Fall in der Datendatei stellt einen Lehrgangsteilnehmer dar und enth lt die Gruppe der der Lehrgangsteilnehmer zugeteilt wurde sowie die von ihm in der Pr fung erreichte Punktzahl satisf sav Hierbei handelt es sich um eine hypothetische Datendatei zu einer Zufriedenheitsumfrage die von einem Einzelhandelsunternehmen in 4 Filialen durchgef hrt wurde Insgesamt wurden 582 Kunden befragt Jeder Fall gibt die Antworten eines einzelnen Kunden wieder screws sav Diese Datendatei enth lt Informationen zu den Eigenschaften von Schrauben Bolzen Muttern und Rei n geln Hartigan 1975 shampoo_ph sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Qualit tskontrolle in einer Fabrik f r Haarpflegeprodukte geht In regelm igen Zeitabst nden werden Messwerte von sechs separaten Ausgangschargen erhoben und ihr pH Wert erfasst Der Zielbereich ist 4 5 5 5 ships sav Ein an anderer Stelle McCullagh et al 1989 vorgestelltes und analysiertes Daten Set bezieht sich auf die durch Wellen verursachten Sch den an Frachtschiffen Die Vorfallsh ufigkeiten k nnen unter Angabe von Schiffstyp Konstruktionszeitraum und Betriebszeitraum ge
83. in positive Ganzzahlen umgewandelt Benutzerdefinierte und systemdefinierte fehlende Werte sowie Werte kleiner als 1 werden als fehlend betrachtet Sie k nnen die Daten umkodieren oder eine Konstante zu Variablen mit Werten kleiner als 1 addieren um die Werte als nichtfehlend zu deklarieren Annahmen Alle Variablen weisen ein mehrfach nominales Skalierungsniveau auf Die Daten m ssen mindestens drei g ltige F lle enthalten Die Analyse basiert auf Daten die aus positiven ganzen Zahlen bestehen Mit der Option zur Diskretisierung werden Variablen mit Dezimalwerten automatisch kategorisiert indem die Werte in nahezu normalverteilte Kategorien gruppiert werden und Werte von String Variablen werden automatisch in positive Ganzzahlen umgewandelt Sie k nnen andere Diskretisierungsmethoden bestimmen Verwandte Prozeduren Bei zwei Variablen entspricht die Mehrfachkorrespondenzanalyse der Korrespondenzanalyse Wenn Sie annehmen dass die Variablen ordinale oder numerische Eigenschaften besitzen sollte die kategoriale Hauptkomponentenanalyse verwendet werden Wenn Variablen Sets untersucht werden sollen verwenden Sie die nichtlineare kanonische Korrelationsanalyse Copyright SPSS Inc 1989 2010 60 61 Mehrfachkorrespondenzanalyse So lassen Sie eine Mehrfachkorrespondenzanalyse berechnen gt Wahlen Sie die folgenden Befehle aus den Men s aus Analysieren gt Dimensionsreduzierung gt Optimale Skalierung Abbildung 6 1 Dial
84. ist der maximale Kategoriewert 27 und der minimale Kategoriewert ist auf 1 gesetzt Die ersten 19 Kategorien sind leer und erhalten Indikatoren f r systemdefinierte fehlende Werte Die Ausgabe kann schnell sehr umfangreich und komplex werden wenn der maximale Kategoriewert wesentlich gr er als 1 ist und sehr viele leere Kategorien zwischen 1 und dem H chstwert liegen Die Gr e der Datenausgabe kann durch Umkodierung verringert werden Bei numerischen Variablen sollte die Funktion f r die automatische Umkodierung jedoch nicht verwendet werden Die Kodierung in aufeinander folgende Ganzzahlen f hrt zur Differenz 1 zwischen allen aufeinander folgenden Kategorien und damit dazu dass alle Quantifizierungen dieselben Abst nde aufweisen Die metrischen Merkmale die bei der Behandlung einer Variablen als nominal f r bedeutsam erachtet werden werden durch die Neukodierung in aufeinander folgende Ganzzahlen zerst rt Beispiel Schema C in der Tabelle entspricht der automatischen Umkodierung von Alter Die Differenz zwischen den Kategorien 22 und 25 hat sich von 3 auf 1 ge ndert und die Quantifizierungen spiegeln die neue Differenz wider Ein alternatives Umkodierungsschema bei dem die Differenzen zwischen den Kategorien erhalten bleiben besteht darin den kleinsten Kategoriewert von jeder Kategorie zu subtrahieren und zu der Differenz den Wert 1 zu addieren Schema B ergibt sich aus dieser Transformation Der kleinste Kategoriewert 20 wurde v
85. ist ein statistisches Verfahren bei der eine lineare Kombination eines Variablen Sets und eine lineare Kombination eines zweiten Variablen Sets ermittelt werden die maximal korreliert sind Ausgehend von diesem Set mit linearen Kombinationen kann die kanonische Korrelationsanalyse darauf folgende unabh ngige Sets mit linearen Kombinationen ermitteln als kanonische Variablen bezeichnet bis zu einer Maximalzahl die der Anzahl der Variablen im kleineren Set entspricht Wenn in der Analyse zwei Variablen Sets vorliegen und alle Variablen als numerisch definiert sind entspricht die kanonische Korrelationsanalyse mit optimaler Skalierung einer kanonischen Standard Korrelationsanalyse IBM SPSS Statistics beinhaltet zwar keine Prozedur f r die kanonische Korrelationsanalyse doch viele der relevanten Statistiken k nnen aus einer multivariaten Varianzanalyse gewonnen werden Die kanonische Korrelationsanalyse mit optimaler Skalierung bietet noch viele weitere Anwendungsm glichkeiten Bei zwei Variablen Sets von denen eines eine nominale Variable enth lt die als einfach nominal deklariert ist k nnen die Ergebnisse der kanonischen Korrelationsanalyse mit optimaler Skalierung hnlich wie die Ergebnisse einer Regressionsanalyse interpretiert werden Wenn Sie die Variable als mehrfach nominal betrachten ist die Analyse mit optimaler Skalierung eine Alternative zur Diskriminanzanalyse Durch die Gruppierung der Variablen in mehr als zwei Sets erhal
86. kodiert sein Bei als nominal oder ordinal behandelten Variablen hat die Reihenfolge der Kategorien keine Auswirkungen auf die Ergebnisse Bei nominalen Variablen ist nur das Label und nicht der dem Label zugeordnete Wert von Bedeutung Bei ordinalen Variablen wird die Reihenfolge der Kategorien in den Quantifizierungen beibehalten die Kategoriewerte selbst sind nicht von Bedeutung Alle Kodierungsschemata die zur selben Kategoriereihenfolge f hren weisen identische Ergebnisse auf Beispiel Die ersten drei Schemata in der Tabelle sind funktional quivalent wenn T tigkeit auf ordinaler Ebene analysiert wird Die Reihenfolge der Kategorien ist in diesen Schemata identisch Bei Schema D dagegen werden die zweite und die dritte Kategorie invertiert und es ergeben sich andere Ergebnisse als bei den anderen Schemata Obwohl viele Kodierungsschemata f r eine Variable funktional quivalent sind werden Schemata mit kleinen Werten f r die Differenz zwischen den Codes bevorzugt da die Codes sich auf die Menge an Ausgabedaten auswirken die sich aus der Prozedur ergeben Alle Kategorien die mit Werten zwischen und dem benutzerdefinierten H chstwert kodiert sind sind g ltig Wenn eine dieser Kategorien leer ist sind die entsprechenden Quantifizierungen je nach Prozedur entweder systemdefiniert fehlend oder 0 Obwohl sich keine dieser Zuordnungen auf die Analysen auswirkt wird f r die betreffenden Kategorien eine Ausgabe erstellt So weist T tigke
87. laughter Rer gmother ncpfather syrettver alittle T mother father mathe cousin 2 ister 099 i zn niege 5 cE er 1 fangre amp Neuen o _ heahew o An daughte gdaugh gdaugh Dimension 1 Dimension 2 Dimension 3 Diskussion Die hnlichkeiten sollten am besten als ordinale Variablen behandelt werden da eine deutliche Verbesserung bei den Stressma en vorliegt Als n chsten Schritt k nnten Sie die ordinalen Variablen l sen d h zulassen dass quivalente Werte der urspr nglichen Variablen verschiedene transformierte Werte erhalten Beispiel In der ersten Quelle betragen die hnlichkeiten zwischen Tante und Sohn und zwischen Tante und Enkel 85 Der gebundene Ansatz f r ordinale Variablen erzwingt dass die transformierten Werte dieser hnlichkeiten bereinstimmen es gibt jedoch eigentlich keinen Grund f r die Annahme dass sie wirklich bereinstimmen sollten In diesem Fall wird durch die M glichkeit die hnlichkeiten zu l sen eine unn tige Beschr nkung aufgehoben Empfohlene Literatur In folgenden Texten finden Sie weitere Informationen zur multidimensionalen Skalierung Commandeur J J F als auch W J Heiser 1993 Mathematical derivations in the proximity scaling PROXSCAL of symmetric data matrices Leiden Department of Data Theory Universitat Leiden De Leeuw J als auch W J Heiser 1980 Multidimensional scaling with restrictions on the configuration In Multivariate Analysis
88. lineare Kombination dieser Variablen zu beschr nken marketvalues sav Diese Datendatei betrifft Hausverk ufe in einem Neubaugebiet in Algonquin Illinois in den Jahren 1999 2000 Diese Verk ufe sind in Grundbucheintr gen dokumentiert nhis2000_subset sav Die National Health Interview Survey NHIS ist eine gro e bev lkerungsbezogene Umfrage in unter der US amerikanischen Zivilbev lkerung Es werden pers nliche Interviews in einer landesweit repr sentativen Stichprobe von Haushalten durchgef hrt F r die Mitglieder jedes Haushalts werden demografische Informationen und Beobachtungen zum Gesundheitsverhalten und Gesundheitsstatus eingeholt Diese Datendatei enth lt eine Teilmenge der Informationen aus der Umfrage des Jahres 2000 National Center for Health Statistics National Health Interview Survey 2000 Datendatei und Dokumentation ffentlich zug nglich ftp ftp cdc gov pub Health_Statistics NCHS Datasets NHIS 2000 Zugriff erfolgte 2003 ozone sav Die Daten enthalten 330 Beobachtungen zu sechs meteorologischen Variablen zur Vorhersage der Ozonkonzentration aus den brigen Variablen Bei fr heren Untersuchungen Breiman als auch Friedman 1985 Hastie als auch Tibshirani 1990 fanden Wissenschaftler einige Nichtlinearit ten unter diesen Variablen die die Standardverfahren bei der Regression behindern pain_medication sav Diese hypothetische Datendatei enth lt die Ergebnisse eines klinischen Tests f r ein
89. ngig von Zeile oder Quelle sind also ob die Transformationen f r einzelne Zeilen f r einzelne Quellen oder f r alle hnlichkeiten gleichzeitig durchgef hrt werden sollen Multidimensionale Entfaltung Einschr nkungen Im Dialogfeld Einschr nkungen k nnen Sie Einschr nkungen f r den gemeinsamen Raum festlegen 93 Multidimensionale Entfaltung PREFSCAL Abbildung 8 3 Dialogfeld Einschr nkungen E Multidimensionale Entfaltung Einschr nkungen rEinschr nkungen im gemeinsamen Raum F Einschr nkungen f r Zeilenkoordinaten T Einschr nkungen f r Spaltenkoordinaten r Yariablen f r Zeileneinschr nkungen variablen einlesen aus Datei Die Anzahl muss der maximalen Dimensionalit t des Modells entsprechen Aktuell 2 Verf gbar Ausgew hlt r variablen f r Spalteneinschr nkungen Variablen einlesen aus Datei Die Anzahl muss der maximalen Dimensionalit t des Modells entsprechen Aktuell 2 verf gbar Ausgew hlt O o E Einschr nkungen im gemeinsamen Raum Sie k nnen die Koordinaten von Zeilen und oder Spaltenobjekten im gemeinsamen Raum festlegen Variablen f r Zeilen Spalteneinschr nkungen W hlen Sie die Datei aus die die Einschr nkungen enth lt und w hlen Sie die Variablen aus die die Einschr nkungen im gemeinsamen Raum definieren Die erste ausgew hlte Variable enth lt die Koordinaten der Objekte in der ersten Dimension
90. schreiben Neue Datendatei schreiben r Transformierte Yariablen r Vorzeichen der Regressionskoeffizienten Fi Transformierte Variablen in Arbeitsdatei speichern Neues Daten Set erstellen E Transformierte Variablen in neues Daten Set bzw neue Datei speichern Daten Set Name DatenSet7 Neues Datenblatt erstellen Neue Datendatei schreiber Datenblatt Name Neue Datendatei schreiben gt W hlen Sie Im Gruppenfeld Transformierte Variablen die Option Transformierte Variablen in Arbeitsdatei speichern aus Klicken Sie auf Weiter 133 Kategoriale Regression gt Klicken Sie im Dialogfeld Kategoriale Regression auf OK Abbildung 9 39 Modellzusammenfassung f r die Regression mit Temperature ordinal Modellzusammenfassung Offensichtlich er Korrigiertes Vorhersagefe Multiples R R Quadrat R Quadrat hler Abhangige Variable Daily ozone level Einflu variablen Inversion base height Pressure gradient mm Hg Visibility miles Temperature degrees F Day of the year Dieses Modell ergibt einen Wert von 0 872 f r R2 Die ber cksichtigte Varianz f llt daher geringf gig ab wenn die Quantifikationen f r Temperature in eine Reihenfolge gebracht werden Abbildung 9 40 Regressionskoeffizienten mit Temperature ordinal Koeffizienten Standardisierte Koeffizienten Bootstrap 1000 Sch tzung des Standardfehle rs Inversion base height
91. seit dieser Bewertung verstrichene Zeit den zu diesem Zeitpunkt ermittelten Wert sowie den Verkaufswert der Immobilie property_assess_cs sav Hierbei handelt es sich um eine hypothetische Datendatei in der es um die Bem hungen eines f r einen US Bundesstaat zust ndigen Immobilienbewerters geht trotz eingeschr nkter Ressourcen die Einsch tzungen des Werts von Immobilien auf dem aktuellsten Stand zu halten Die F lle entsprechen den Immobilien in dem betreffenden Bundesstaat Jeder Fall in der Datendatei enth lt das County die Gemeinde und das Wohnviertel in dem sich die Immobilie befindet die seit der letzten Bewertung verstrichene Zeit sowie zu diesem Zeitpunkt ermittelten Wert property_assess_cs_sample sav Diese hypothetische Datendatei enth lt eine Stichprobe der in property_assess_cs sav aufgef hrten Immobilien Die Stichprobe wurde gem dem in der Plandatei property_assess csplan angegebenen Stichprobenplan gezogen und in dieser Datendatei sind die Einschlusswahrscheinlichkeiten und Stichprobengewichtungen erfasst Die zus tzliche Variable Current value Aktueller Wert wurde nach der Ziehung der Stichprobe erfasst und zur Datendatei hinzugef gt 315 Beispieldateien recidivism sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen einer Strafverfolgungsbeh rde geht einen Einblick in die R ckfallraten in ihrem Zust ndigkeitsbereich zu gewinnen Jeder Fall entspricht einem fr
92. tsmodell In diesem Fall wird f r die Analyse standardm ig das Identit tsmodell verwendet Verwandte Prozeduren Eine Skalierung aller Variablen auf numerischem Niveau entspricht der standardm igen multidimensionalen Skalierung Copyright SPSS Inc 1989 2010 73 74 Kapitel 7 So berechnen Sie eine multidimensionale Skalierung W hlen Sie die folgenden Befehle aus den Men s aus Analysieren gt metrisch gt Multidimensionale Skalierung PROXSCAL Daraufhin wird das Dialogfeld Datenformat ge ffnet Abbildung 7 1 Dialogfeld Datenformat E Multidimensionale Skalierung Datenformat rDatenformat Anzahl der Quellen Daten sind hnlichkeiten Eine Matrixquelle hnlichkeiten aus Daten erstellen Mehrere Matrixquellen rEine Quelle rMehrere Quellen hnlichkeiten stammen aus mehreren Spalten in gestapelten Matrizen hnlichkeiten stammen aus Spalten eine Quelle pro Spalte hnlichkeiten sind in einer Spalte gestapett Eee an me Geben Sie das Format der Daten an Datenformat Geben Sie an ob die Daten aus hnlichkeitsma en bestehen oder ob Sie aus den Daten hnlichkeitsma e erstellen m chten Anzahl der Quellen Wenn es sich bei den Daten um hnlichkeiten handelt geben Sie an ob eine Quelle oder mehrere Quellen f r hnlichkeitsma e vorhanden sind Eine Quelle Wenn nur eine Quelle f r hnlichkeiten vorhanden ist geben S
93. umgehen k nnen Die kategoriale Regression beschreibt die Beziehung zwischen einer kategorialen Responsevariablen und einer Kombination kategorialer Einflu variablen Der Einflu jeder Einflu variablen auf die Responsevariable wird durch das entsprechende Regressionsgewicht beschrieben Wie in den anderen Prozeduren k nnen die Daten mit verschiedenen Messniveaus der optimalen Skalierung analysiert werden Mit multidimensionaler Skalierung und multidimensionaler Entfaltung werden Beziehungen zwischen Objekten in einem Raum mit wenigen Dimensionen anhand der hnlichkeiten zwischen den Objekten beschrieben Es folgen kurze Richtlinien f r die einzelnen Prozeduren m Verwenden Sie die kategoriale Regression um die Werte einer abh ngigen kategorialen Variablen aus einer Kombination unabh ngiger kategorialer Variablen vorherzusagen m Verwenden Sie die kategoriale Hauptkomponentenanalyse um Variationsmuster in einem einzelnen Set von Variablen mit gemischten Messniveaus der optimalen Skalierung zu ber cksichtigen m Verwenden Sie die nichtlineare kanonische Korrelationsanalyse um zu bewerten wie stark zwei oder mehr Sets von Variablen mit gemischten Messniveaus der optimalen Skalierung korrelieren m Verwenden Sie die Korrespondenzanalyse um zweidimensionale Kontingenztafeln oder Daten zu analysieren die als zweidimensionale Tabelle ausgedr ckt werden k nnen beispielsweise Daten zur bevorzugten Marke oder zur soziometrischen Wahl
94. wie bei der Hauptkomponentenanalyse So k nnen beispielsweise zwei Variablen Sets vorliegen wobei es sich bei einem Variablen Set um Items zum demografischen Hintergrund f r eine Gruppe von Befragten handelt w hrend das zweite Set aus Antworten auf eine Gruppe von Items zur Einstellung der Personen besteht Die Skalierungsniveaus in der Analyse k nnen aus einer beliebigen Mischung aus nominalen ordinalen und numerischen 10 Kapitel 1 Messniveaus bestehen Die kanonische Korrelationsanalyse mit optimaler Skalierung bestimmt die hnlichkeit zwischen den Sets und vergleicht gleichzeitig die kanonischen Variablen aus den einzelnen Sets mit einem Kompromi Set das aus den Werten besteht die den Objekten zugewiesen wurden Beziehung zu anderen Prozeduren von Categories Wenn zwei oder mehr Variablen Sets mit jeweils nur einer einzigen Variablen vorliegen entspricht die kanonische Korrelationsanalyse mit optimaler Skalierung der Hauptkomponentenanalyse mit optimaler Skalierung Wenn alle Variablen in einer Analyse mit einer Variablen pro Set mehrfach nominal sind entspricht die kanonische Korrelationsanalyse mit optimaler Skalierung der Mehrfachkorrespondenzanalyse Bei zwei Variablen Sets von denen eine nur eine einzige Variable enth lt entspricht die kanonische Korrelationsanalyse mit optimaler Skalierung der kategorialen Regression mit optimaler Skalierung Beziehung zu Standardverfahren Die kanonische Standard Korrelationsanalyse
95. 05 00 05 Dimension 1 1 0 1 un Mehrfachkorrespondenzanalyse Das mit L nge in cm beschriftete Diagramm zeigt da diese Variable in der ersten Dimension keine Diskrimination aufweist Ihre Kategorien weisen bei einer Projektion auf eine horizontale Linie keine Gruppierung auf In der zweiten Dimension jedoch liegt bei L nge in cm durchaus eine Diskrimination vor Die k rzeren Objekte entsprechen positiven Werten und die l ngeren Objekte entsprechen gro en negativen Werten Abbildung 13 12 Objektwerte beschriftet mit Messing N Dimension 2 Nein ja o Nein Neinjein Nein o Nein Nein Neekin Nein NeinO Nein 15 10 05 00 05 Dimension 1 Das mit Messing beschriftete Diagramm zeigt dass diese Variable Kategorien aufweist die sich in der ersten und zweiten Dimension nicht gut trennen lassen Die Objektwerte liegen ber den gesamten Raum verteilt Die Objekte aus Messing k nnen nicht von den Objekten differenziert werden die nicht aus Messing bestehen 248 Kapitel 13 Ausschlu von Ausrei ern Bei der Homogenit tsanalyse sind Ausrei er Objekte die zu viele einzigartige Merkmale aufweisen Wie bereits erw hnt k nnte SCHRAUBE als Ausrei er betrachtet werden Um dieses Objekt zu l schen und die Analyse erneut durchzuf hren w hlen Sie folgende Optionen aus den Men s aus Daten gt F lle ausw hlen Abbildung 13 13 Dialogfeld F lle ausw hlen
96. 1 in Kategoriale Regression 117 in Multidimensionale Entfaltung 95 302 306 in Multidimensionale Skalierung 84 268 Transformierte hnlichkeiten in Multidimensionale Entfaltung 97 in Multidimensionale Skalierung 86 Transformierte unabh ngige Variablen in Multidimensionale Skalierung 86 Triplots in der Kategorialen Hauptkomponentenanalyse 39 Variablengewichtung bei der Mehrfachkorrespondenzanalyse 62 in der Kategorialen Hauptkomponentenanalyse 30 Varianz ber cksichtigt f r in der Kategorialen Hauptkomponentenanalyse 37 154 177 Variationskoeffizient in Multidimensionale Entfaltung 275 278 284 291 300 Verbundene Kategoriendiagramme bei der Mehrfachkorrespondenzanalyse 70 in der Kategorialen Hauptkomponentenanalyse 41 Verbundenes Diagramm der individuellen Raume in Multidimensionale Entfaltung 286 293 Verbundenes Diagramm des gemeinsamen Raums in Multidimensionale Entfaltung 276 279 285 292 301 305 Verlustwerte in Nichtlineare kanonische Korrelationsanalyse 207 Wichtigkeit in Kategoriale Regression 115 Zeilenprinzipal Normalisierung in der Korrespondenzanalyse 224 Zeilenwertdiagramme in der Korrespondenzanalyse 232 Zentroide in Nichtlineare kanonische Korrelationsanalyse 48 214 Zus tzliche F lle in Kategoriale Regression 21
97. 2 Norden Vertreter 8 Osten Vertreter 3 Norden Manager 9 Osten Manager 4 Siiden Praktikant 10 Westen Praktikant 5 Siiden Vertreter 11 Westen Vertreter 6 S den Manager 12 Westen Manager Ein Nachteil bei diesem Ansatz besteht darin dass beliebige Variablenpaare zusammengefa t werden k nnen T tigkeit und Alter k nnen kombiniert werden was ebenfalls eine Variable mit 12 Kategorien ergibt Oder man kann Region und Alter kombinieren was zu einer neuen Variablen mit 16 Kategorien f hrt Alle diese Interaktionsvariablen ergeben zusammen mit der verbleibenden Variablen eine zweidimensionale Tabelle Die Korrespondenzanalysen dieser drei Tabellen f hren nicht zu identischen Ergebnissen aber dennoch ist jeder der Ans tze g ltig Au erdem k nnen bei vier oder mehr Variablen zweidimensionale Tabellen erstellt werden die eine Interaktionsvariable mit einer weiteren Interaktionsvariablen vergleichen Die Anzahl der m glichen Tabellen f r die Analyse kann recht gro werden selbst bei nur relativ wenigen Variablen Sie k nnen eine dieser Tabellen f r die Analyse ausw hlen oder alle analysieren Alternativ kann die Prozedur der Mehrfachkorrespondenzanalyse verwendet werden um alle Variablen gleichzeitig zu untersuchen ohne dass Interaktionsvariablen konstruiert werden m ssen Beziehung zu Standardverfahren Mit der Prozedur Crosstabs k nnen ebenfalls Kontingenztabellen analysiert werden wobei Unabh ngigkeit einen
98. 3 Dialogfeld Bereich und Skala definieren Minimum 1 Messniveau Ordinal fF ovERALs Bereich und Skala X Maximum Einzeln nominal Diskret numerisch Mehrfach nominal Cees Anecnen mwe gt Geben Sie 10 als H chstwert f r diese Variable ein Klicken Sie auf Weiter gt W hlen Sie im Dialogfeld Nichtlineare kanonische Korrelationsanalyse die Variable marital aus und klicken Sie auf Bereich und Skala definieren 202 Kapitel 11 Abbildung 11 4 Dialogfeld Bereich und Skala definieren FF OVERALS Bereich und Skala X Minimum 1 Maximum Messniveau O Ordinal Mehrfach nominal Einzeln nominal Diskret numerisch ei aeerecnen ture gt Geben Sie 3 als H chstwert f r diese Variable ein W hlen Sie Einzeln nominal als Messniveau aus Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Nichtlineare kanonische Korrelationsanalyse auf Weiter um das n chste Variablen Set zu definieren Abbildung 11 5 Dialogfeld Nichtlineare kanonische Korrelationsanalyse li Nichtlineare kanonische Korrelationsanalyse OVERALS X rset2 von 2 amp Music preferred music Zur ck Neighborhood prefere Variablen ll Math test score math an pete Ordina news 1 Ordinal Beschriftung f r Diagramme der Objektwerte Bereich definieren Dimensionen in der L sung
99. 5 Pun Doppelklicken Sie dann zur Verbindung der Punkte auf das Diagramm und klicken Sie im Diagramm Editor auf das Tool zum Hinzuf gen von Interpolationslinien gt Schlie en Sie den Diagramm Editor Bei der sexuellen Einstellungen verlaufen die vier Kurven mehr oder weniger parallel und alle Gruppen zeigen Fortschritte Die bulimischen Gruppen weisen allerdings h here bessere Werte auf als die anorektische Gruppe 195 Kategoriale Hauptkomponentenanalyse Abbildung 10 53 Diagrammerstellung Variablen amp Table Number TableNu Set color da Command_ a Subtype_ da Label_ da vart amp Centroids Projected on amp Centroids Projected on amp Centroids Projected on E time diagnosis E Category 1 E Category 2 IE e T Cann Co gt Rufen Sie die Diagrammerstellung erneut auf Heben Sie die Auswahl von Centroids Projected on Sexual attitude Zentroide auf sexuelle Einstellung projiziert als y Achsen Variable auf und w hlen Sie statt dessen Centroids Projected on Preoccupation with food and weight Zentroide auf Besch ftigung mit Essen und Gewicht projiziert als y Achsen Variable aus Klicken Sie auf OK 196 Kapitel 10 Abbildung 10 54 Auf Preoccupation with food and weight Besch ftigung mit Essen und Gewicht projizierte Zentroide des Diagnosezeitpunkts im Verlauf der Zeit im Diagramm Editor Datei Bearbeiten Ansicht Optionen Elemente Hi
100. 65 66 70 O oss 56 60 61 65 o 0 0 n 20 25 c 2 56 60 2 054 E a 104 41 45 15 4 2 0 1 0 0 5 0 0 0 5 1 0 15 2 0 Dimension 1 221 Nichtlineare kanonische Korrelationsanalyse Das Diagramm mit den Zentroiden erm glicht nun die Interpretation der niedrigeren Altersgruppen Au erdem sind die Kategorien Volkskrant und NRC weiter voneinander entfernt als in der bisherigen Analyse so wird eine separate Interpretation dieser Elemente m glich Die Gruppen im Alter von 26 und 45 lesen den Volkskrant und leben gern auf dem Land Die Altersgruppen 20 25 und 56 60 lesen NRC wobei die j ngere Gruppe bevorzugt in der Stadt lebt und die ltere Gruppe lieber auf dem Land Die Gruppen mit dem h chsten Alter lesen den Telegraaf und wohnen gern in einem Dorf Die Interpretation der anderen Richtung Music preferred Marital status und Pets owned ist im Vergleich zur vorangegangenen Analyse praktisch unver ndert Der einzige offensichtliche Unterschied ist dass Personen mit dem Familienstand Marital Status Orher entweder eine Katze halten oder gar kein Haustier besitzen Abbildung 11 32 Zentroide mit Variablen beschriftet Alter nominal O Age in years O Marital status Pets owned Village O Newspaper read 66 70 O most often 1 k o Music preferred ew wave o 20 25 no ras Neighborhood e3 o esar 61 65 O preference dog s Single O o N Popular c 36 40 OPUN _heeaety Other 0 Q Q Ot 2 vario T
101. 9 Multidimensionale Skalierung Abbildung 14 18 Transformierte Ahnlichkeiten 1 50 Quelle SRC_1 SRC_2 1254 SRC_3 N SRC_4 E E f 0 SRC_S a SRC_6 A 100 44 SRC_6 a 2 E 0 754 2 n c eo e 0504 0 254 OT on ov 20 40 60 80 StressmaBe Der Stress fiir die aktuelle L sung stiitzt die Aussage dass die Ahnlichkeiten auf einem ordinalen Messniveau skaliert werden sollten Abbildung 14 19 Stress und Anpassungsma e Normalisierter Roh Stress Stress I Stress ll 5 Stress Erkl rte Streuung D AF Kongruenzkoeffizient nach Tucker PROXSCAL minimiert den normalisierten Roh Stress a Faktor f r optimale Skalierung 1 032 b Faktor f r optimale Skalierung 980 Der normalisierte Roh Stress f r die vorangegangene L sung liegt bei 0 06234 Durch die Skalierung der Variablen mit nicht standardm igen Transformationen wird der Wert f r den Stress auf 0 03137 halbiert Endg ltige Koordinaten des gemeinsamen Raums Diagramme des gemeinsamen Raums erm glichen im wesentlichen dieselbe Interpretation der Dimensionen wie die vorangegangene L sung 270 Kapitel 14 Abbildung 14 20 Koordinaten des gemeinsamen Raums bp cle btetmer uncle ccoo rop BEL S seer e ngphaw drn A cousin O Ocousin o E mother amet er gmolher a augh gaa 0m OOniece O Sch daisheter aunt sister aunt HF see a Fs MEERE nag uncle c o S h gson B oer gf amp her 5 Qainisther
102. A 1938 Statistical methods for research workers Edinburgh Oliver and Boyd Fisher R A 1940 The precision of discriminant functions Annals of Eugenics 10 Gabriel K R 1971 The biplot graphic display of matrices with application to principal components analysis Biometrika 58 Gifi A 1985 PRINCALS Research Report UG 85 02 Leiden Department of Data Theory Universitat Leiden Gifi A 1990 Nonlinear multivariate analysis Chichester John Wiley and Sons Gilula Z als auch S J Haberman 1988 The analysis of multivariate contingency tables by restricted canonical and restricted association models Journal of the American Statistical Association 83 Gower J C als auch J J Meulman 1993 The treatment of categorical information in physical anthropology International Journal of Anthropology 8 Green P E als auch V Rao 1972 Applied multidimensional scaling Hinsdale Ill Dryden Press Green P E als auch Y Wind 1973 Multiattribute decisions in marketing A measurement approach Hinsdale Ill Dryden Press Guttman L 1941 The quantification of a class of attributes A theory and method of scale construction In The Prediction of Personal Adjustment P Horst Hg New York Social Science Research Council Guttman L 1968 A general nonmetric technique for finding the smallest coordinate space for configurations of points Psychometrika 33 Hartigan J A 1975 Clustering alg
103. Art von PCA ist auch als Hauptkoordinatenanalyse bekannt Beziehung zu Standardverfahren Die Prozedur Multidimensionale Skalierung in SPSS Categories PROXSCAL bietet zahlreiche Verbesserungen gegen ber der in der Statistics Base verf gbaren Skalierungsprozedur ALSCAL PROXSCAL bietet einen schnelleren Algorithmus f r bestimmte Modelle und erm glicht Ihnen Einschr nkungen f r den gemeinsamen Raum festzulegen Au erdem versucht PROXSCAL den normalisierten Roh Stress zu minimieren und nicht den S Stress auch als Belastung bezeichnet Der normalisierte Roh Stress wird im allgemeinen bevorzugt da es sich dabei um ein Ma handelt das auf den Distanzen beruht w hrend S Stress auf den quadrierten Distanzen beruht Multidimensionale Entfaltung Die multidimensionale Entfaltung ist am besten geeignet wenn das Ziel der Analyse darin besteht die Struktur eines Sets von Distanzma en zwischen zwei Gruppen von Objekten den Zeilen und Spaltenobjekten zu ermitteln Dies wird durch das Zuweisen von Beobachtungen zu bestimmten Positionen in einem konzeptuellen Raum mit wenigen Dimensionen erzielt wobei die Abst nde zwischen den Punkten des Raumes mit den vorgegebenen Un hnlichkeiten bzw hnlichkeiten so gut wie m glich bereinstimmen Als Ergebnis werden die Zeilen und Spaltenobjekte in 14 Kapitel 1 diesem schwachdimensionierten Raum mithilfe der Methode der kleinsten Quadrate dargestellt was h ufig zu einem besseren V
104. BB cc DD EE FF Aktiver Gesamtwert In beiden Dimensionen sind alle Marken gut repr sentiert mit Ausnahme von BB CC und DD sind gut in einer Dimension vertreten Die zweite Dimension liefert die gr ten Beitr ge f r EE und FF Beachten Sie dass die Marke AA in der ersten Dimension zwar gut repr sentiert ist jedoch keinen sehr hohen Beitrag zu dieser Dimension liefert Diagramme Die Zeilenpunktdiagramme zeigen dass die Attribute frisch und h sslich sehr nahe am Ursprung liegen dies bedeutet dass diese Attribute nur wenig vom durchschnittlichen Zeilenprofil abweichen Drei allgemeine Klassifizierungen werden deutlich Im oberen linken Bereich finden sich die Attribute stark M nner und Arbeit jeweils mit gro en hnlichkeiten Der untere linke Bereich enth lt s ss macht dick Kinder und premium Die Attribute gesund fettarm n hrstoffreich und neu dr ngen sich dagegen im rechten Teil des Diagramms 233 Korrespondenzanalyse Abbildung 12 10 Diagramm der Image Attribute Prinzipal Normalisierung schwer 1 0 e M nner N c 05 2 Arbeit Heilmittel o o fettarm c neu 5 o unpopular O E Koffein fri O On hrstgefsaiadh PI 0 0 o o a attrindiv O O popul r h sslich Frauen Omacht dick O 0s ae o S d Australien YuPPies O Kinder s ss O S T T T 1 1 0 0 5 0 0 0 5 1 0 1 5 Dimension 1 Im Spaltenpunktdiagramm liegen alle Marken weit enfernt vom Ursprung keine der Marken hne
105. Darstellung m glicher sozialer Gruppen vor Guttman Guttman 1968 verwendete einen Teil dieser Tabelle bei der f nf Variablen die Aspekte beschreiben wie soziale Interaktion das Gef hl der Gruppenzugeh rigkeit die physische N he der Mitglieder und die Formalit t der Beziehung mit sieben theoretischen sozialen Gruppen gekreuzt wurden crowds Menschenmassen beispielsweise die Zuschauer eines Fu ballspiels audience Zuh rerschaften beispielsweise die Personen im Theater oder bei einer Vorlesung public ffentlichkeit beispielsweise Zeitungsleser oder Fernsehzuschauer mobs Mobs wie Menschenmassen jedoch mit wesentlich st rkerer Interaktion primary groups Prim rgruppen vertraulich secondary groups Sekund rgruppen freiwillig und modern community die moderne Gesellschaft ein lockerer Zusammenschluss der aus einer engen physischen N he und dem Bedarf an spezialisierten Dienstleistungen entsteht health_funding sav Hierbei handelt es sich um eine hypothetische Datei die Daten zur Finanzierung des Gesundheitswesens Betrag pro 100 Personen Krankheitsraten Rate pro 10 000 Personen der Bev lkerung und Besuche bei medizinischen Einrichtungen rzten Rate pro 10 000 Personen der Bev lkerung enth lt Jeder Fall entspricht einer anderen Stadt hivassay sav Hierbei handelt es sich um eine hypothetische Datendatei zu den Bem hungen eines pharmazeutischen Labors einen Sc
106. Diagramm Element f r Element zu erstellen amp Job category obest ODER E Kategorie 1 I Kategorie 2 Ausw hlen aus W hlen Sie die GalerieStreu Punktdiagramm aus und w hlen Sie die Option Gruppiertes Streudiagramm 183 Abbildung 10 41 Diagrammerstellung variablen 8 Sexuelle Neigung s l E Sexuelles Verhatte Mentaler Status Sti 8 St ndige Gedanken L K perwahrnehmun 2 Zeit des Interviews amp Diagnose diag E Zeit Diagnose Wec E Patienten Nummer 2 Diagnose diag2 L time2 y SCUmATwenszicag pp ZeitDiagnose Interaktion Quantifizierung Dimension 1 Kategoriale Hauptkomponentenanalyse W hlen Sie Time diagnosis interaction Quantification dimension 2 Zeit Diagnose Interaktion Quantifizierung Dimension 2 als y Achsen Variable und Time diagnosis interaction Quantification dimension 1 Zeit Diagnose Interaktion Quantifizierung Dimension 1 als x Achsen Variable gt Wahlen Sie aus dass die Farbe anhand von Patient Diagnosis Patientendiagnose festgelegt werden soll Klicken Sie auf OK 184 Kapitel 10 Abbildung 10 42 Strukturen des Krankheitsverlaufs Datei Bearbeiten Ansicht Optionen Elemente Hilfe foo SEXY mOe MLE r Teen i U At W t him Zee aa Diagnose O Anorexia Nervosa Anorexia und Bulimia Nervosa Bullimia Nervosa nach Anorexia D Atypisc
107. Diagramme Version 2 Im Dialogfeld Diagramme k nnen Sie die zu erstellenden Diagramme festlegen Wenn ein beliebiges Datenformat au er dem Datenformat hnlichkeiten in Spalten ausgew hlt wurde wird das Dialogfeld Diagramme wie folgt angezeigt Geben Sie f r die Diagramme Individuelle Raumgewichtungen Urspr ngliche ber transformierte hnlichkeiten und Transformierte hnlichkeiten ber Distanzen die Quellen an f r die die Diagramme erzeugt werden sollen Die eingegebenen Quellennummern m ssen Werte der im Hauptdialogfeld angegebenen Quellenvariable sein und im Bereich von 1 bis zur Anzahl der Quellen liegen 86 Kapitel 7 Abbildung 7 11 Dialogfeld Diagramme Version 2 Multidimensionale Skalierung Diagramme r Diagramme M Stress Urspr ngliche ber transformierte hnlichkeiten Fi Gemeinsamer Raum Transformierte hnlichkeiten gegen Distanzen BB individuelier Raum Transformierte unabh ngige Variablen ER individuele Raumgewichtungen IM Variablen und Dimensionskorrelationen Diagramme der Quellen Q Quellen ausw hlen Hinzuf gen Andern J Quellennummer peaa Entfernen orten Anecnen _Hie_ Multidimensionale Skalierung Ausgabe Im Dialogfeld Ausgabe k nnen Sie die angezeigte Ausgabe steuern und Ausz ge davon in eigenen Dateien speichern 87 Multidimensionale Skalierung PROXSCAL Abbildung 7 12 Dialogfeld
108. Die diskretisierten Variablen werden dann in der Analyse verwendet Abbildung 2 3 Diskretisierung H Kategoriale Regression Diskretisierung Yariablen pref Nicht angegeben package Nicht angegeben brand Nicht angegeben price Nicht angegeben seal Nicht angegeben money Nicht angegeben Methode R nge ve Gruppieren Methode Verf gbar sind die Optionen Gruppieren Einstufen oder Multiplizieren Gruppierung Hierbei werden die Daten in eine bestimmte Anzahl von Kategorien oder nach Intervall umkodiert Einstufen Die Variable wird durch Bilden einer Rangfolge diskretisiert Multiplizieren Die aktuellen Werte der Variablen werden standardisiert mit 10 multipliziert und gerundet Anschlie end wird eine Konstante zu den Werten addiert sodass der niedrigste diskretisierte Wert 1 betr gt 20 Kapitel 2 Gruppierung Folgende Optionen sind bei der Diskretisierung von Variablen durch Gruppierung verf gbar m Anzahl Kategorien Geben Sie eine Anzahl von Kategorien an Legen Sie au erdem fest ob die Werte der Variablen ber die Kategorien ungef hr normal oder gleichverteilt werden sollen m Gleiche Intervalle Die Variablen werden in Kategorien umkodiert die durch diese gleich gro en Intervalle definiert werden Sie m ssen die Gr e der Intervalle angeben Fehlende Werte in kategorialer Regression Im Dialogfeld Kategoriale Hauptkomponenten Feh
109. E 00 0EE 00 809E 00 6ES Kategorien Das Transformationsdiagramm von Inversion base height zeigt kein erkennbares Muster Der gezackte Verlauf des Diagramms weist darauf hin dass der bergang von niedrigen zu hohen Kategorien in Fluktuationen bei den Quantifikationen in beide Richtungen f hrt Eine Beschreibung der Auswirkungen dieser Variablen muss sich daher auf die einzelnen Kategorien konzentrieren Wenn Sie ordinale oder lineare Einschr nkungen f r die Quantifikationen dieser Variablen festlegen geht die Anpassungsg te unter Umst nden deutlich zur ck 128 Kapitel 9 Abbildung 9 33 Transformationsdiagramm von Pressure gradient nominal Transformation Pressure gradient mm Hg Quantifikationen i 1 5 5 N J a N gt Ww N o P a oo o po B i A 2 BBESSBHBHEBEEBRBRBBBBBB So O o amp 58 8 T 7 F T T 7 T T H H H H i i o N e a D x je je nn a y N 2 O Qo S S 0 D aU O 2 8 w O O O O O So o o Do oo O oo oo o o oo oD sa 6 o a 515 68 so 86 6 O Kategorien Diese Abbildung zeigt das Transformationsdiagramm von Pressure gradient Die anfanglichen diskretisierten Kategorien bis 6 erhalten nur kleine Quantifikationen und leisten daher nur einen minimalen Beitrag zur vorhergesagten Antwort Die n chsten drei Kategorien erhalten etwas h here positive Werte Dies f hrt zu einem m igen Anstieg beim vorhergesagten Ozonwert Die Quantifikationen
110. E BE Dont like music w E 26 30 a OMarried z 5 1 fa Volkskrant Cla cat s 1 pP Country 41 45 e 2 2 1 0 1 2 Dimension 1 Allgemeine Vorschl ge Nach der Untersuchung der ersten Ergebnisse soll die Analyse in der Regel weiter verfeinert werden indem Sie einen Teil der Angaben f r die nichtlineare kanonische Korrelationsanalyse ndern Hier finden Sie einige Tips wie Sie die Analyse strukturieren m Erstellen Sie so viele Sets wie m glich Wichtige Variablen f r die Vorhersage sollten dabei jeweils in ein separates Set eingebracht werden m Variablen die Ihrer Ansicht nach als Einflu gr en fungieren sollten gemeinsam in ein Set plaziert werden Falls zahlreiche Einflu gr en vorliegen teilen Sie sie nach M glichkeit auf mehrere Sets auf 222 Kapitel 11 m Mehrfach nominale Variablen sollten jeweils in ein separates Set aufgenommen werden m Wenn Variablen hoch korreliert sind und diese Beziehung die L sung nicht dominieren soll platzieren Sie die betreffenden Variablen in einem einzigen Set Empfohlene Literatur In folgenden Texten finden Sie weitere Informationen zur nichtlinearen kanonischen Korrelationsanalyse Carroll J D 1968 Generalization of canonical correlation analysis to three or more sets of variables In Proceedings of the 76th Annual Convention of the American Psychological Association 3 Washington D C American Psychological Association De Leeuw J 1984 Canonical
111. Getrennt in jeder Quelle Alle Quellen gleichzeitig samen un W hlen Sie Ordinal als hnlichkeitstransformation Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf OK Im Folgenden finden Sie die durch diese Optionen generierte Befehlssyntax PREFSCAL VARIABLES Run Talk Kiss Write Eat Sleep Mumble Read Fight Belch Argue Jump Cry Laugh Shout INPUT ROWS ROWID INITIAL samplesDirectory behavior_ini sav dim1 dim2 CONDITION UNCONDITIONAL TRANSFORMATION ORDINAL KEEPTIES PROXIMITIES DISSIMILARITIES MODEL IDENTITY CRITERIA DIMENSIONS 2 2 DIFFSTRESS 000001 MINSTRESS 0001 MAXITER 5000 PENALTY LAMBDA 0 5 OMEGA 1 0 PRINT MEASURES COMMON PLOT COMMON TRANSFORMATIONS m Die einzige Anderung besteht im Unterbefehl TRANSFORMATION Die Transformation wurde als ORDINAL festgelegt Dabei wird die Ordnung der Ahnlichkeiten beibehalten die transformierten Werte m ssen jedoch nicht proportional zu den urspr nglichen Werten sein 304 Kapitel 15 Me werte GLM Repeated Measures Abbildung 15 32 Ma e f r L sung mit ordinaler Transformation lterationen Endg ltiger Funktionswert Wertteile der Funktion Fehlende Anpassung G te der Anpassung Yariationskoeffizienten Indizes f r Degeneration Stressteil Penalisierungsteil Normalisierter Stress Stress Inach Kruskal Stress Il nach Kruskal S Stress nach Young 5
112. Gruppenfeld Tabellen die Option Objektwerte und heben Sie die Auswahl von Korrelationen der transformierten Variablen auf gt Aktivieren Sie die Erstellung von Kategoriequantifikationen f r intensit Intensit t bis formal Formalit t gt Wahlen Sie Objektwerte beschriften nach cluster Klicken Sie auf Weiter gt Klicken Sie im Gruppenfeld Diagramme des Dialogfelds Kategoriale Hauptkomponenten auf Objekt 153 Abbildung 10 5 Objekt und Variablendiagramme Kategoriale Hauptkomponentenanalyse A Kategoriale Hauptkomponenten Objekt und Variablendiagramme X rDiagramme Y Objektpunkte Iv Objekte und Variablen Biplot Variablenkoordinaten O Ladungen Zertroide A Objekte Ladungen und Zentroide Triplot rBiplot und Triplotvariablen Verf gbar Einschlie en Alle Variablen Ausgew hlte Variablen blonging proxmity formlity rObjekte beschriften Verf gbar Ausgew hlt Beschriften anhand Fallnummer Variable Wahlen Sie im Gruppenfeld Diagramme die Option Objekte und Variablen Biplot W hlen Sie im Gruppenfeld Objekte beschriften aus dass die Objekte nach Variable beschriftet werden sollen und w hlen Sie dann cluster als die Variable aus nach der die Objekte beschriftet werden sollen Klicken Sie auf Weiter Klicken Sie im Gruppenfeld Diagramme des Dialogfelds Kategoriale Hauptkomponenten
113. Iterations und Konvergenzkriterien und die Wahl zwischen standardm igen und gelockerten Aktualisierungen 83 Multidimensionale Skalierung PROXSCAL Abbildung 7 9 Dialogfeld Optionen E Multidimensionale Skalierung Optionen rAusgangskonfiguration riterationskriterien simplex Stress Konvergenz 0001 Torgerson Mindest Stress 0001 Einzelner Zufallsstart Maximalzahl der Iterationen Mehrere Zufallsstarts Gelockerte Aktualisierungen Anpassen rAngepasste Konfiguration Variablen einlesen aus Datei C Program FilestSPSSinc P kinship_ini sav Die Anzahl muss der maximalen Dimensionalit t des Modells entsprechen Aktuell 2 Verf gbar Ausgew hlt dim01 dim02 an e eter _ aerecnen mre _ Ausgangskonfiguration W hlen Sie eine der folgenden Optionen Simplex Objekte werden in der h chsten Dimension in gleichen Abst nden voneinander plaziert Eine Iteration wird durchgef hrt um diese Konfiguration der h chsten Dimension zu optimieren und anschlie end wird eine Dimensionsreduktion vorgenommen um eine Ausgangskonfiguration mit der maximalen im Dialogfeld Modell angegebenen Anzahl von Dimensionen zu erhalten Torgerson Als Ausgangskonfiguration wird eine klassische Skalierungsl sung verwendet Einzelner Zufallsstart Eine Konfiguration wird zuf llig ausgew hlt Mehrere Zufallsstarts Es werden mehrere K
114. Kategorien jeder Variablen das nicht mit dem ersten Set in Zusammenhang steht wobei wieder versucht wird die Streubreite zu maximieren usw Da die Kategorien einer Variablen so viele Bewertungen erhalten wie Dimensionen vorhanden sind wird davon ausgegangen dass die Variablen in der Analyse auf dem Messniveau der optimalen Skalierung mehrfach nominal sind Die Mehrfachkorrespondenzanalyse weist auch den Objekten in der Analyse solche Werte zu dass die Kategoriequantifizierungen die Durchschnittswerte bzw Zentroide der Objektwerte der Objekte in dieser Kategorie sind Beziehung zu anderen Prozeduren von Categories Die Mehrfachkorrespondenzanalyse wird auch als Homogenit tsanalyse oder Doppelskalierung bezeichnet Sie f hrt zu vergleichbaren jedoch nicht identischen L sungen wie die Korrespondenzanalyse wenn nur zwei Variablen vorhanden sind Die Korrespondenzanalyse f hrt zu einer eindeutigen Ausgabe bei der die Anpassung und die Qualit t der Darstellung der L sung einschlie lich der Stabilit tsinformationen zusammengefa t werden Daher ist bei zwei Variablen die Korrespondenzanalyse normalerweise der Mehrfachkorrespondenzanalyse vorzuziehen Ein weiterer Unterschied zwischen den beiden Prozeduren besteht darin dass es sich bei der Eingabe f r die Mehrfachkorrespondenzanalyse um eine Datenmatrix handelt bei der die Zeilen Objekte und die Spalten Variablen sind wohingegen es sich bei der Eingabe f r die Korrespondenzanalyse um d
115. Kunstturnleistungen Jede Zeile stellt eine Leistung dar die Kampfrichter bewerteten jeweils dieselben Leistungen kinship_dat sav Rosenberg und Kim Rosenberg als auch Kim 1975 haben 15 Bezeichnungen f r den Verwandtschaftsgrad untersucht Tante Bruder Cousin Tochter Vater Enkelin Gro vater Gro mutter Enkel Mutter Neffe Nichte Schwester Sohn Onkel Die beiden Analytiker baten vier Gruppen von College Studenten zwei weibliche und zwei m nnliche Gruppen diese Bezeichnungen auf der Grundlage der hnlichkeiten zu sortieren Zwei Gruppen eine weibliche und eine m nnliche Gruppe wurden gebeten die Bezeichnungen zweimal zu sortieren die zweite Sortierung sollte dabei nach einem anderen Kriterium erfolgen als die erste So wurden insgesamt sechs Quellen erzielt Jede Quelle entspricht einer hnlichkeitsmatrix mit 15 x 15 Elementen Die Anzahl der Zellen ist dabei gleich der Anzahl der Personen in einer Quelle minus der Anzahl der gemeinsamen Platzierungen der Objekte in dieser Quelle kinship_ini sav Diese Datendatei enth lt eine Ausgangskonfiguration f r eine dreidimensionale L sung f r kinship_dat sav kinship_var sav Diese Datendatei enth lt die unabh ngigen Variablen gender Geschlecht gener Generation und degree Verwandtschaftsgrad die zur Interpretation der Dimensionen einer L sung f r kinship_dat sav verwendet werden k nnen Insbesondere k nnen sie verwendet werden um den L sungsraum auf eine
116. L sungen mit weniger Dimensionen verborgen bleiben Wie zuvor angemerkt k nnen bei zwei Dimensionen MOBS und PRIMARY GROUPS nicht voneinander getrennt werden Bei einer Erh hung der Dimensionalit t lassen sich die beiden Gruppen jedoch m glicherweise differenzieren Durchf hren der Analyse gt Um eine dreidimensionale L sung zu erzielen m ssen Sie das Dialogfeld Kategoriale Hauptkomponenten erneut aufrufen gt Geben Sie 3 als Anzahl der Dimensionen in der L sung ein Klicken Sie im Dialogfeld Kategoriale Hauptkomponenten auf OK 160 Kapitel 10 Modell bersicht Abbildung 10 15 Modellzusammenfassung Yarianz ber cksichtigt Cronbachs Gesamt Dimension Alpha i der Varianz Gesamtwert a Die Summe von Cronbachs Alpha basiert auf der Summe der Eigenwerte Eine dreidimensionale L sung weist die Eigenwerte 3 424 0 844 und 0 732 auf wodurch fast die gesamte Varianz erkl rt wird Objektwerte Die Objektwerte f r die dreidimensionale L sung werden in einer Streudiagramm Matrix grafisch dargestellt In einer Streudiagramm Matrix wird jede Dimension gegen jede andere Dimension in einer Reihe von zweidimensionalen Streudiagrammen geplottet Beachten Sie Die ersten beiden Eigenwerte in der dreidimensionalen L sung stimmen nicht mit den Eigenwerten in der zweidimensionalen L sung berein Mit anderen Worten Die L sungen sind nicht verschachtelt Da die Eigenwerte in den Dimensionen 2 und 3 nun klein
117. MARY GROUPS als konvexe Kombinationen von PUBLIC CROWDS bzw SECONDARY GROUPS MODERN COMMUNITY Sie werden jedoch wie bereits erw hnt entlang Dimension 1 von den anderen Gruppen getrennt AUDIENCES ist entlang Dimension 1 nicht von den anderen Gruppen getrennt und scheint eine Kombination von CROWDS und MODERN COMMUNITY zu sein Komponentenladungen Abbildung 10 17 Dreidimensionale Komponentenladungen Dimension Intensit t H ufigkeit Frequenz Zugeh rigkeit Entfernung Formalit t Normalisierung mit Yariablen Prinzipal Zu wissen wie die Objekte getrennt sind bedeutet noch nicht dass klar ist welche Variablen welchen Dimensionen entsprechen Dies wird mithilfe der Komponentenladungen ermittelt Die erste Dimension entspricht in erster Linie Zugeh rigkeit Intensit t und Formalit t die zweite Dimension trennt H ufigkeit Frequenz und Entfernung und die dritte Dimension trennt diese Elemente von den anderen Beispiel Symptomatologie von E st rungen E st rungen sind schw chende Krankheiten die mit St rungen im E verhalten schwerer Abweichung des K rperbilds und einer Besessenheit von Gewicht einhergehen die Geist und K rper gleichzeitig betrifft Jedes Jahr sind Millionen von Menschen betroffen wobei Heranwachsende besonders gef hrdet sind Eine Behandlung ist m glich und am hilfreichsten wenn der Zustand fr hzeitig erkannt wird 162 Kapitel 10 Mediziner k nnen versuchen E st rung
118. MENSIONS 2 2 DIFFSTRESS 000001 MINSTRESS 0001 MAXITER 5000 PENALTY LAMBDA 0 5 OMEGA 1 0 PRINT MEASURES COMMON PLOT COMMON TRANSFORMATIONS Mit dieser Syntax wird eine Analyse der Variablen run bis shout angegeben Mit der Variablen rowid werden die Zeilen identifiziert Der Unterbefehl INITIAL gibt an dass die Startwerte aus der Datei behavior_ini sav entnommen werden sollen Die Zeilen und Spaltenkoordinaten sind gestapelt wobei die Spaltenkoordinaten auf die Zeilenkoordinaten folgen Der Unterbefehl CONDITION gibt an dass alle hnlichkeiten miteinander verglichen werden k nnen Dies trifft auf die vorliegende Analyse zu da es m glich sein sollte die hnlichkeiten zwischen dem Laufen in einem Park und dem Laufen in einer Kirche zu vergleichen und zu erkennen dass das eine Verhalten als angemessener als das andere angesehen wird Der Unterbefehl TRANSFORMATION gibt eine lineare Transformation der hnlichkeiten mit einem konstanten Term an Diese Methode ist geeignet wenn ein Unterschied zwischen den hnlichkeiten von 1 Punkt im gesamten Bereich der 10 Punkte Skala quivalent ist Wenn die Lernende ihre Werte so vergeben haben dass der Unterschied zwischen 0 und dem Unterschied zwischen 5 und 6 entspricht ist eine lineare Transformation daher geeignet Mit dem Unterbefehl PLOT werden Diagramme des gemeinsamen Raums und Transformationsdiagramme angefordert F r alle anderen Parameter gelten die S
119. Newspaper read most often music Music preferred live Neighborhood preference math Math test score language Language test score Copyright SPSS Inc 1989 2010 Wertelabel 20 25 26 30 31 35 36 40 41 45 46 50 51 55 56 60 61 65 66 70 Single Married Other No Cat s Dog s Other than cat or dog Various domestic animals None Telegraaf Volkskrant NRC Other Classical New wave Popular Variety Don t like music Town Village Countryside 0 5 6 10 11 15 0 5 6 10 11 15 16 20 199 200 Kapitel 11 Dieses Daten Set finden Sie in verd1985 sav F r weitere Informationen siehe Thema Beispieldateien in Anhang A in IBM SPSS Categories 19 Die ersten sechs Variablen sind relevant diese Variablen sind in drei Sets gegliedert Set 1 umfasst alter und heirat Set 2 besteht aus per und news und in Set 3 finden sich music und live Die Variable per ist mehrfach nominal skaliert die Variable age ordinal Alle anderen Variablen sind einzeln nominal skaliert F r diese Analyse ist eine zuf llige Anfangskonfiguration erforderlich Standardm ig ist diese Anfangskonfiguration numerisch Wird ein Teil der Variablen jedoch als einzeln nominal behandelt ohne dass eine M glichkeit zum Sortieren besteht sollten Sie eine zuf llige Anfangskonfiguration verwenden Bei den meisten Variablen in dieser Untersuchung ist dies der Fall Untersuchen der Daten gt Zum Erstellen einer nichtlinearen kanonis
120. Nominal Numerisch Spline Grad 2 Innere Knoten 2 eter aeerecnen rre W hlen Sie Numerisch als optimales Messniveau f r die Skalierung Klicken Sie auf Weiter gt W hlen Sie Inversion base height bis Day of the year aus und klicken Sie im Dialogfeld Kategoriale Regression auf Skala definieren 124 Kapitel 9 gt gt gt gt Abbildung 9 27 Dialogfeld Skala definieren fH Kategoriale Regression Skala definieren X Messniveau der optimalen Skalierung Spline ordinal Ordinal Spline nominal Nominal Numerisch Spline Grad 2 Innere Knoten 2 Creier aeerecnen tire W hlen Sie Nominal als optimales Messniveau f r die Skalierung Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Regression auf In diskrete umwandeln Abbildung 9 28 Diskretisierung fH Kategoriale Regression Diskretisierung ws Variablen ozon Nicht angegeben ibh Gruppieren Normalverteilung 100 dpg Gruppieren Normalverteilung 10 vis Gruppieren Normalverteilung 10 doy Gruppieren Normalverteilung 10 Methode Gruppieren Y ndern Gruppieren Anzahl Kategorien Verteilung O Normalverteilung Gleichverteilung Gleiche Intervalle ersten te Wahlen Sie ibh aus Wahlen Sie Gleiche Intervalle und geben Sie 100 als Intervall ein Klicken Sie auf Andern Wahlen Sie dpg vis und doy au
121. Normalisierter Stress Stress Inach Kruskal Stress Il nach Kruskal Stress nach Young Stress Il nach Young Erklarte Streuung Erklarte Varianz Ermittelte Bevorzungsordnungen Spearman Rho Kendall Tau b Variation der Ahnlichkeiten Variation der transformierten Ahnlichkeiten Variation der Distanzen Quadratsumme von DeSarbos Indizes f r Vermischung Shepards Index f r Nicht Degeneration 385 8140741 3493640 1 8969229 1212145 3481587 1 0770522 4812632 6871733 3787855 5183498 7174981 6446272 5165230 5590170 6122308 4043695 17571887 7532124 Multidimensionale Entfaltung Der Algorithmus konvergiert nach 385 Iterationen bei einem endgiiltigen penalisierten Stress von 0 8140741 Diese Statistik die mangelhafte G te der Anpassung die G te der Anpassung die Variationskoeffizienten und Shepards Index hneln stark der L sung mit dem klassischen Spearman Start DeSarbos Indizes weichen mit einem Wert von 1 7571887 gegen ber 0 2199287 ab Dies deutet darauf hin dass die L sung mit dem Korrespondenzstart nicht gleich gut vermischt ist Sie k nnen dem verbundenen Diagramm des gemeinsamen Raums entnehmen wie sich dies auf die L sung auswirkt 292 Kapitel 15 Gemeinsamer Raum Abbildung 15 20 Verbundenes Diagramm des gemeinsamen Raums f r Ausgangskonfiguration mit Korrespondenzanalyse Cinnamon toast o Corn muffin and butter O English muffin and uud du N
122. Ordnung wie die urspr nglichen hnlichkeiten auf Sie geben an ob die Bindung von gebundenen hnlichkeiten erhalten bleiben muss oder aufgehoben werden darf m Spline Die transformierten hnlichkeiten sind eine gegl ttete nicht fallende st ckweise polynomiale Transformation der urspr nglichen hnlichkeiten Sie geben den Grad des Polynoms und die Anzahl der inneren Knoten an Transformationen zuweisen Geben Sie an ob nur hnlichkeiten innerhalb jeder Quelle miteinander verglichen werden oder ob die Vergleiche unabh ngig von der Quelle sein sollen Dimensionen Standardm ig wird eine L sung in zwei Dimensionen berechnet Minimum 2 Maximum 2 Geben Sie f r das Minimum und Maximum eine beliebige ganze Zahl zwischen und der Anzahl der Objekte minus 1 an solange das Minimum kleiner oder gleich dem Maximum ist Die Prozedur berechnet eine L sung in der h chsten Dimension und reduziert die Dimensionalit t dann schrittweise bis die niedrigste Dimensionalit t erreicht ist Multidimensionale Skalierung Einschr nkungen Im Dialogfeld Einschr nkungen k nnen Sie Einschr nkungen f r den gemeinsamen Raum festlegen 82 Kapitel 7 Abbildung 7 8 Dialogfeld Einschr nkungen FH Multidimensionale Skalierung Einschrankungen x rEinschr nkungen im gemeinsamen Raum Keine Einschr nkungen Einige Koordinaten sind fest Lineare Kombination der unabh ngigen variablen rEinschr
123. Personen erfasst und Ergebnisse von k nftigen Interaktionen mit Kunden prognostiziert Anschlie end werden diese Erkenntnisse durch die Einbettung der Analysen in Gesch ftsprozesse praktisch umgesetzt L sungen von SPSS Inc sind durch die Konzentration auf die Zusammenf hrung von Analysefunktionen IT Architektur und Gesch ftsprozessen f r zusammenh ngende unternehmens bergreifende Gesch ftsziele konzipiert Kunden aus den Bereichen Wirtschaft Regierung und Wissenschaft vertrauen weltweit auf die Technologie von SPSS Inc als Wettbewerbsvorteil wenn es gilt Kunden anzuziehen zu binden und neue Kunden zu gewinnen und dabei Betrugsf lle zu verringern und Risiken zu entsch rfen SPSS Inc wurde im Oktober 2009 von IBM bernommen Weitere Informationen erhalten Sie unter http www spss com Technischer Support Kunden mit Wartungsvertrag k nnen den Technischen Support in Anspruch nehmen Kunden k nnen sich an den Technischen Support wenden wenn sie Hilfe bei der Arbeit mit den Produkten von SPSS Inc oder bei der Installation in einer der unterst tzten Hardware Umgebungen ben tigen Wie Sie den Technischen Support kontaktieren k nnen entnehmen Sie der Website von SPSS Inc unter http support spss com ber die Website unter http support spss com default asp refpage contactus asp k nnen Sie auch nach Ihrem rtlichen B ro suchen Wenn Sie Hilfe anfordern halten Sie bitte Informationen bereit um sich Ihre Organisation un
124. Pressure gradient mm Hg Visibility miles Temperature degrees F Day of the year Abhangige Variable Daily ozone level Diese Tabelle zeigt die Koeffizienten fiir das Modell in dem Temperature als ordinal skaliert wurde Der Vergleich der Koeffizienten mit den Koeffizienten im Modell bei denen Temperature als nominal skaliert ist zeigt keine weitreichenden Ver nderungen 134 Kapitel 9 Abbildung 9 41 Korrelationen Wichtigkeit und Toleranz Korrelationen und Toleranz Nullte Ordnung Partiell Teil 438 627 288 Inversion base height Pressure gradient mm Hg Visibility miles Temperature degrees F Day of the year Abhangige Variable Daily ozone level Wichtigkeit Toleranz Nach Vor Transformatio Transformatio n n 930 596 Die Ma e f r die Wichtigkeit lassen zudem erkennen dass Temperature immer noch von gr erer Bedeutung f r die Regression ist als die anderen Variablen Als Ergebnis des Messniveaus mit ordinaler Skalierung f r Temperature und des positiven Regressionskoeffizienten k nnen Sie nun jedoch voraussetzen dass der vorhergesagte Ozonwert steigt sobald Temperature ansteigt Abbildung 9 42 Transformationsdiagramm von Temperature ordinal Transformation Temperature degrees F Quantifikationen w gt 4 o o O o NH ka o oO O o oO o Ss 929 w e b an an faz SN gt 2 noo N O o oO O oO oO oO oO oO oO oO Kategori
125. R ume an den Dimensionen des gemeinsamen Raums gezeigt Eine gr ere Gewichtung weist auf eine gr ere Distanz im individuellen Raum und somit auf eine gr ere Unterscheidung zwischen den Objekten in dieser Dimension f r diesen individuellen Raum hin m Spezifit t ist ein Ma der Abweichung eines individuellen Raums vom gemeinsamen Raum Ein individueller Raum der mit dem gemeinsamen Raum identisch ist hat identische Dimensionsgewichtungen und eine Spezifit t von 0 Ein individueller Raum der in einer bestimmten Dimension einzigartig ist weist hingegen eine einzige gro e Dimensionsgewichtung und eine Spezifit t von 1 auf In diesem Fall sind die Quellen mit den gr ten Abweichungen Breakfast with juice bacon and eggs and beverage sowie Snack with beverage only m Wichtigkeit ist ein Ma f r den relativen Anteil jeder Dimension an der L sung In diesem Fall sind die Dimensionen gleich wichtig 287 Multidimensionale Entfaltung Abbildung 15 15 Dimensionsgewichtungen Snack with beverage only Breakfast with bevera ee Breakfast with juice kes sausage and beverage Dimension 2 N 0 1 2 3 4 5 Dimension 1 Das Diagramm der Dimensionsgewichtungen bietet eine Visualisierung der Gewichtungstabelle Breakfast with juice bacon and eggs and beverage und Snack with beverage only befinden sich am n chsten an den Dimensionsachsen sind jedoch beide nicht besonders spezifisch in einer bestimmt
126. Sie k nnen nat rlich einen Namen eigener Wahl angeben oder eine externe Datei schreiben 27 Kategoriale Regression CATREG Kategoriale Regression Transformationsdiagramme Im Dialogfeld Diagramme k nnen Sie die Variablen angeben aus denen Transformationsdiagramme und Residuen Diagramme erzeugt werden Abbildung 2 9 Dialogfeld Diagramme EH Kategoriale Regression Diagramme Transformationsdiagramme le Residuen Diagramme Transformationsdiagramme F r jede dieser Variablen werden die Kategorienquantifikationen anhand der urspr nglichen Kategoriewerte dargestellt Leere Kategorien erscheinen auf der horizontalen Achse haben jedoch keine Auswirkungen auf die Berechnungen Diese Kategorien werden durch Unterbrechungen in der Verbindungslinie zwischen den Quantifikationen gekennzeichnet Residuen Diagramme F r jede dieser Variablen werden Residuen berechnet f r die abh ngige Variable die aus allen Einflu variablen mit Ausnahme der betreffenden Einflu variable prognostiziert wurde anhand der Kategorienummern und der optimalen Kategorienquantifikationen multipliziert mit dem Beta ber Kategorienummern grafisch dargestellt Zus tzliche Funktionen beim Befehl CATREG Sie k nnen die kategoriale Regression Ihren Anforderungen entsprechend anpassen wenn Sie ihre Auswahl in ein Syntax Fenster einf gen und die resultierende Befehlssyntax f r den Befehl CATREG bearbeiten Mit der Bef
127. Sie die Option Einfaches Streudiagramm W hlen Sie Standardisiertes Residuum als y Achsen Variable aus und Package design als x Achsen Variable Klicken Sie auf OK 108 Kapitel 9 Abbildung 9 8 Residuen im Vergleich mit der Verpackungsgestaltung 1 00000 0 00000 1 00000 Standardized Residual 2 00000 1 00 1 50 2 00 2 50 3 00 Package design Die U Form ist im Diagramm der standardisierten Residuen im Vergleich mit der Verpackung st rker ausgepr gt Alle Residuen f r Design B sind negativ bei den anderen beiden Designs sind dagegen alle Residuen bis auf eines positiv Beim linearen Regressionsmodell wird je ein Parameter f r die einzelnen Variablen herangezogen Die Beziehung kann daher nicht ber das Standardverfahren festgehalten werden Kategoriale Regressionsanalyse Der kategoriale Charakter der Variablen und die nichtlineare Beziehung zwischen Preference und Package design legen nahe dass die Regression mit optimalen Werten bessere Ergebnisse liefern w rde als die Regression im Standardverfahren Die U Form der Residuendiagramme weist darauf hin dass Package design nominal behandelt werden sollte Alle anderen Einflussgr en werden auf dem entsprechenden numerischen Skalierungsniveau behandelt Die Antwortvariable verdient besondere Aufmerksamkeit Es sollen die Werte f r Preference vorhergesagt werden Aus diesem Wert sollten so viele Eigenschaften der zugeh rigen Kategorien wie m g
128. Snack with beverage only Imbiss nur mit Getr nk breakfast overall sav Diese Datei enth lt die Daten zu den bevorzugten Fr hst cksartikeln allerdings nur f r das erste Szenario Overall preference Allgemein bevorzugt 309 Beispieldateien broadband_1 sav Hierbei handelt es sich um eine hypothetische Datendatei die die Anzahl der Abonnenten eines Breitband Service nach Region geordnet enth lt Die Datendatei enth lt die monatlichen Abonnentenzahlen f r 85 Regionen ber einen Zeitraum von vier Jahren broadband_2 sav Diese Datendatei stimmt mit broadband_1 sav berein enth lt jedoch Daten f r weitere drei Monate car_insurance_claims sav Ein an anderer Stelle McCullagh als auch Nelder 1989 vorgestelltes und analysiertes Daten Set bezieht sich auf Schadensanspr che f r Autos Die durchschnittliche H he der Schadensanspr che l sst sich mit Gamma Verteilung modellieren Dazu wird eine inverse Verkn pfungsfunktion verwendet um den Mittelwert der abh ngigen Variablen mit einer linearen Kombination aus Alter des Versicherungsnehmers Fahrzeugtyp und Fahrzeugalter in Bezug zu setzen Die Anzahl der eingereichten Schadensanspr che kann als Skalierungsgewicht verwendet werden car_sales sav Diese Datendatei enth lt hypothetische Verkaufssch tzer Listenpreise und physische Spezifikationen f r verschiedene Fahrzeugfabrikate und modelle Die Listenpreise und physischen Spezifikationen wurden von edmu
129. Variablenname Variablenlabel Unteres Ende Wert 1 Oberes Ende Wert 3 oder 4 weight Body weight Outside normal range Normal K rpergewicht Au erhalb des normalen Bereichs mens Menstruation Amenorrhea Amenorrh Regular periods Regelm ige Menstruation Periode fast Restriction of food intake Less than 1200 calories Normal regular meals fasting Einschr nkung Weniger als 1200 Kalorien Normale regelm ige der Nahrungsaufname Mahlzeiten Fasten binge Binge eating Greater than once a week No bingeing Keine Fre attacken Mehr als einmal pro Fre attacken Woche vomit Vomiting Erbrechen Greater than once aweek No vomiting Kein Erbrechen Mehr als einmal pro Woche purge Purging Abf hrmittel Greater than once aweek No purging Keine Mehr als einmal pro Abf hrmittel Woche hyper Hyperactivity Not able to be atrest Kann No hyperactivity Keine Hyperaktivit t nicht zur Ruhe kommen Hyperaktivit t fami Family relations Poor Schlecht Good Gut Familienbeziehungen 163 Kategoriale Hauptkomponentenanalyse Variablenname Variablenlabel Unteres Ende Wert 1 Oberes Ende Wert 3 oder 4 eman Emancipation from Very dependent Sehr Adequate Angemessen family Emanzipation von abh ngig der Familie frie Friends Freunde No good friends Keine Two or more good friends guten Freunde Mindestens zwei gute Freunde school School employment Stopped school work Moderate to good record record Schule
130. Variationen in der vertikalen Dimension als in der horizontalen Dimension auf als sich in der L sung mit linearer Transformation zeigt 306 Kapitel 15 hnlichkeitstransformationen Abbildung 15 34 Transformationsdiagramm f r eine L sung mit ordinaler Transformation w n O w oO oO Transformed Proximity Raw Proximity Unconditional ordinal transformation with ties kept tied Abgesehen von den Werten mit den gr ten hnlichkeiten die gegen ber den restlichen Variablen aufw rts abweichen ist die ordinale Transformation der hnlichkeiten recht linear Auf diese hnlichkeiten ist wahrscheinlich der gr te Teil der Unterschiede zwischen der ordinalen und der linearen L sung zur ckzuf hren Es liegen jedoch nicht gen gend Informationen vor um zu ermitteln ob es sich bei diesem nicht linearen Trend in den h heren Werten um einen tats chlichen Trend oder um eine Anomalie handelt Empfohlene Literatur In den folgenden Texten finden Sie weitere Informationen Busing F M T A P J F Groenen als auch W J Heiser 2005 Avoiding degeneracy in multidimensional unfolding by penalizing on the coefficient of variation Psychometrika 70 Green P E als auch V Rao 1972 Applied multidimensional scaling Hinsdale Ill Dryden Press Price R H als auch D L Bouffard 1974 Behavioral appropriateness and situational constraints as dimensions of social behavior Journal of Personality an
131. Verwendung dieser hnlichkeitswerte und unabh ngiger Variablen z B des Preises kann der Hersteller dann feststellen welche Variablen f r die Produktwahrnehmung durch die Verbraucher wichtig sind und das Image des Produkts entsprechend ndern Statistiken und Diagramme Iterationsprotokoll Stressma e Stress Zerlegung Koordinaten des gemeinsamen Raums Objektdistanzen innerhalb der endg ltigen Konfiguration individuelle Raumgewichtungen individuelle R ume transformierte hnlichkeiten transformierte unabh ngige Variablen Stress Diagramme Streudiagramme des gemeinsamen Raums Streudiagramme der individuellen Raumgewichtungen Streudiagramme des individuellen Raums Transformationsdiagramme Shepard Residuen Diagramme und Transformationsdiagramme f r unabh ngige Variablen Daten Daten k nnen in Form von Distanz Matrizen oder Variablen die in Distanz Matrizen umgewandelt werden bereitgestellt werden Die Matrizen k nnen in einer Spalte oder ber mehrere Spalten formatiert sein Die hnlichkeiten k nnen auf dem Skalierungsniveau der Verh ltnisskala Intervallskala Ordinalskala oder Spline Skala behandelt werden Annahmen Es m ssen mindestens drei Variablen angegeben werden Die Anzahl der Dimensionen darf die Anzahl der Objekte minus 1 nicht bersteigen Bei der Kombination mit mehreren Zufallsstarts wird die Dimensionsreduktion ausgelassen Wenn nur eine Quelle angegeben ist sind alle Modelle quivalent zum Identit
132. Weiter vv v vy y Klicken Sie im Dialogfeld Kategoriale Hauptkomponenten auf OK Die Prozedur ergibt Werte f r die Subjekte mit Mittelwert 0 und Einheitsvarianz und Quantifizierungen der Kategorien die die mittlere quadrierte Korrelation der Subjektwerte und der transformierten Variablen maximieren Bei der vorliegenden Analyse wurden die Kategoriequantifikationen eingeschr nkt sodass sie die ordinalen Informationen widerspiegeln 175 Kategoriale Hauptkomponentenanalyse Schlie lich m ssen Sie die OMS Anforderung beenden um die Informationen aus der Tabelle der projizierten Zentroide in die Datei projected_centroids sav zu schreiben Rufen Sie die OMS Systemsteuerung erneut auf Abbildung 10 31 Ausgabeverwaltungssystem OMS Bedienfeld a Ausgabeverwaltungssystem OMS Bedienfeld a Anforderungen Typen Befehle Beschriftungen Ziel Neue Anforderung Um eine Anforderung hinzuzuf gen w hlen Sie mindestens einen Eintrag aus den unten stehenden Listen sowie Hinzuf gen alle sonstigen gew nschten Eigenschaften aus und klicken Sie auf Hinzuf gen Unter Tabellenuntertypen werden nur Untertypen angezeigt die f r mindestens eine der ausgew hlten Prozeduren verf gbar sind Optionen Tip You can use Ctrl A to select all the entries in a list Ausgabetypen Befehls IDs Tabellen Untertypen f r ausgew hlte Befehle Ausgabeziele B ume SI Agglomeration 4 Keine Diagramme seared feat
133. a 58 Gifi A 1985 PRINCALS Research Report UG 85 02 Leiden Department of Data Theory Universitat Leiden Gower J C als auch J J Meulman 1993 The treatment of categorical information in physical anthropology International Journal of Anthropology 8 Heiser W J als auch J J Meulman 1994 Homogeneity analysis Exploring the distribution of variables and their nonlinear relationships In Correspondence Analysis in the Social Sciences Recent Developments and Applications M Greenacre als auch J Blasius Hgg New York Academic Press Kruskal J B 1978 Factor analysis and principal components analysis Bilinear methods In International Encyclopedia of Statistics W H Kruskal als auch J M Tanur Hgg New York The Free Press Kruskal J B als auch R N Shepard 1974 A nonmetric variety of linear factor analysis Psychometrika 39 Meulman J J 1993 Principal coordinates analysis with optimal transformations of the variables Minimizing the sum of squares of the smallest eigenvalues British Journal of Mathematical and Statistical Psychology 46 Meulman J J als auch P Verboon 1993 Points of view analysis revisited Fitting multidimensional structures to optimal distance components with cluster restrictions on the variables Psychometrika 58 Meulman J J A J Van der Kooij als auch A Babinec 2000 New features of categorical principal components analysis for complicated d
134. a als auch S Puntanen Hgg Tampere Finnland Universitat Tampere Price R H als auch D L Bouffard 1974 Behavioral appropriateness and situational constraints as dimensions of social behavior Journal of Personality and Social Psychology 30 Ramsay J O 1989 Monotone regression splines in action Statistical Science 4 Rao C R 1973 Linear statistical inference and its applications 2nd Hg New York John Wiley and Sons Rao C R 1980 Matrix approximations and reduction of dimensionality in multivariate statistical analysis In Multivariate Analysis Vol 5 P R Krishnaiah Hg Amsterdam North Holland Rickman R N Mitchell J Dingman als auch J E Dalen 1974 Changes in serum cholesterol during the Stillman Diet Journal of the American Medical Association 228 Rosenberg S als auch M P Kim 1975 The method of sorting as a data gathering procedure in multivariate research Multivariate Behavioral Research 10 Roskam E E 1968 Metric analysis of ordinal data in psychology Voorschoten VAM Shepard R N 1962 The analysis of proximities Multidimensional scaling with an unknown distance function I Psychometrika 27 325 Bibliografie Shepard R N 1962 The analysis of proximities Multidimensional scaling with an unknown distance function II Psychometrika 27 Shepard R N 1966 Metric structures in ordinal data Journal of Mathematical Psychology 3 Tenen
135. ablen Rauchgewohnheit mit den Kategorien Nichtraucher Leicht Mittel und Stark werden Werte erwartet die dieser Reihenfolge entsprechen Werden die Kategorien in der Analyse jedoch als Nichtraucher Leicht Stark und Mittel geordnet k nnen Sie die Werte f r Stark und Mittel gleichsetzen und so die Reihenfolge der Kategorien in den Werten beibehalten Die Interpretation der Korrespondenzanalyse hinsichtlich der Distanzen ist abh ngig von der verwendeten Normalisierungsmethode Mit der Korrespondenzanalyse k nnen Sie wahlweise die Differenzen zwischen den Kategorien einer Variablen oder die Differenzen zwischen mehreren Variablen untersuchen Bei der Standard Normalisierung werden die Differenzen zwischen den Zeilen und Spaltenvariablen analysiert Der Algorithmus f r die Korrespondenzanalyse erm glicht viele verschiedene Spielarten Bei der Standard Korrespondenzanalsye werden die Zeilen und Spalten zentriert und es werden Chi Quadrat Distanzen herangezogen Wenn Sie jedoch alternative Zentrierungsoptionen in Kombination mit Euklidischen Distanzen verwenden entsteht eine alternative Repr sentation einer Matrix in einem flachdimensionierten Raum Copyright SPSS Inc 1989 2010 223 224 Kapitel 12 Es werden drei Beispiele vorgestellt Das erste Beispiel umfa t eine relativ kleine Korrespondenztabelle und zeigt die grundlegenden Konzepte dieser Analyse Das zweite Beispiel zeigt die praktische Anwendung im Marketing Bereich Im let
136. achanpassung ist gleich der Varianz der Mehrfachkategorienkoordinaten f r die einzelnen Variablen Diese Ma zahlen entsprechen den Diskriminationsma en bei der Homogenit tsanalyse Aus der Tabelle f r die Mehrfachanpassung geht hervor bei welchen 210 Kapitel 11 Variablen der h chste Diskriminationswert vorliegt Beispiel Betrachten Sie die Tabelle der Mehrfachanpassung f r Marital status und Newspaper read most often Die Summe der Anpassungswerte ber die beiden Dimensionen ist gleich 1 122 f r Marital status und 0 911 f r Newspaper read most often Diese Information bedeutet dass der Familienstand einer Person einen h heren Diskriminationswert liefert als die abonnierte Zeitung Die Einzelanpassung entspricht der quadrierten Gewichtung f r die einzelnen Variablen und ist gleich der Varianz bei den Einzelkategoriekoordinaten Die Gewichtungen sind daher gleich den Standardabweichungen der Einzelkategoriekoordinaten Aus der Aufteilung der Einzelanpassung auf die verschiedenen Dimensionen geht hervor dass die Diskrimination der Variablen Newspaper read most often haupts chlich in der ersten Dimension erfolgt die Diskrimination der Variablen Marital status dagegen nahezu vollst ndig in der zweiten Dimension Die Kategorien von Newspaper read most often sind also in der ersten Dimension weiter voneinander entfernt als in der zweiten f r Marital status gilt dagegen der umgekehrte Fall Im Gegensatz dazu findet die Diskrimination
137. al Language test score l variablen live 1 Ordinal Bereich definieren Dimensionen in der L sung W hlen Sie Music preferred und Neighborhood preference als Variablen f r das dritte Set aus gt Wahlen Sie music aus und klicken Sie auf Bereich und Skala definieren Abbildung 11 9 Dialogfeld Bereich und Skala definieren fH OVERALS Bereich und Skala x Minimum 1 Maximum b Messniveau Ordinal Mehrfach nominal Einzeln nominal Diskret numerisch rear aosresren ture gt Geben Sie 5 als H chstwert f r diese Variable ein W hlen Sie Einzeln nominal als Messniveau aus Klicken Sie auf Weiter W hlen Sie im Dialogfeld Nichtlineare kanonische Korrelationsanalyse die Variable live aus und klicken Sie auf Bereich und Skala definieren 205 vy v v y vy v v yv Abbildung 11 10 Dialogfeld Bereich und Skala definieren fff OVERALS Bereich und Skala Minimum 1 Maximum Messniveau Ordinal Mehrfach nominal Einzeln nominal Diskret numerisch E na im Geben Sie 3 als H chstwert f r diese Variable ein W hlen Sie Einzeln nominal als Messniveau aus Klicken Sie auf Weiter Nichtlineare kanonische Korrelationsanalyse Klicken Sie im Dialogfeld Nichtlineare kanonische Korrelationsanalyse auf Optionen Abbildung 11 11 Dialogfeld Optionen OVERALS Optionen rA
138. alt 2 S den 2 Vertreter 22 zweiundzwanzig Jahre alt 3 Osten 3 Manager 25 f nfundzwanzig Jahre alt 4 Westen 27 siebenundzwanzig Jahre alt 3 Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten Die angezeigten Werte stehen f r die Kategorien der einzelnen Variablen Region ist eine nominale Variable Die Variable Region weist vier Kategorien ohne implizierte Reihenfolge auf Die Werte 1 bis 4 stehen einfach f r die vier Kategorien das Kodierungsschema ist v llig willk rlich T tigkeit dagegen k nnte als ordinale Variable betrachtet werden Die urspr nglichen Kategorien stellen eine Steigerung vom Praktikanten bis hin zum Manager dar H here Codewerte stehen f r eine T tigkeit die auf der innerbetrieblichen Karriereleiter weiter oben liegt Es ist jedoch nur die Reihenfolge bekannt ber den Abstand zwischen benachbarten Kategorien wird nichts ausgesagt Im Gegensatz dazu kann Alter als numerische Variable betrachtet werden Bei Alter haben die Abst nde zwischen den Werten eine implizite Bedeutung Der Abstand zwischen 20 und 22 ist genauso gro wie der Abstand zwischen 25 und 27 wohingegen der Abstand zwischen 22 und 25 gr er als die beiden anderen ist Auswahl des Messniveaus der optimalen Skalierung Es ist wichtig zu begreifen dass es keine intrinsischen Eigenschaften einer Variablen gibt die automatisch vordefinieren welches Messniveau der optimalen Skalierung daf r
139. analyse Die Mehrfachkorrespondenzanalyse quantifiziert nominale kategoriale Daten durch Zuweisung numerischer Werte zu den F llen Objekten und Kategorien sodass Objekte in derselben Kategorie eng beieinander und Objekte in verschiedenen Kategorien weit voneinander entfernt liegen Jedes Objekt liegt so nah wie m glich an den Kategoriepunkten der Kategorien die f r dieses Objekt gelten So unterteilen die Kategorien die Objekte in homogene Untergruppen Variablen werden als homogen betrachtet wenn sie Objekte die in denselben Kategorien vorliegen auch in dieselben Untergruppen einordnen Beispiel Mithilfe der Mehrfachkorrespondenzanalyse k nnte die Beziehung zwischen Berufsgruppe Minderheit und Geschlecht grafisch dargestellt werden Unter Umst nden stellt sich dabei heraus dass Minderheit und Geschlecht im Gegensatz zur Berufsgruppe klare Unterscheidungsmerkmale f r Personen darstellen Au erdem k nnte sich ergeben dass die Kategorien Latino und Afro Amerikaner einander sehr hnlich sind Statistiken und Diagramme Objektwerte Diskriminationsma e Iterationsprotokoll Korrelationen der urspr nglichen und transformierten Variablen Kategorienquantifikationen deskriptive Statistiken Objektpunktdiagramme Biplots Kategoriendiagramme verbundene Kategoriendiagramme Transformationsdiagramme und Diskriminationsma Protokolle Daten Werte von String Variablen werden immer in aufsteigender alphanumerischer Reihenfolge
140. analysis of categorical data 2nd Hg Leiden DSWO Press Horst P 1961 Generalized canonical correlations and their applications to experimental data Journal of Clinical Psychology 17 Horst P 1961 Relations among m sets of measures Psychometrika 26 Kettenring J R 1971 Canonical analysis of several sets of variables Biometrika 58 Van der Burg E 1988 Nonlinear canonical correlation and some related techniques Leiden DSWO Press Van der Burg E als auch J De Leeuw 1983 Nonlinear canonical correlation British Journal of Mathematical and Statistical Psychology 36 Van der Burg E J De Leeuw als auch R Verdegaal 1988 Homogeneity analysis with k sets of variables An alternating least squares method with optimal scaling features Psychometrika 53 Verboon P als auch I A Van der Lans 1994 Robust canonical discriminant analysis Psychometrika 59 Kapitel Korrespondenzanalyse Eine Korrespondenztabelle ist jede Zweifach Tabelle deren Zellen eine gewisse Korrespondenz zwischen den Zeilen und Spalten zeigen Das Korrespondenzma kann ein Hinweis auf die hnlichkeit Affinit t Konfusion Assoziation oder Wechselwirkung zwischen den Zeilen und Spaltenvariablen sein Ein sehr h ufiger Typ einer Korrespondenztabelle ist eine Kreuztabelle bei der die Zellen H ufigkeitsz hlungen enthalten Diese Tabellen k nnen schnell und einfach mit der Prozedur Kreuztabellen erstellt werde
141. andeln Der Standardwert ist 1 63 Mehrfachkorrespondenzanalyse Mehrfachkorrespondenzanalyse Diskretisierung Im Dialogfeld Kategoriale Hauptkomponenten Diskretisierung k nnen Sie eine Methode zum Umkodieren der Variablen festlegen Sofern nicht anders angegeben werden Variablen mit Dezimalwerten in sieben Kategorien gruppiert die nahezu normalverteilt sind Wenn die Variable weniger als sieben unterschiedliche Werte aufweist entspricht die Anzahl der Kategorien der Anzahl der unterschiedlichen Werte Werte von String Variablen werden immer in positive ganze Zahlen umgewandelt indem in aufsteigender alphanumerischer Reihenfolge Kategorienummern zugewiesen werden Die Diskretisierung von String Variablen erfolgt anhand dieser Ganzzahlen Andere Variablen werden in der Standardeinstellung nicht modifiziert Die diskretisierten Variablen werden dann in der Analyse verwendet Abbildung 6 4 Diskretisierung FEA MCA Diskretisierung Variablen head Nicht angegeben indhead Nicht angegeben bottom Nicht angegeben brass Nicht angegeben length Nicht angegeben Gruppieren Anzahl Kategorien Verteilung Normalverteilung Gleichvertverteilung Gleiche Intervalle Gase Can Methode Verf gbar sind die Optionen Gruppieren Einstufen oder Multiplizieren Gruppierung Hierbei werden die Daten in eine bestimmte Anzahl von Kategorien oder nach Intervall umkod
142. andelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Kaufhauses geht die Wirksamkeit einer k rzlich durchgef hrten Kreditkarten Werbeaktion einzusch tzen Dazu wurden 500 Karteninhaber nach dem Zufallsprinzip ausgew hlt Die H lfte erhielt eine Werbebeilage die einen reduzierten Zinssatz f r Eink ufe in den n chsten drei Monaten ank ndigte Die andere H lfte erhielt eine Standard Werbebeilage customer_dbase sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Unternehmens geht das die Informationen in seinem Data Warehouse nutzen m chte um spezielle Angebote f r Kunden zu erstellen die mit der gr ten Wahrscheinlichkeit darauf ansprechen Nach dem Zufallsprinzip wurde eine Untergruppe des Kundenstamms ausgew hlt Diese Gruppe erhielt die speziellen Angebote und die Reaktionen wurden aufgezeichnet customer_information sav Eine hypothetische Datendatei mit Kundenmailingdaten wie Name und Adresse customer_subset sav Eine Teilmenge von 80 F llen aus der Datei customer_dbase sav customers_model sav Diese Datei enth lt hypothetische Daten zu Einzelpersonen auf die sich eine Marketingkampagne richtete Zu diesen Daten geh ren demografische Informationen eine bersicht ber die bisherigen Eink ufe und die Angabe ob die einzelnen Personen auf die Kampagne ansprachen oder nicht Jeder Fall entspricht einer Einzelperson 311 Beispieldateien
143. anonical correlations and their applications to experimental data Journal of Clinical Psychology 17 Horst P 1961 Relations among m sets of measures Psychometrika 26 Isra ls A 1987 Eigenvalue techniques for qualitative data Leiden DSWO Press Kennedy R C Riquier als auch B Sharp 1996 Practical applications of correspondence analysis to categorical data in market research Journal of Targeting Measurement and Analysis for Marketing 5 Kettenring J R 1971 Canonical analysis of several sets of variables Biometrika 58 Kruskal J B 1964 Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis Psychometrika 29 Kruskal J B 1964 Nonmetric multidimensional scaling A numerical method Psychometrika 29 Kruskal J B 1965 Analysis of factorial experiments by estimating monotone transformations of the data Journal of the Royal Statistical Society Series B 27 Kruskal J B 1978 Factor analysis and principal components analysis Bilinear methods In International Encyclopedia of Statistics W H Kruskal als auch J M Tanur Hgg New York The Free Press Kruskal J B als auch R N Shepard 1974 A nonmetric variety of linear factor analysis Psychometrika 39 Krzanowski W J als auch F H C Marriott 1994 Multivariate analysis Part I distributions ordination and inference London Edward Arnold Lebart L A Morineau als auch K M Warwi
144. are Regression auf OK 105 Kategoriale Regression Modell bersicht Abbildung 9 4 Modellzusammenfassung f r lineare Regression nach dem Standardverfahren Modellzusammenfassung Standardf Korrigiertes ehler des R Quadrat R Quadrat Sch tzers 3 99810 a Einflu variablen Konstante Good Housekeeping seal Price Money back guarantee Brand name Package design b Abh ngige Variable Preference Die lineare Regression ist das Standardverfahren zum Beschreiben der Beziehungen in diesem Problem Das am weitesten verbreitete Ma f r die Anpassungsg te des Regressionsmodells ist R2 Diese Statistik zeigt inwieweit die Varianz in der Antwort durch die gewichtete Kombination der Einflussgr en erl utert wird Je dichter R an 1 liegt desto h her ist die Anpassungsg te des Modells Die Regression von Preference auf die f nf Einflussgr en f hrt zu einem Wert von 0 707 f r R2 Dies bedeutet dass etwa 71 der Varianz in der Einstufung der Bevorzugung durch die Einflussgr en in der linearen Regression erkl rt werden Koeffizienten Die standardisierten Koeffizienten sind in der Tabelle aufgef hrt Das Vorzeichen der Koeffizienten zeigt ob die vorhergesagte Antwort ansteigt oder abf llt wenn die Einflussgr e w chst und alle anderen Einflussgr en konstant bleiben Bei kategorialen Daten geht die Bedeutung eines Anstiegs bei einer Einflussgr e aus der Kodierung der Kategorien hervor Ein Anstieg b
145. arman Start beteiligt sodass die Zeilen und Spaltenobjekte auf der vertikalen Achse etwas weniger und auf der horizontalen Achse etwas mehr Variation aufweisen 295 Multidimensionale Entfaltung Abbildung 15 23 Verbundenes Diagramm des individuellen Raums Snack with beverage only f r Ausgangskonfiguration mit Korrespondenzanalyse Cinnamon toast 10 o e Corn muffin and butter English muffin and margarine O Einmarmonigun Bene ate and margarine 5 Glazed donut Er ehr 04 30 amp 016 28 Jelly donut 15 RIED on g 23 go 18 34 Coffee cake ER 013 Danish pastry 25 as 17 912 o 02427 29 31 039 11 en 040 38 41 Dimension 2 5 3 Buttered toast and aTa ar o Buttered toast Toast and marmalade Hard rolls and butter Toast and margarine OToast pop up Dimension 1 Im verbundenen Diagramm des individuellen Raums Snack with beverage only ist zu erkennen dass die Zeilen und Spaltenobjekte dichter an einer vertikalen Linie liegen als beim klassischen Spearman Start Beispiel Untersuchen der Angemessenheit von Verhaltensweisen in bestimmten Situationen In einem klassischen Beispiel Price als auch Bouffard 1974 wurden 52 Sch ler Studenten gebeten die Kombinationen aus 15 Situationen und 15 Verhaltensweisen auf einer 10 Punkte Skala von 0 ausgesprochen angemessen bis 9 ausgesprochen unangemessen zu bewerten Die Werte werden ber die einzelnen Personen gemittelt und als Un
146. ata sets including data mining In Classification Automation and New Media W Gaul als auch G Ritter Hgg Berlin Springer Verlag Meulman J J A J Van der Kooij als auch W J Heiser 2004 Principal components analysis with nonlinear optimal scaling transformations for ordinal and nominal data In Handbook of Quantitative Methodology for the Social Sciences D Kaplan Hg Thousand Oaks Kalifornien Sage Publications Inc Theunissen N C M J J Meulman A L Den Ouden H M Koopman G H Verrips S P Verloove Vanhorick als auch J M Wit 2003 Changes can be studied when the measurement instrument is different at different time points Health Services and Outcomes Research Methodology 4 198 Kapitel 10 Tucker L R 1960 Intra individual and inter individual multidimensionality In Psychological Scaling Theory amp Applications H Gulliksen als auch S Messick Hgg New York John Wiley and Sons Vlek C als auch P J Stallen 1981 Judging risks and benefits in the small and in the large Organizational Behavior and Human Performance 28 Wagenaar W A 1988 Paradoxes of gambling behaviour London Lawrence Erlbaum Associates Inc Young F W Y Takane als auch J De Leeuw 1978 The principal components of mixed measurement level multivariate data An alternating least squares method with optimal scaling features Psychometrika 43 Zeijl E Y te Poel M du Bois Reymond
147. ategorien eingeordnet werden und wirken sich nicht auf die Berechnungen aus Bei mehrfach nominalen Variablen erhalten die einzelnen Kategorien jeweils eine andere Quantifikation in den verschiedenen Dimensionen Bei allen anderen Transformationstypen besitzt jede Kategorie nur eine einzige Quantifikation unabh ngig von der Anzahl der Dimensionen in der L sung Jedes Set von Einzelkategoriekoordinaten stellt die Position der Kategorie auf einer Linie im Objektraum dar Die Koordinaten einer gegebenen Kategorie entsprechen der Quantifikation multipliziert mit der Dimensionsgewichtungen f r die Variable Beispiel In der Tabelle f r Age in years entsprechen die Einzelkategoriekoordinaten f r die Kategorie 56 60 0 142 0 165 der Quantifikation 0 209 multipliziert mit den Gewichtungen 0 680 0 789 Die Mehrfachkategoriekoordinaten f r Variablen die als einzeln nominal ordinal oder numerisch behandelt werden stellen die Koordinaten der Kategorien im Objektraum vor dem Anwenden von ordinalen oder linearen Einschr nkungen dar Diese Werte sind 214 Kapitel 11 Verlustminimierungen ohne Nebenbedingungen Bei mehrfach nominalen Variablen repr sentieren diese Koordinaten die Quantifikationen der Kategorien Der Vergleich der Einzelkategoriekoordinaten mit den Mehrfachkategoriekoordinaten zeigt wie sich die Einschr nkungen auf die Beziehung zwischen den Kategorien und deren Quantifikationen auswirken In der ersten Dimension sinken die Me
148. ation aus Klicken Sie auf Weiter Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf Diagramme 298 Kapitel 15 Abbildung 15 27 Dialogfeld Diagramme E Multidimensionale Entfaltung Diagramme s Diagramme BB Mehrere Starts 4 Endg ttiger gemeinsamer Raum V Transformationsdiagramme Anf nglicher gemeinsamer Raum Mw Raumgewichtungen E Shepard Diagramme A Stress pro Dimension ja Individueller Raum E Streudiagramm der Anpassung Residuen Diagramme Sieti zalen o cs Farben gt Markierungen Diagramme der Quellen Quellen ausw hlen Hinzuf gen Quellennummer Andern Entfernen O Alle Quellen Quellen Zeilendiagramme Alle Zeilen Zeilen ausw hlen Hinzuf gen Zeilennummer Andern Entfernen eier averecnen re W hlen Sie in der Gruppe Diagramme die Option Transformationsdiagramme Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf OK Im Folgenden finden Sie die durch diese Optionen generierte Befehlssyntax PREFSCAL VARIABLES Run Talk Kiss Write Eat Sleep Mumble Read Fight Belch Argue Jump Cry Laugh Shout INPUT ROWS ROWID INITIAL samplesDirectory behavior_ini sav diml dim2 CONDITION UNCONDITIONAL TRANSFORMATION LINEAR INTERCEPT PROXIMITIES DISSIMILARITIES MODEL IDENTITY 299 Multidimensionale Entfaltung CRITERIA DI
149. ature degrees 8 Day of the year Quanti 8E Daily ozone level Quan 8E Inversion base height 8 Pressure gradient mm 8 Temperature degrees Soll eine kategoriale Regression von Daily ozone level ber Day of the year erstellt werden rufen Sie erneut das Dialogfeld Kategoriale Regression auf Deaktivieren Sie Inversion base height bis Temperature degrees F als unabh ngige Variablen W hlen Sie Day of the year als unabh ngige Variable aus Klicken Sie auf Skala definieren Abbildung 9 51 Dialogfeld Skala definieren A Kategoriale Regression Skala definieren K Messniveau der optimalen Skalierung Spline ordinal Ordinal Spline nominal Nominal Numerisch Innere Knoten 2 eter a sreeten rire W hlen Sie Nominal als optimales Messniveau f r die Skalierung gt Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Kategoriale Regression auf In diskrete umwandeln 142 Kapitel 9 Abbildung 9 52 Diskretisierung iii Kategoriale Regression Diskretisierung X variablen ozon Nicht angegeben doy Gruppieren 10 Gruppieren Anzahl Kategorien _ Verteilung Normalverteilung Gleichverteilung Gleiche Intervalle ho a 10 W hlen Sie doy aus Wahlen Sie Gleiche Intervalle Geben Sie 10 als L nge f r das Intervall ein Klicken Sie auf ndern Klicken Sie auf Weiter vy vyv vy Vy v
150. aufweisen Die zweite Dimension macht daher einen Kontrast zwischen diesen beiden Variablen deutlich wohingegen sie kaum in Bezug zu den quantifizierten Variablen Interaktion und H ufigkeit Frequenz steht Abbildung 10 13 Komponentenladungen 1 0 Entfernung 0 5 Formalit t N c 7 c w E 00 a ganat Frequenz 0 5 Zugeh rigkeit 00 02 04 06 08 10 Dimension 1 Um die Relation zwischen Objekten und Variablen zu untersuchen betrachten Sie den Biplot der Objekte und Komponentenladungen Der Vektor einer Variablen weist in die Richtung der h chsten Kategorie der Variablen F r Entfernung und Zugeh rigkeit sind die h chsten 159 Kategoriale Hauptkomponentenanalyse Kategorien nah bzw hoch Daher zeichnen sich CROWDS durch physische N he und kein Zugeh rigkeitsgef hl aus wohingegen SECONDARY GROUPS durch weite physische Entfernung und ein hohes Zugeh rigkeitsgef hl charakterisiert sind Abbildung 10 14 Biplot CR 104 Dimension 2 O54 PU 0 MIT 1 5 1 0 Dimension 1 Zus tzliche Dimensionen 0 5 0 0 Entfernung Zageh rigkeit 0 5 H ufigkeit ERDAS 1 0 Objekte beschriftet mit Cluster Objekte die anhand der O Skala der Ladungen korrigiert wurden kam panentienlackingen Durch die Erh hung der Anzahl der Dimensionen wird der Umfang der erkl rten Variation erh ht und es k nnen eventuell Unterschiede aufgedeckt werden die bei
151. aximalzahl der tterationen 5000 Zentroide Penalisierungsterm Zufallsstarts Starke Anpassen Bereich rAngepasste Konfiguration gt Wahlen Sie im Gruppenfeld Ausgangskonfiguration die Option Korrespondenz Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf OK Im Folgenden finden Sie die durch diese Optionen generierte Befehlssyntax PREFSCAL VARIABLES TP BT EMM JD CT BMM HRB TMd BTJ TMn CB DP GD CC CMB INPUT SOURCES srcid INITIAL CORRESPONDENCE TRANSFORMATION NONE PROXIMITIES DISSIMILARITIES CRITERIA DIMENSIONS 2 2 DIFFSTRESS 000001 MINSTRESS 0001 MAXITER 5000 PENALTY LAMBDA 0 5 OMEGA 1 0 PRINT MEASURES COMMON PLOT COMMON WEIGHTS INDIVIDUAL ALL Die einzige nderung besteht im Unterbefehl INITIAL Die Ausgangskonfiguration wurde als CORRESPONDENCE festgelegt Dabei werden die Ergebnisse einer Korrespondenzanalyse der invertierten Daten hnlichkeiten anstelle von Un hnlichkeiten mit symmetrischer Normalisierung der Zeilen und Spaltenwerte verwendet 291 Abbildung 15 19 Ma e f r Ausgangskonfiguration mit Korrespondenzanalyse lterationen Me werte GLM Repeated Measures Endg ltiger Funktionswert Wertteile der Funktion Fehlende Anpassung G te der Anpassung Yariationskoeffizienten Indizes f r Degeneration Stressteil Penalisierungsteil
152. betr gt Gruppierung Folgende Optionen sind bei der Diskretisierung von Variablen durch Gruppierung verf gbar m Anzahl Kategorien Geben Sie eine Anzahl von Kategorien an Legen Sie au erdem fest ob die Werte der Variablen ber die Kategorien ungef hr normal oder gleichverteilt werden sollen m Gleiche Intervalle Die Variablen werden in Kategorien umkodiert die durch diese gleich gro en Intervalle definiert werden Sie m ssen die Gr e der Intervalle angeben Kategoriale Hauptkomponenten Fehlende Werte Im Dialogfeld Kategoriale Hauptkomponenten Fehlende Werte k nnen Sie die Strategie f r die Verarbeitung von fehlenden Werten in den Analyse und Zusatzvariablen festlegen 34 Kapitel 3 Abbildung 3 5 Dialogfeld Fehlende Werte EH Kategoriale Hauptkomponenten Fehlende Werte r Strategie f r fehlenden Werte Analysevariablen fast Verte ausschlie en Modalwert binge Verte ausschlie en Modalwert vomit Verte ausschlie en Modalwert purge VVerte ausschlie en Modalwert hyper VVerte ausschlie en Modalwert tami Verte ausschlie en Modalwert eman VVerte ausschlie en Modalwert frieQVerte ausschlie en Modalwert Zusatzvariablen mens VVerte ausschlie en Modalwert Aen r Strategie Fehlende VYerte ausschlie en f r Korrelationen nach Quantifizierung berechnen Modalwert Zusatzkategorie Fehlende Werte berechnen Om Objekte mit
153. ccc cen ee ee nee ene nen 24 Kategoriale Regression Speichern 00 000 eects 26 Kategoriale Regression Transformationsdiagramme 0 00 cece cece nee 27 Zus tzliche Funktionen beim Befehl CATREG 0 0 0 c cece eee eee eee 27 3 Kategoriale Hauptkomponentenanalyse CATPCA Skala und Gewicht definieren in CATPCA 00 cece ee Kategoriale Hauptkomponenten Diskretisierung 0 0 c eee eee eee eee Kategoriale Hauptkomponenten Fehlende Werte 0 cc cece eee eee eee Kategoriale Hauptkomponenten Optionen 0 00 c cece ee eee Kategoriale Hauptkomponenten Ausgabe ccc ccc cee eee ee eee eee Kategoriale Hauptkomponenten Speichern 000 cece eee eee eee eee Kategoriale Hauptkomponenten Objekt und Variablendiagramme Kategoriale Hauptkomponenten Kategoriendiagramme 0 00 eee eee eee Kategoriale Hauptkomponentenanalyse Ladungsdiagramme 00000 e ee aee Zus tzliche Funktionen beim Befehl CATPCA 0 00 c cece eee eee 4 Nichtlineare kanonische Korrelationsanalyse OVERALS Bereich und Skala definieren 1 0 ce eect e teen tenes Bereich definieren Probit Analysis MANOVA 2 22 0 cc eee eee eee eens Nichtlineare kanonische Korrelationsanalyse Optionen 20 0eee eee Zus tzliche Funktionen beim Befehl OVERALS 0 0 cc cece ee eee 5 Korrespondenzanalys
154. ch Marke mit hohem Koffein Menschen Koffeingehalt Sehr erfrischend frisch Neue Marke neu Marke f r Yuppies Yuppies Marke f r attraktive attraktiv Menschen Nahrhafte Marke n hrstoffreich Schwere Marke schwer Marke f r Frauen Frauen Popul re Marke popul r Gering vertretene Marke gering Zu Beginn konzentrieren Sie sich darauf wie die Attribute miteinander zusammenh ngen und in welchem Zusammenhang die Marken stehen Mit der Prinzipal Normalisierung wird die Gesamttr gheit einmal ber die Zeilen und einmal ber die Spalten gestreut So steht zwar die Biplot Interpretation nicht mehr zur Verf gung aber die Distanzen zwischen den Kategorien der einzelnen Variablen k nnen untersucht werden Durchf hren der Analyse gt Gem dem Aufbau der Daten m ssen die F lle nach der Variablen H ufigke gewichtet werden W hlen Sie hierzu die folgenden Befehle aus den Men s aus Daten gt F lle gewichten 226 Kapitel 12 Abbildung 12 1 Dialogfeld F lle gewichten E Fane gewichten MMM F lle nicht gewichten F lle gewichten mit e H ufigkeitsvariable amp image amp brand Aktueller Status F lle gewichten nachtreq F lle gewichten nach H ufigke Klicken Sie auf OK gt Zum Erstellen einer anf nglichen L sung in f nf Dimensionen mit Prinzipal Normalisierung w hlen Sie die folgenden Befehle aus den Men s aus Analysieren gt Dimensionsreduzierung gt Korr
155. ch die Einflu variablen kategorial sind werden h ufig loglineare Modelle verwendet Die Regression mit optimaler Skalierung bietet drei Messniveaus f r die Skalierung der einzelnen Variablen Durch Kombinationen dieser Niveaus kann eine gro e Bandbreite an nichtlinearen Beziehungen behandelt werden f r die eine einzelne Standard Methode nicht geeignet ist Folglich bietet die optimale Skalierung eine gr ere Flexibilit t als die Standardans tze bei kaum h herer Komplexit t Au erdem werden durch nichtlineare Transformationen der Einflu variablen normalerweise die Abh ngigkeiten zwischen den einzelnen Einflu variablen verringert Wenn Sie die Eigenwerte der Korrelationsmatrix f r die Einflu variablen mit den Eigenwerten der Korrelationsmatrix f r die optimal skalierten Einflu variablen vergleichen ist die zweite Gruppe zumeist weniger variabel als die erste Mit anderen Worten bei der kategorialen Regression werden durch die optimale Skalierung die gro en Eigenwerte der Korrelationsmatrix f r die Einflu variablen kleiner und die kleinen Eigenwerte gr er 9 Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten Kategoriale Hauptkomponentenanalyse Die kategoriale Hauptkomponentenanalyse ist am besten geeignet wenn Variationsmuster in einem einzelnen Set von Variablen mit gemischten Messniveaus der optimalen Skalierung ber cksichtigt werden sollen Dieses Verfahren versucht die Dimens
156. che Quelle mit einer ungew hnlich gro en Dimensionsgewichtung und anderen Gewichtungen nahe null hin b Relative Wichtigkeit jeder Dimension als Verh ltnis der Quadratsumme einer Dimension zur Gesamtquadratsumme In der Ausgangskonfiguration mit Korrespondenzanalyse weist jeder individuelle Raum eine h here Spezifit t auf d h die Situationen in denen die Teilnehmer den Fr hst cksartikeln ordneten sind st rker einer bestimmten Dimension zugeordnet Die Quellen mit den gr ten Abweichungen bleiben Breakfast with juice bacon and eggs and beverage und Snack with beverage only 294 Kapitel 15 Abbildung 15 22 Verbundenes Diagramm des individuellen Raums Breakfast with juice bacon and eggs and beverage f r Ausgangskonfiguration mit Korrespondenzanalyse Cinnamon toast Corn muffin and butter j English muffin ang margarine Cinnamon bun Biuebery muffin and margarine CHG AA o 15 30 214018 28 Jelly donut 945 7 2033 o 5 0424 7 00 o 06 1 O fe Danish pastry 08 917 B58 27 29 e 00 Dimension 2 1 35 0248 O 54037 Toast pop up Buttered toast and jelly 3g 32 Buttered toast 5 Toast and marmalade Toast and margarine Hard rolls and butter Dimension 1 Die h here Spezifit t ist im verbundenen Diagramm des individuellen Raums Breakfast with Juice bacon and eggs and beverage klar zu erkennen Die Quelle ist noch st rker an der ersten Dimension als beim klassischen Spe
157. chen Korrelationsanalyse f r dieses Daten Set w hlen Sie die folgenden Befehle aus den Men s aus Analysieren gt Dimensionsreduktion gt Optimale Skalierung Abbildung 11 1 Dialogfeld Optimale Skalierung EH Optimale Skalierung rMessniveau der optimalen Skalierung Alle Variablen sind mehrfach nominal Einige Variablen sind nicht mehrfach nominal Anzahl der Yariablen Sets Ein Set Mehrere Sets rAusgew hlte Analyse Nichtlineare kanonische Korrelation Ge on me W hlen Sie im Gruppenfeld Messniveau der optimalen Skalierung die Option Einige Variablen sind nicht mehrfach nominal gt W hlen Sie in der Gruppe Anzahl der Variablen Sets die Option Mehrere Sets Klicken Sie auf Definieren 201 Abbildung 11 2 Dialogfeld Nichtlineare kanonische Korrelationsanalyse rset1 von1 amp Pets owned pet Zur ck amp Newspaper read most amp b Music preferred music Variablen d Neighborhood prefere cil Math test score math all Language test score l marital 1 Ordinal Nichtlineare kanonische Korrelationsanalyse fa Nichtlineare kanonische Korrelationsanalyse OVERALS Z Beschriftung f r Diagramme der Objektwerte W hlen Sie Age in years und Marital status als Variablen f r das erste Set W hlen Sie age aus und klicken Sie auf Bereich und Skala definieren Abbildung 11
158. ck 1984 Multivariate descriptive statistical analysis New York John Wiley and Sons Lingoes J C 1968 The multivariate analysis of qualitative data Multivariate Behavioral Research 3 Max J 1960 Quantizing for minimum distortion Proceedings IEEE Information Theory 6 McCullagh P als auch J A Nelder 1989 Generalized Linear Models 2nd Hg London Chapman amp Hall Meulman J J 1982 Homogeneity analysis of incomplete data Leiden DSWO Press Meulman J J 1986 A distance approach to nonlinear multivariate analysis Leiden DSWO Press Meulman J J 1992 The integration of multidimensional scaling and multivariate analysis with optimal transformations of the variables Psychometrika 57 324 Bibliografie Meulman J J 1993 Principal coordinates analysis with optimal transformations of the variables Minimizing the sum of squares of the smallest eigenvalues British Journal of Mathematical and Statistical Psychology 46 Meulman J J 1996 Fitting a distance model to homogeneous subsets of variables Points of view analysis of categorical data Journal of Classification 13 Meulman J J 2003 Prediction and classification in nonlinear data analysis Something old something new something borrowed something blue Psychometrika 4 Meulman J J als auch W J Heiser 1997 Graphical display of interaction in multiway contingency tables by use of homogeneity analysis I
159. cken Sie im Dialogfeld Multidimensionale Skalierung auf OK Stressma e Die Stress und Anpassungsma e lassen erkennen inwieweit sich die Distanzen in der L sung den urspr nglichen Distanzen n hern Abbildung 14 13 Stress und Anpassungsma e Normalisierter Roh Stress Stress l Stress ll S Stress Erkl rte Streuung D A F Kongruenzkoeffizient nach Tucker PROXSCAL minimiert den normalisierten Roh Stress a Faktor f r optimale Skalierung 1 066 b Faktor f r optimale Skalierung 984 265 Multidimensionale Skalierung Jedes der vier Stress Statistikma e misst die mangelnde Anpassung der Daten die ber cksichtigte Streuung und der Kongruenzkoeffizient nach Tucker messen dagegen die Anpassung Niedrigere Stressma e bis zum Minimum 0 und h here Anpassungsma e bis zum Maximum 1 weisen auf bessere L sungen hin Abbildung 14 14 Zerlegung des normalisierten Roh Stresses Quelle SRC_1 SRC_2 SRC_3 SRC_4 SRC_5 SRC_6 Aunt Brother Cousin Daughter Father Granddaughter Grandfather Grandmother Grandson Mother Nephew Niece Sister Son Uncle Mittelwert Mit der Stress Zerlegung erkennen Sie welche Quellen und Objekte die gr ten Beitr ge zum Gesamtstress der L sung liefern In diesem Fall kann der Gro teil des Stresses zwischen den Quellen den Quellen 1 und 2 zugeordnet werden Bei den Objekten l t sich der meiste Stress dagegen mit Bruder Enkelin Gro
160. contains sample application programs in source language which illustrate programming techniques on various operating platforms You may copy modify and distribute these sample programs in any form without payment to SPSS Inc for the purposes of developing Copyright SPSS Inc 1989 2010 319 320 Anhang B using marketing or distributing application programs conforming to the application programming interface for the operating platform for which the sample programs are written These examples have not been thoroughly tested under all conditions SPSS Inc therefore cannot guarantee or imply reliability serviceability or function of these programs The sample programs are provided AS IS without warranty of any kind SPSS Inc shall not be liable for any damages arising out of your use of the sample programs Trademarks IBM the IBM logo and ibm com are trademarks of IBM Corporation registered in many jurisdictions worldwide A current list of IBM trademarks is available on the Web at http www ibm com legal copytrade shmtl SPSS is a trademark of SPSS Inc an IBM Company registered in many jurisdictions worldwide Adobe the Adobe logo PostScript and the PostScript logo are either registered trademarks or trademarks of Adobe Systems Incorporated in the United States and or other countries Intel Intel logo Intel Inside Intel Inside logo Intel Centrino Intel Centrino logo Celeron Intel Xeon Intel SpeedSte
161. d Ihren Supportvertrag zu identifizieren Kundendienst Wenden Sie sich bei Fragen zur Lieferung oder Ihrem Kundenkonto an Ihr regionales B ro das Sie auf der Website unter http www spss com worldwide finden Halten Sie bitte stets Ihre Seriennummer bereit Copyright SPSS Inc 1989 2010 iii Ausbildungsseminare Weitere SPSS Inc bietet ffentliche und unternehmensinterne Seminare an Alle Seminare beinhalten auch praktische bungen Seminare finden in gr eren St dten regelm ig statt Wenn Sie weitere Informationen zu diesen Seminaren w nschen wenden Sie sich an Ihr regionales B ro das Sie auf der Website unter hrtp www spss com worldwide finden Ver ffentlichungen Die Handb cher SPSS Statistics Guide to Data Analysis SPSS Statistics Statistical Procedures Companion und SPSS Statistics Advanced Statistical Procedures Companion die von Marija Noru is geschrieben und von Prentice Hall ver ffentlicht wurden werden als Quelle f r Zusatzinformationen empfohlen Diese Ver ffentlichungen enthalten statistische Verfahren in den Modulen Statistics Base Advanced Statistics und Regression von SPSS Diese B cher werden Sie dabei unterst tzen die Funktionen und M glichkeiten von IBM SPSS Statistics optimal zu nutzen Dabei ist es unerheblich ob Sie ein Neuling im Bereich der Datenanalyse sind oder bereits ber umfangreiche Vorkenntnisse verf gen und damit in der Lage sind auch die erweiterte
162. d Social Psychology 30 Anhang A Beispieldateien Die zusammen mit dem Produkt installierten Beispieldateien finden Sie im Unterverzeichnis Samples des Installationsverzeichnisses F r jeder der folgenden Sprachen gibt es einen eigenen Ordner innerhalb des Unterverzeichnisses Samples Englisch Franz sisch Deutsch Italienisch Japanisch Koreanisch Polnisch Russisch Vereinfachtes Chinesisch Spanisch und Traditionelles Chinesisch Nicht alle Beispieldateien stehen in allen Sprachen zur Verf gung Wenn eine Beispieldatei nicht in einer Sprache zur Verf gung steht enth lt der jeweilige Sprachordner eine englische Version der Beispieldatei Beschreibungen Im Folgenden finden Sie Kurzbeschreibungen der in den verschiedenen Beispielen in der Dokumentation verwendeten Beispieldateien m accidents sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um eine Versicherungsgesellschaft geht die alters und geschlechtsabh ngige Risikofaktoren f r Autounf lle in einer bestimmten Region untersucht Jeder Fall entspricht einer Kreuzklassifikation von Alterskategorie und Geschlecht m adl sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um Bem hungen geht die Vorteile einer vorgeschlagenen Therapieform f r Schlaganfallpatienten zu ermitteln rzte teilten weibliche Schlaganfallpatienten nach dem Zufallsprinzip jeweils einer von zwei Gruppen zu Die erste Gruppe erhielt die phy
163. d sav In dieser Datei sind die Daten aus ulcer_recurrence sav so umstrukturiert dass das Modell der Ereigniswahrscheinlichkeit f r jedes Intervall der Studie berechnet werden kann und nicht nur die Ereigniswahrscheinlichkeit am Ende der Studie Sie wurde an anderer Stelle Collett et al 2003 vorgestellt und analysiert verd1985 sav Diese Datendatei enth lt eine Umfrage Verdegaal 1985 Die Antworten von 15 Subjekten auf 8 Variablen wurden aufgezeichnet Die relevanten Variablen sind in drei Sets unterteilt Set 1 umfasst alter und heirat Set 2 besteht aus pet und news und in Set 3 finden sich music und live Die Variable per wird mehrfach nominal skaliert und die Variable Alter ordinal Alle anderen Variablen werden einzeln nominal skaliert virus sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Internet Dienstanbieters geht der die Auswirkungen eines Virus auf seine Netzwerke ermitteln m chte Dabei wurde vom Moment der Virusentdeckung bis zu dem Zeitpunkt zu dem die Virusinfektion unter Kontrolle war der ungef hre prozentuale Anteil infizierter E Mail in den Netzwerken erfasst wheeze_steubenville sav Hierbei handelt es sich um eine Teilmenge der Daten aus einer Langzeitstudie zu den gesundheitlichen Auswirkungen der Luftverschmutzung auf Kinder Ware Dockery Spiro III Speizer als auch Ferris Jr 1984 Die Daten enthalten wiederholte bin re Messungen des Keuchens von Kin
164. den stehen Die Beziehungen zwischen Age in years Newspaper read most often und Neighborhood preference k nnen mit einem Blick in den oberen rechten und den unteren linken Bereich der Diagramme beschrieben werden Die Altersgruppen im oberen rechten Bereich umfassen die lteren Teilnehmer diese Personen lesen den Telegraaf und wohnen lieber in einem Dorf Aus dem unteren linken Bereich der Diagramme geht hervor dass die jungen Teilnehmer und die Teilnehmer mittleren Alters den Volkskrant oder NRC lesen und auf dem Land oder in einer Stadt wohnen m chten Eine Trennung der niedrigeren Altersgruppen ist allerdings sehr schwierig Dieselben Interpretationen k nnen f r die andere Richtung Music preferred Marital status und Pets owned vorgenommen werden hierbei werden entsprechend der obere linke und der untere rechte Bereich des Diagramms mit den Zentroiden betrachtet Aus dem oberen linken Bereich geht hervor dass Alleinstehende h ufig einen Hund halten und gern New Wave h ren Verheiratete und Angeh rige anderer Kategorien beim Familienstand halten Katzen wobei Verheiratete gern klassische Musik h ren und die anderen Personen keine Musik m gen Eine alternative Analyse Die Ergebnisse der Analyse legen nahe dass die Behandlung der Variablen Age in years als ordinal nicht ganz angemessen ist Age in years wird zwar auf ordinalem Messniveau gemessen die Beziehungen mit anderen Variablen sind jedoch nicht monoton Um die Auswirkungen zu u
165. dern aus Steubenville Ohio im Alter 318 Anhang A von 7 8 9 und 10 Jahren sowie eine unver nderlichen Angabe ob die Mutter im ersten Jahr der Studie rauchte oder nicht m workprog sav Hierbei handelt es sich um eine hypothetische Datendatei zu einem Arbeitsprogramm der Regierung das versucht benachteiligten Personen bessere Arbeitspl tze zu verschaffen Eine Stichprobe potenzieller Programmteilnehmer wurde beobachtet Von diesen Personen wurden nach dem Zufallsprinzip einige f r die Teilnahme an dem Programm ausgew hlt Jeder Fall entspricht einem Programmteilnehmer Anhang Notices Licensed Materials Property of SPSS Inc an IBM Company Copyright SPSS Inc 1989 2010 Patent No 7 023 453 The following paragraph does not apply to the United Kingdom or any other country where such provisions are inconsistent with local law SPSS INC AN IBM COMPANY PROVIDES THIS PUBLICATION AS IS WITHOUT WARRANTY OF ANY KIND EITHER EXPRESS OR IMPLIED INCLUDING BUT NOT LIMITED TO THE IMPLIED WARRANTIES OF NON INFRINGEMENT MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE Some states do not allow disclaimer of express or implied warranties in certain transactions therefore this statement may not apply to you This information could include technical inaccuracies or typographical errors Changes are periodically made to the information herein these changes will be incorporated in new editions of the publica
166. die in der Arbeitsdatei gespeichert wurden k nnen Sie ein Streudiagramm der vorhergesagten Werte ber die transformierten Werte von Package design erstellen ffnen Sie hierzu erneut die Diagrammerstellung und klicken Sie auf Zur cksetzen Die bisherige Auswahl wird gel scht und die Standardoptionen werden wiederhergestellt 120 Kapitel 9 Abbildung 9 23 Diagrammerstellung i Diagrammerstellung X Variablen Diagrammvorschau verwendet Beispieldaten amp Package design pa amp Brand name brand amp Price price amp Good Housekeepin amp Money back guaran A Preference pref Standardized Resid E Preference Quantifi amp Package design Qu E Brand name Quantif 2 Price Quantification er Residual W hlen Sie die GalerieStreu Punktdiagramm aus und w hlen Sie die Option Einfaches Streudiagramm W hlen Sie Residuum als Variable f r die y Achse aus W hlen Sie Package design Quantification als Variable f r die x Achse aus gt Klicken Sie auf OK Das Streudiagramm zeigt die standardisierten Residuen anhand der optimalen Werte f r Package design Alle Residuen liegen innerhalb von zwei Standardabweichungen von 0 Die U Form im Streudiagramm aus der linearen Regression nach dem Standardverfahren wird durch eine zuf llige Streuung von Punkten ersetzt Die Vorhersagekraft wird durch die optimale Quantifikation der Kategorien erreicht 121
167. e Definieren des Zeilenbereichs bei der Korrespondenzanalyse 000e ee eaee Definieren des Spaltenbereichs in der Korrespondenzanalyse 2 2 000 Korrespondenzanalyse Modell 0 ccc cc eee eee nee nent e nes Korrespondenzanalyse Statistiken 000 0c cece tee eee Korrespondenzanalyse Diagramme 1 0 ce en te een eens Zus tzliche Funktionen beim Befehl CORRESPONDENCE 2 0000 6 Mehrfachkorrespondenzanalyse Definition des Variablengewichts bei der Mehrfachkorrespondenzanalyse Mehrfachkorrespondenzanalyse Diskretisierung 2 2 22 2222 eee ee eee ee eee Mehrfachkorrespondenzanalyse Fehlende Werte 00 00 cece cence eens Mehrfachkorrespondenzanalyse Optionen 0 0c cece eee ees vi Mehrfachkorrespondenzanalyse Ausgabe Mehrfachkorrespondenzanalyse Speichern Mehrfachkorrespondenzanalyse Objektdiagramme Mehrfachkorrespondenzanalyse Variablendiagramme Zus tzliche Funktionen beim Befehl MULTIPLE CORRESPONDENCE 7 Multidimensionale Skalierung PROXSCAL hnlichkeiten in mehreren Spalten von Matrizen hnlichkeiten in Spalten 2 2 22 c seen hnlichkeiten in einer Spalte 2 2 2222 hnlichkeiten aus Daten erstellen 0 00 000 Distanzen aus Daten erstellen 0 00000 eee Definieren eines Modells f r die multidimensional
168. e 100 I Bildmappen einf gen r Tabellen Pivots Keine Liste der Positionen Liste Liste der Dimensionsnamen Liste J Statische Tabellen Tabellennummer und variable TableNumber_ PETER W hlen Sie als Ausgabeformat IBM SPSS StatisticsDatendatei Alle Dimensionen in einer einzelnen Zeile Kategoriale Hauptkomponentenanalyse gt Geben Sie TableNumber_1 als Tabellennummernvariable ein Klicken Sie auf Weiter 166 Kapitel 10 Abbildung 10 20 Ausgabeverwaltungssystem OMS Bedienfeld E Ausgabeverwaltungssystem OMS Bedienfeld X Anforderungen Typen Befehle Beschriftungen Ziel Beenden Alle beenden Neue Anforderung Um eine Anforderung hinzuzuf gen w hlen Sie mindestens einen Eintrag aus den unten stehenden Listen sowie Hinzuf gen alle sonstigen gew nschten Eigenschaften aus und klicken Sie auf Hinzuf gen Unter Tabellenuntertypen werden nur Untertypen angezeigt die f r mindestens eine der ausgew hlten Prozeduren verf gbar sind Optionen Tip You can use Cirl A to select all the entries in a list Ausgabetypen Befehls IDs Tabellen Untertypen f r ausgew hlte Befehle Ausgabeziele Descriptive Statistics Iteration History Model Summary Modelle Notes Basierend auf Objektnamen Protokolle Object Scores Ordner Tabelen Projected cents Texte Quantifications Warnungen Variance Accounted For ne ification Te Warnings Aus Vie
169. e F lle die zur gleichen Kategorie wie die Variable geh ren Gewichte und Komponentenladungen Der Regressionskoeffizient in jeder Dimension f r jede quantifizierte Variable in einem Set wobei f r die Objektwerte eine Regression auf die quantifizierten Variablen durchgef hrt wird sowie die Projektion der quantifizierten Variablen im Objektraum Liefert einen Hinweis ber den Beitrag den jede Variable zu der Dimension innerhalb eines Sets liefert Einfache und mehrfache Anpassung Ma e f r die Anpassungsg te der einfachen und multiplen Kategorienkoordinaten bzw Kategorienquantifizierungen hinsichtlich der Objekte Kategorienquantifikationen Zuordnung optimaler Skalenwerte zu den Kategorien einer Variablen Objektwerte Der optimale Wert Score der einem Objekt Fall in einer bestimmten Dimension zugewiesen wird Diagramm Sie k nnen Diagramme von Kategorienkoordinaten Objektwerten Komponentenladungen Kategorienzentroiden und Transformationen erzeugen Objektwerte speichern Sie k nnen die Objektwerte als neue Variablen in der Arbeitsdatei speichern Objektwerte werden f r die im Hauptdialogfeld angegebene Anzahl von Dimensionen gespeichert 50 Kapitel 4 Zuf llige Anfangskonfiguration verwenden Wenn einige oder alle Variablen einzeln nominal sind sollte eine zuf llige Ausgangskonfiguration verwendet werden Wenn diese Option nicht ausgew hlt wird wird eine verschachtelte Ausgangskonfiguration verwendet
170. e Quantifikationen werden jeweils als einzelne Variable interpretiert Transformations Diagramme Die verschiedenen Niveaus auf denen die einzelnen Variablen skaliert werden k nnen bringen Einschr nkungen f r die Quantifizierungen mit sich Transformationsdiagramme illustrieren die Beziehung zwischen den Quantifizierungen und den urspr nglichen Kategorien die sich aus dem jeweils ausgew hlten Messniveau der optimalen Skalierung ergibt Das Transformationsdiagramm f r die Variable Neighborhood preference die als nominal behandelt wurde zeigt ein U f rmiges Muster bei dem die mittlere Kategorie die niedrigste Quantifikation erh lt die u eren Kategorien dagegen hnliche Werte Dieses Muster weist auf eine quadratische Beziehung zwischen der urspr nglichen Variablen und der transformierten Variablen hin Ein alternatives Messniveau mit optimaler Skalierung f r Neighborhood preference wird nicht empfohlen Abbildung 11 18 Transformationsdiagramm f r die Variable Neighborhood preference nominal 1 0 0 0 Kategorienquantifikationen von Neighborhood preference Town Village Country Neighborhood preference Im Gegensatz dazu deuten die Quantifikationen fiir Newspaper read most often auf einen ansteigenden Trend in den drei Kategorien hin in denen beobachtete F lle vorliegen Die erste Kategorie erh lt die niedrigste Quantifikation die zweite Kategorie den n chsth heren Wert und 212 Kapitel 11 die dritte
171. e Hauptkomponentenanalyse 148 Beispiel Untersuchung der Interrelationen sozialer Systeme 0 0 0000000 148 Durchf hren der Analyse 00 000 c eect ttt eee 149 Anzahl der Dimensionen 0 0 00 ccc cee een teens 154 Quantifikationen 0 0 tne ete eee 155 bjektwente rtiai 22 2 zus na a a a eaeee are dida 157 Komponentenladungen 0 0 0c cece eee ete eee eee 158 Zus tzliche Dimensionen 0 0000 c eee tte eee eee 159 Beispiel Symptomatologie von E st rungen 0 00 cece eee eee 161 Durchf hren der Analyse 22 ccc cect tte tees 163 Transformationsdiagramme 000 cect tte eee 175 Modell bersicht 4 4202 0 0 dee a ba ee aided eel ea 177 Komponentenladungen 0 0 0 cece eee eee nennen 178 Objektwerte 1 0 0 nananana 179 Untersuchung der Strukturen im Krankheitsverlauf 0020 cee ee eeeee 181 Empfohlene Literatur 0 c cette eee 197 11 Nichtlineare kanonische Korrelationsanalyse 199 Beispiel Analyse der Umfrageergebnisse 000 e cece cece eens 199 Untersuchen der Daten 0 0 0 0 c ete eee 200 Ber cksichtigen der hnlichkeiten zwischen Sets 00 c0ceeeeeeeeueee 206 Komponentenladungen 0 0c cece cette nennen een 210 viii Transformations Diagramme 0 0 ccc eee tenet tenn eens 211 Einzelkategoriekoordinaten im Vergleich mit Mehrfachkategoriekoordinaten
172. e Skalierung Multidimensionale Skalierung Einschr nkungen Multidimensionale Skalierung Optionen Multidimensionale Skalierung Diagramme Version 1 Multidimensionale Skalierung Diagramme Version2 Multidimensionale Skalierung Ausgabe Zus tzliche Funktionen beim Befehl PROXSCAL 8 Multidimensionale Entfaltung PREFSCAL Definieren eines Modells f r die multidimensionale Entfaltung Multidimensionale Entfaltung Einschr nkungen Multidimensionale Entfaltung Optionen Multidimensionale Entfaltung Diagramme Multidimensionale Entfaltung Ausgabe 0 Zus tzliche Funktionen beim Befehl PREFSCAL vii Teil Il Beispiele 9 Kategoriale Regression 101 Beispiel Daten f r Teppichreiniger 2 2 00 0 cece eee ete eee 101 Standardverfahren der linearen Regressionsanalyse 02020 cece cence 102 Kategoriale Regressionsanalyse 0 000 cece eens 108 Beispiel Ozondaten 0 0 0 ttt teens 121 Diskretisierung von Variablen 0 0 0 ccc ccc ee een tne n eens 122 Auswahl des Transformationstyps 0 0 0 cc cece eee nee eee 122 Optimalit t der Quantifikationen 0 0 0 0 135 Auswirkungen von Transformationen 0000 e cece eee eee 137 Empfohlene Literatur 00 00 teens 146 10 Kategorial
173. ebene Konfiguration wird zum Anpassen der Variablen verwendet Die Variablen die angepa t werden m ssen als Analysevariablen ausgew hlt werden Da die Konfiguration aber fest ist werden Sie als Zusatzvariablen verarbeitet und m ssen deshalb nicht als Zusatzvariablen ausgew hlt werden Mehrfachkorrespondenzanalyse Ausgabe Im Dialogfeld Ausgabe k nnen Sie festlegen dass Tabellen f r Objektwerte Diskriminationsma e das Iterationsprotokoll Korrelationen der urspr nglichen und transformierten Variablen Kategorienquantifikationen f r ausgew hlte Variablen und deskriptive Statistiken f r ausgew hlte Variablen erstellt werden sollen 68 Kapitel 6 Abbildung 6 7 Dialogfeld Ausgabe FA MCA Ausgabe Tabellen Objektwerte T Korrelationen der Originalvariablen Diskriminstionsma e 4 Korrelationen der transformierten Variablen E tterationsprotokoll Quartifizierte Variablen Kategorienquantifikationen und Beitr ge Deskriptive Statistik a O O rOptionen f r Objektwerte Beschriftungsvariablen gt object Objektwerte Hiermit werden die Objektwerte z B Masse Tragheit Beitrage angezeigt Die folgenden Optionen sind verf gbar Diese Kategorien ber cksichtigen Hiermit werden die Kategorienummern der ausgew hlten Analysevariablen angezeigt m Objektwerte beschriften nach Sie k nnen eine der in der Liste Beschriftungsvariabl
174. eeuw als auch Y Takane 1976 Regression with qualitative and quantitative variables An alternating least squares method with optimal scaling features Psychometrika 41 Young F W Y Takane als auch J De Leeuw 1978 The principal components of mixed measurement level multivariate data An alternating least squares method with optimal scaling features Psychometrika 43 Zeijl E Y te Poel M du Bois Reymond J Ravesloot als auch J J Meulman 2000 The role of parents and peers in the leisure activities of young adolescents Journal of Leisure Research 32 hnlichkeitstransformationen in Multidimensionale Entfaltung 90 Allgemeines euklidisches Modell in Multidimensionale Entfaltung 90 Anf ngliche Diagramme des gemeinsamen Raums in Multidimensionale Entfaltung 95 ANOVA Variance Components Options in Kategoriale Regression 24 Anpassung in Nichtlineare kanonische Korrelationsanalyse 48 Anpassungswerte in Nichtlineare kanonische Korrelationsanalyse 207 Ausgangskonfiguration in Kategoriale Regression 21 in Multidimensionale Entfaltung 93 in Multidimensionale Skalierung 82 in Nichtlineare kanonische Korrelationsanalyse 48 Ausrei er bei der Mehrfachkorrespondenzanalyse 248 Beispieldateien Speicherort 307 Beitr ge in der Korrespondenzanalyse 230 Biplots bei der Mehrfachkorrespondenzanalyse 70 in der Kategorialen Hauptkomponentenanalyse 39 in der Korresponden
175. efinieren ala definieren Beschriftungsvariablen azn Dimensionen in der L sung W hlen Sie Body Weight K rpergewicht bis Body perception K rperwahrnehmung als Analysevariablen aus 168 Kapitel 10 Klicken Sie auf Skala und Gewicht definieren Abbildung 10 23 Skala und Gewichtung definieren 3 Kategoriale Hauptkomponenten Skala und Gewichtung definieren X Variablengewichtung Messniveau der optimalen Skalierung Spline ordinal ordinal Spline nominal Nominal Mehrfach nominal Numerisch Knoten innen ir esen un W hlen Sie als Messniveau der optimalen Skalierung die Option Ordinal aus Klicken Sie auf Weiter W hlen Sie Time diagnosis interaction Zeit Diagnose Interaktion als Zusatzvariable aus und klicken Sie im Dialogfeld Kategoriale Hauptkomponenten auf Skala definieren Abbildung 10 24 Dialogfeld Skala definieren iii Kategoriale Hauptkomponenten Skala definieren Xj rMessniveau der optimalen Skalierung Spline ordinal Ordinal Spline nominal Nominal Mehrfach nominal Numerisch Spline Grad 2 Knoten innen ter anerecnen _tite_ W hlen Sie Mehrfach nominal als Messniveau der optimalen Skalierung Klicken Sie auf Weiter 169 Kategoriale Hauptkomponentenanalyse Abbildung 10 25 Dialogfeld Kategoriale Hauptkomponentenanalyse Analysevariablen
176. egen bzw Nichtvorliegen eines aktiven Lebensstils auf der Grundlage von mindestens zwei Trainingseinheiten pro Woche erfasst Jeder Fall entspricht einem Teilnehmer clothing_defects sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Qualit tskontrolle in einer Bekleidungsfabrik geht Aus jeder in der Fabrik produzierten Charge entnehmen die Kontrolleure eine Stichprobe an Bekleidungsartikeln und z hlen die Anzahl der Bekleidungsartikel die inakzeptabel sind coffee sav Diese Datendatei enth lt Daten zum wahrgenommenen Image von sechs Eiskaffeemarken Kennedy Riquier als auch Sharp 1996 Bei den 23 Attributen des Eiskaffee Image sollten die Teilnehmer jeweils alle Marken ausw hlen die durch dieses Attribut beschrieben werden Die sechs Marken werden als AA BB CC DD EE und FF bezeichnet um Vertraulichkeit zu gew hrleisten contacts sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Kontaktlisten einer Gruppe von Vertretern geht die Computer an Unternehmen verkaufen Die einzelnen Kontaktpersonen werden anhand der Abteilung in der sie in ihrem Unternehmen arbeiten und anhand ihrer Stellung in der Unternehmenshierarchie in Kategorien eingeteilt Au erdem werden der Betrag des letzten Verkaufs die Zeit seit dem letzten Verkauf und die Gr e des Unternehmens in dem die Kontaktperson arbeitet aufgezeichnet creditpromo sav Hierbei h
177. egt nur selten vor und konzentriert sich in der Regel nur auf triviale Aspekte in den Daten Die kanonische Korrelation ist eine weitere beliebte Statistik mit zwei Variablen Sets Die kanonische Korrelation h ngt mit dem Eigenwert zusammen und liefert somit keine zus tzlichen Informationen daher wird diese Korrelation nicht in der Ausgabe der nichtlinearen kanonischen Korrelationsanalyse aufgef hrt Bei zwei Variablen Sets wird die kanonische Korrelation pro Dimension mit der folgenden Formel berechnet Pd 2x Eg 1 Hierbei gilt d ist die Anzahl der Dimensionen und E ist der Eigenwert Mit der folgenden Formel k nnen Sie die kanonische Korrelation f r mehr als zwei Sets verallgemeinern pa K x Ea 1 K 1 208 Kapitel 11 Hierbei gilt d ist die Anzahl der Dimensionen K ist die Anzahl der Sets und E ist der Eigenwert Im obigen Beispiel p 3 x 0 801 1 2 0 702 und p2 3 x 0 735 1 2 0 603 Gewichte und Komponentenladungen Categories Als weiteres Zusammenhangsma steht au erdem die Mehrfachkorrelation zwischen linearen Kombinationen aus jedem Set und den Objektwerten zur Verf gung Wenn ein Set keine mehrfach nominalen Variablen enth lt k nnen Sie dieses Ma folgenderma en berechnen Multiplizieren Sie die Gewichtung und die Komponentenladung der einzelnen Variablen im Set addieren Sie diese Produkte und ziehen Sie dann die Quadratwurzel aus der Summe Abbildung 11 14 Gewich
178. eher ungeeignet Verwenden Sie statt dessen eine nominale Transformation 258 Kapitel 14 Abbildung 14 6 Dialogfeld Einschr nkungen E Multidimensionale Skalierung Einschr nkungen X Einschr nkungen im gemeinsamen Raum Keine Einschr nkungen Einige Koordinaten sind fest Lineare Kombination der unabh ngigen variablen Einschr nkungsvariablen Variablen einlesen aus Datei C Program Files SPSSinc PASVVSt kinship_var sav verf gbar Ausgew hlt gender gender Nominal gener gener intervall degree L degree intervall Transformationen f r unabh ngige variablen Nomina Grad 2 Knoten 1 gt Wahlen Sie gender aus Wahlen Sie in der Dropdown Liste f r die Transformationen unabh ngiger Variablen den Eintrag Nominal gt Klicken Sie auf ndern Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Multidimensionale Skalierung auf Diagramme 259 Abbildung 14 7 Dialogfeld Diagramme ultidimensionale Skalierung iM Gemeinsamer Raum a Individueller Raum M Individuelle Raumgewichtungen Diagramme der Quellen Alle Quellen Quellen ausw hlen Quellennummer W hlen Sie in der Gruppe Diagramme die Option Stress Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Multidimensionale Skalierung auf OK E Urspr ngliche ber transformierte hnlichkeiten E Transtormierte hnlichkeiten gegen Di
179. ehlssyntax Sprache verf gen Sie au erdem ber folgende M glichkeiten m Mit dem Unterbefehl SAVE k nnen Sie Stammnamen f r die transformierten Variablen festlegen wenn Sie diese in der Arbeitsdatei speichern Vollst ndige Informationen zur Syntax finden Sie in der Command Syntax Reference Kapitel 3 Kategor ale Hauptkomponentenanalyse CATPCA Bei diesem Verfahren werden kategoriale Variablen quantifiziert und gleichzeitig die Dimensionen der Daten reduziert Die kategoriale Hauptkomponentenanalyse ist auch unter dem Akronym CATPCA bekannt Categorical Principal Components Analysis Das Ziel bei der Hauptkomponentenanalyse besteht darin ein urspriingliches Set von Variablen in ein kleineres Set von unkorrelierten Komponenten umzuwandeln das soviel wie m glich von den Informationen aus den urspr nglichen Variablen enth lt Diese Methode ist besonders dann n tzlich wenn eine hohe Anzahl von Variablen eine effektive Interpretation der Beziehungen zwischen den Objekten Subjekten und Einheiten verhindert Nach einer Dimensionsreduktion werden nur einige Komponenten anstelle einer gro en Anzahl von Variablen interpretiert Beim Standardverfahren der Hauptkomponentenanalyse wird von linearen Beziehungen zwischen numerischen Variablen ausgegangen Bei der Methode der optimalen Skalierung k nnen die Variablen jedoch auf verschiedenen Niveaus skaliert werden Kategoriale Variablen werden optimal in der angegebenen Dimensiona
180. ehmens das eine Datenbank mit Umfrageinformationen zusammenstellen m chte Jeder Fall entspricht einem anderen Stadtteil aus den im ersten Schritt ausgew hlten St dten Au erdem sind IDs f r Region Provinz Landkreis Stadt Stadtteil und Wohneinheit erfasst Die Informationen zur Stichprobenziehung aus den ersten beiden Stufen des Stichprobenplans sind ebenfalls enthalten demo_cs sav Hierbei handelt es sich um eine hypothetische Datendatei die Umfrageinformationen enth lt die mit einem komplexen Stichprobenplan erfasst wurden Jeder Fall entspricht einer anderen Wohneinheit Es sind verschiedene Informationen zum demografischen Hintergrund und zur Stichprobenziehung erfasst dmdata sav Dies ist eine hypothetische Datendatei die demografische und kaufbezogene Daten f r ein Direktmarketingunternehmen enth lt dmdata2 sav enth lt Informationen f r eine Teilmenge von Kontakten die ein Testmailing erhalten dmdata3 sav enth lt Informationen zu den verbleibenden Kontakten die kein Testmailing erhalten dietstudy sav Diese hypothetische Datendatei enth lt die Ergebnisse einer Studie der Stillman Di t Rickman Mitchell Dingman als auch Dalen 1974 Jeder Fall entspricht einem Teilnehmer und enth lt dessen Gewicht vor und nach der Di t in amerikanischen Pfund sowie mehrere Messungen des Triglyceridspiegels in mg 100 ml dvdplayer sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Entwicklung
181. ei hnelt der Datei telco sav allerdings wurden die Variablen tenure und die Log transformierten Variablen zu den Kundenausgaben entfernt und durch standardisierte Log transformierte Variablen ersetzt telco_missing sav Diese Datendatei ist eine Untermenge der Datendatei telco sav allerdings wurde ein Teil der demografischen Datenwerte durch fehlende Werte ersetzt testmarket sav Diese hypothetische Datendatei bezieht sich auf die Pl ne einer Fast Food Kette einen neuen Artikel in ihr Men aufzunehmen Es gibt drei m gliche Kampagnen zur Verkaufsf rderung f r das neue Produkt Daher wird der neue Artikel in Filialen in mehreren zuf llig ausgew hlten M rkten eingef hrt An jedem Standort wird eine andere Form der Verkaufsf rderung verwendet und die w chentlichen Verkaufszahlen f r das neue Produkt werden f r die ersten vier Wochen aufgezeichnet Jeder Fall entspricht einer Standort Woche testmarket_1month sav Bei dieser hypothetischen Datendatei handelt es sich um die Datendatei testmarket sav wobei die w chentlichen Verkaufszahlen zusammengefasst sind sodass jeder Fall einem Standort entspricht Dadurch entfallen einige der Variablen die 317 Beispieldateien w chentlichen nderungen unterworfen waren und die verzeichneten Verkaufszahlen sind nun die Summe der Verkaufszahlen w hrend der vier Wochen der Studie tree_car sav Hierbei handelt es sich um eine hypothetische Datendatei die demografische Daten so
182. ei Money back guarantee Package design oder Good Housekeeping seal f hrt beispielsweise zu einer niedrigeren vorhergesagten Einstufung der Bevorzugung Money back guarantee erh lt die Kodierung 1 f r no money back guarantee bzw die Kodierung 2 f r money back guarantee Ein Anstieg bei Money back guarantee bedeutet dass eine Geld zur ck Garantie hinzugef gt wurde Die Einf hrung einer Geld zur ck Garantie senkt daher die vorhergesagte Einstufung der Bevorzugung bewirkt also eine h here vorhergesagte Bevorzugung Abbildung 9 5 Regressionskoeffizienten Koeffizienten Standardisie Nicht standardisierte rte Koeffizienten Koeffizienten Standardf ehler Signifikanz Konstante Package design Brand name Price Money back guarantee Good Housekeeping seal a Abh ngige Variable Preference 106 Kapitel 9 Der Wert des Koeffizienten gibt das Ma f r die nderung der vorhergesagten Einstufung der Bevorzugung an Mithilfe standardisierter Koeffizienten werden die Interpretationen auf der Grundlage der Standardabweichungen der Variablen vorgenommen Jeder Koeffizient zeigt die Anzahl der Standardabweichungen um die sich die vorhergesagte Antwort pro nderung in der Standardabweichung in einer Einflussgr e ndert wenn alle anderen Einflussgr en konstant bleiben Eine nderung um eine Standardabweichung in Brand name f hrt zu einer h heren vorhergesagten Bevorzugung von 0 056 Standardabweichungen Die
183. eiben Moc Fehlende Werte ausschlie en f r Korrelationen nach Quantifizierung vorschreiben Objekte mit fehlenden Werten f r diese Variable ausschlie en vers asreehen tens Strategie f r fehlenden Wert Fehlende Werte k nnen ausgeschlossen Passivbehandlung oder vorgeschrieben Aktivbehandlung werden oder Objekte mit fehlenden Werten k nnen ausgeschlossen werden listenweiser Fallausschluss 65 Mehrfachkorrespondenzanalyse m Fehlende Werte ausschlie en f r Korrelationen nach Quantifizierung vorschreiben Objekte mit fehlenden Werten bei der ausgew hlten Variablen tragen nicht zur Analyse dieser Variablen bei Wenn alle Variablen passiv behandelt werden werden Objekte mit fehlenden Werten f r alle Variablen als Zusatzobjekte behandelt Wenn im Dialogfeld Kategoriale Hauptkomponenten Ausgabe Korrelationen ausgew hlt sind werden fehlende Werte nach der Analyse anhand der h ufigsten Variablenkategorie Modalwert f r die Korrelationen der urspr nglichen Variablengesetzt Sie k nnen die Methode ausw hlen nach der Werte f r die Korrelationen der optimal skalierten Variablen gesetzt werden Wenn Sie Modalwert ausw hlen werden fehlende Werte durch den Modalwert der optimal skalierten Variablen ersetzt Wenn Sie Zusatzkategorie ausw hlen werden fehlende Werte durch die Quantifikation einer zus tzlichen Kategorie ersetzt Dies bedeutet aber auch dass Objekte mit einem fehlenden Wert
184. eich Mit diesem Parameter legen Sie den Moment fest ab dem die Penalisierung erfolgt Bei 0 0 erfolgt keine Penalisierung H here Wert f hren dazu dass der Algorithmus eine L sung mit einer gr eren Variation innerhalb der transformierten hnlichkeiten sucht Geben Sie einen nichtnegativen Wert an Multidimensionale Entfaltung Diagramme Im Dialogfeld Diagramme k nnen Sie die zu erstellenden Diagramme festlegen 96 Kapitel 8 Abbildung 8 5 Dialogfeld Diagramme E Multidimensionale Entfaltung Diagramme Diagramme El Mehrere Starts Fi Endg ltiger gemeinsamer Raum Transformationsdiagramme E Anf nglicher gemeinsamer Raum Fi Raumgewichtungen E Shepard Diagramme A tress pro Dimension W Individueller Raum E Streudiagramm der Anpassung E Residuen Diagramme Stile f r Zeilenobjekte Farben ES U Gender gender Markierungen Toast pop up TP gt Buttered toast BT mDiagramme der Quellen Alle Quellen Quellen ausw hlen Auellennummer r Zeilendiagramme Diagramme Folgende Diagramme sind verf gbar m Mehrere Starts Zeigt ein gestapeltes Histogramm des penalisierten Stress mit Stress und Penalisierung an m Anf nglicher gemeinsamer Raum Zeigt eine Streudiagramm Matrix der Koordinaten des anf nglichen gemeinsamen Raums an m Stress pro Dimension Erstellt ein Liniendiagramm des penalisierten Stress im Vergleich zur Dimensio
185. eilenpositionen f r die hnlichkeiten in jeder hnlichkeitsvariablen aus gt W hlen Sie eine Spaltenvariable zum Festlegen der Spaltenpositionen f r die hnlichkeiten in jeder hnlichkeitsvariablen aus Zellen der Distanzmatrix denen keine Zeilen Spaltenposition zugewiesen ist werden als fehlend behandelt W hlen Sie optional Gewichtungsvariablen aus Die Anzahl muss der Anzahl der ausgew hlten hnlichkeitsvariablen entsprechen 77 Multidimensionale Skalierung PROXSCAL Dar ber hinaus k nnen Sie ein Modell f r die multidimensionale Skalierung angeben Einschr nkungen f r den gemeinsamen Raum festlegen Konvergenzkriterien festlegen die zu verwendende Ausgangskonfiguration angeben sowie Diagramme und die Ausgabe ausw hlen hnlichkeiten in einer Spalte Wenn Sie im Dialogfeld Datenformat das Ein Spalten Modell ausw hlen entweder aus einer oder mehreren Quellen wird das Hauptdialogfeld folgenderma en dargestellt Abbildung 7 4 Dialogfeld Ahnlichkeiten in einer Spalte FFA Multidimensionale Skalierung hnlichkeiten in einer Spalte hnlichkeiten Mode Le z Spalten Diagramme 2 ausgeben Zeilen Le Quellen Gewichtungen W hlen Sie eine Ahnlichkeitsvariable aus Es wird davon ausgegangen dass es sich dabei um eine oder mehrere Distanzmatrizen handelt gt W hlen Sie eine Zeilenvariable zum Festlegen der Zeilenpositionen f r die hn
186. eine andere ber vier Kategorien verf gt betr gt die maximale Anzahl an Dimensionen drei Zus tzliche Kategorien sind nicht aktiv Wenn beispielsweise eine Variable ber f nf Kategorien davon zwei Zusatzkategorien und eine andere ber vier Kategorien verf gt betr gt die maximale Anzahl an Dimensionen zwei Behandeln Sie alle Kategoriegruppen die auf Gleichheit beschr nkt sind als eine Kategorie Wenn beispielsweise eine Variable ber f nf Kategorien verf gt von denen drei auf Gleichheit beschr nkt sein m ssen muss diese Variable bei der Bestimmung der maximalen Dimensionalit t so behandelt werden als ob sie drei Kategorien besitzen w rde F r zwei der Kategorien gelten keine Nebenbedingungen und die dritte Kategorie entspricht den drei Kategorien mit der Gleichheitsbeschr nkung Wenn Sie f r die Anzahl der Dimensionen eine ber dem Maximalwert liegende Zahl angeben wird in jedem Fall der Maximalwert verwendet Verwandte Prozeduren Falls Sie mit mehr als zwei Variablen arbeiten verwenden Sie die Mehrfachkorrespondenzanalyse Wenn die Variablen ordinal skaliert werden sollen verwenden Sie die kategoriale Hauptkomponentenanalyse So lassen Sie eine Korrespondenzanalyse berechnen W hlen Sie die folgenden Befehle aus den Men s aus Analysieren gt Dimensionsreduktion gt Korrespondenzanalyse Abbildung 5 1 Dialogfeld Korrespondenzanalyse fa Korrespondenzanalyse amp Smoking smoke E count
187. einer anderen Variablen wird die Beziehung zwischen den Variablen beschrieben Bei einer Analyse der Kontingenztafeln werden h ufig Zeilen und Spaltenprofile untersucht und Tests auf Unabh ngigkeit mithilfe der Chi Quadrat Statistik durchgef hrt Die Anzahl der Profile kann jedoch unter Umst nden relativ gro sein wobei durch die Chi Quadrat Statistik die Abh ngigkeitsstruktur nicht erkennbar wird Die Prozedur Kreuztabelle bietet verschiedene Zusammenhangsma e und tests kann jedoch keine Beziehungen zwischen den Variablen darstellen Die Faktorenanalyse ist ein Standardverfahren zur Beschreibung von Beziehungen zwischen Variablen in einem flachdimensionierten Raum Zur Faktorenanalyse werden jedoch Intervalldaten ben tigt Au erdem muss die Anzahl der Beobachtungen das F nffache der Anzahl der Variablen betragen Andererseits wird bei der Korrespondenzanalyse von nominalen Variablen ausgegangen sodass die Beziehungen zwischen den Kategorien jeder Variablen sowie die Beziehungen zwischen den Variablen beschrieben werden k nnen Zudem kann die Korrespondenzanalyse zur Untersuchung einer beliebigen Tabelle mit positiven Korrespondenzma en verwendet werden Beispiel Mithilfe der Korrespondenzanalyse kann die Beziehung zwischen einer Mitarbeitergruppe und den Rauchgewohnheiten grafisch dargestellt werden Es k nnte sich herausstellen dass die Rauchgewohnheiten bei Angestellten im mittleren Management und beim Sekratariatspersonal je
188. eity and heterogeneity In Recent Advances in Descriptive Multivariate Analysis W J Krzanowski Hg Oxford Oxford University Press Isra ls A 1987 Eigenvalue techniques for qualitative data Leiden DSWO Press Krzanowski W J als auch F H C Marriott 1994 Multivariate analysis Part I distributions ordination and inference London Edward Arnold Lebart L A Morineau als auch K M Warwick 1984 Multivariate descriptive statistical analysis New York John Wiley and Sons Max J 1960 Quantizing for minimum distortion Proceedings IEEE Information Theory 6 Meulman J J 1986 A distance approach to nonlinear multivariate analysis Leiden DSWO Press Meulman J J 1992 The integration of multidimensional scaling and multivariate analysis with optimal transformations of the variables Psychometrika 57 Nishisato S 1980 Analysis of categorical data Dual scaling and its applications Toronto University of Toronto Press Nishisato S 1994 Elements of dual scaling An introduction to practical data analysis Hillsdale N J Lawrence Erlbaum Associates Inc Rao C R 1973 Linear statistical inference and its applications 2nd Hg New York John Wiley and Sons Rao C R 1980 Matrix approximations and reduction of dimensionality in multivariate statistical analysis In Multivariate Analysis Vol 5 P R Krishnaiah Hg Amsterdam North Holland Roskam E E 1968 Metric analysi
189. en 00 99 00 59 00 E2 00 72 00 22 00 92 P a 00 16 00 06 Das Transformationsdiagramm zeigt die ordinale Einschr nkung der Quantifikationen f r Temperature Die gezackte Linie aus der nominalen Transformationen ist hier durch eine glatte ansteigende Linie ersetzt Au erdem sind keine langen Plateaus mehr vorhanden Dies bedeutet dass eine Zusammenfassung der Kategorien nicht erforderlich ist 135 Kategoriale Regression Optimalit t der Quantifikationen Die transformierten Variablen aus einer kategorialen Regression k nnen bei einer linearen Regression im Standardverfahren genutzt werden dabei entstehen identische Ergebnisse Die Quantifikationen sind jedoch nur f r das Modell optimal mit dem sie erzeugt wurden Die Verwendung einer Untergruppe der Einflussgr en in einer linearen Regression ist nicht identisch mit einer Regression mit optimaler Skalierung f r diese Untergruppe Die berechnete kategoriale Regression besitzt beispielsweise einen Wert von 0 875 f r R2 Sie haben die transformierten Variablen gespeichert Um also die Anpassungsg te einer linearen Regression nur mit Temperature Pressure gradient und Inversion base height als Einflussgr en zu bestimmen w hlen Sie aus den Men s die folgenden Befehle aus Analysieren gt Regression gt Linear Abbildung 9 43 Dialogfeld Lineare Regression ai Lineare Regression Abhangige Variable P vn u E In
190. en Zusatzobjelte Normalisierungsmethode Bereich von F llen Erster z ariablenprinzipal Letzter ss Benut Einzelner Fall teren Konvergenz 00001 Maximalzahl der tterationen Anders 4 r Diagramme beschriften mit Entfernen j variablen oder Wertelabels Langenbegrenzung f r Beschriftungen Yariablennamen oder Verte rDiagrammdimensionen Alle Dimensionen in der L sung anzeigen Anzahl der Dimensionen beschr nken rKonfiguration Keen Ds Zusatzobjekte Geben Sie die Fallnummer des Objekts oder die erste und letzte Fallnummer einer Reihe von Objekten an die als Zusatzobjekte deklariert werden sollen und klicken Sie dann auf Hinzuf gen Wiederholen Sie diesen Vorgang bis Sie alle Zusatzobjekte festgelegt haben Wenn ein Objekt als Zusatzobjekt deklariert ist werden Fallgewichtungen f r das Objekt ignoriert Normalisierungsmethode Sie k nnen eine von f nf Optionen f r die Normalisierung der Objektwerte und Variablen ausw hlen In einer Analyse kann nur eine Normalisierungsmethode gleichzeitig verwendet werden m Variablenprinzipal Bei dieser Option wird die Assoziation zwischen Variablen optimiert Die Komponentenladungen Korrelationen mit Hauptkomponenten wie Dimensionen und Objektwerten stellen die Koordinaten der Variablen im Objektraum dar Dies ist n tzlich wenn Sie haupts chlich an der Korrelation zwischen den Variablen interessiert sind m Objektprinzipal Bei dieser Option werde
191. en enthaltenen Variablen ausw hlen um die Objekte zu beschriften Diskriminationsma e Zeigt die Diskriminationsma e pro Variable und Dimension an Iterationsprotokoll F r jede Iteration werden ber cksichtigte Varianz Verlust sowie Steigerung der ber cksichtigten Varianz ausgegeben Korrelationen der Originalvariablen Hiermit werden die Korrelationsmatrix der urspr nglichen Variablen und die Eigenwerte dieser Matrix ausgegeben Korrelationen der transformierten Variablen Hiermit werden die Korrelationsmatrix der transformierten optimal skalierten Variablen und die Eigenwerte dieser Matrix ausgegeben Kategorienquantifikationen und Beitr ge Dies sind die Kategoriequantifikationen und Koordinaten darunter Masse Tr gheit und Beitr ge pro Dimension jeder ausgew hlten Variable 69 Mehrfachkorrespondenzanalyse Anmerkung Die Koordinaten und Beitr ge unter anderem Masse und Tr gheit werden in separaten Schichten der Ausgabe von Pivot Tabellen angezeigt wobei die Koordinaten standardm ig eingeblendet werden Um die Beitr ge anzuzeigen aktivieren doppelklicken Sie die Tabelle und w hlen Sie Beitr ge aus der Dropdown Liste Schicht Deskriptive Statistiken Hiermit werden H ufigkeiten Anzahl der fehlenden Werte und Modalwert f r die ausgew hlten Variablen ausgegeben Mehrfachkorrespondenzanalyse Speichern Im Dialogfeld Speichern k nnen Sie festlegen dass diskretisierte Date
192. en Dimension 288 Kapitel 15 Abbildung 15 16 Verbundenes Diagramm des individuellen Raums Breakfast with juice bacon and eggs and beverage 0 17 7 25 29 Glazed donut g Cinnamon pa 40 oe ET A ee o adany 5 Et 581 anigi one Mag 0 33 9 Ta Coffee cak Siem 28 o 2740 420 m tetas HE RAAT 5 Com ehe hatter 37 en Toast pop up Dimension 2 Hard rolls and butter Dimension 1 Im verbundenen Diagramm des individuellen Raums Breakfast with juice bacon and eggs and beverage sind die Auswirkungen dieses Szenarios auf die Bevorzugungen dargestellt Diese Quelle ist st rker an der ersten Dimension beteiligt sodass die Unterscheidung zwischen den Artikeln meist auf die erste Dimension zur ckzuf hren ist 289 Multidimensionale Entfaltung Abbildung 15 17 Verbundenes Diagramm des individuellen Raums Snack with beverage only 25 1 Jelly donut 5 0 ie 10 o SB ay a o Ginnamon bun 35 34 0 1 na Glazed donut 1613228286 oan o Danish pastry in os 18 28 38 33 22 Coffee cake 40 19 N 00 Blueberry muffin and margarine c 2 o 3 oza 21 36 w 41 24 27 o o 25 920 Buttered toast and jelly E English muffin and margarioe 039 a 0 Cinnamon toast 5 0 7 Corn muffin and butter OToast and marmalade ie 42 o OButtered toast lt 40 O Toast and margarine a Toast pop up 8 pop up 10 04 Hard rolls and butter O 32 37 Dimension 1 Im verbundenen Diagramm des individuel
193. en Objekte was darauf hindeutet da insgesamt viele der Merkmale dieses Objekts bei den anderen Objekten nicht vorkommen Das Objektwertediagramm ist besonders hilfreich f r die Ermittlung von Ausrei ern SCHRAUBEI k nnte als Ausrei er betrachtet werden Sp ter werden wir untersuchen was passiert wenn wir dieses Objekt ausschlie en Diskriminationsma e Bevor wir den Rest der Objektwertediagramme untersuchen wollen wir berpr fen ob die Diskriminationsma e mit unseren bisherigen Aussagen bereinstimmen Bei jeder Variablen wird f r jede Dimension ein Diskriminationsma das als quadrierte Komponentenladung betrachtet werden kann berechnet Dieses Ma ist auch die Varianz der quantifizierten Variablen in dieser Dimension Der H chstwert f r dieses Ma ist 1 Dieser Wert wird erreicht wenn die Objektwerte in sich gegenseitig ausschlie enden Gruppen liegen und alle Objektwerte innerhalb einer Kategorie gleich sind Hinweis Wenn fehlende Daten vorliegen kann dieses Ma gr er als 1 sein Gro e Diskriminationsma e entsprechen einer gro en Streubreite ber die Kategorien der 243 Mehrfachkorrespondenzanalyse Variablen und zeigen schlie lich einen hohen Grad an Diskrimination zwischen den Kategorien einer Variablen entlang dieser Dimension an Der Durchschnitt der Diskriminationsma e f r eine Dimension ist gleich dem Prozentsatz der Varianz die f r diese Dimension erkl rt werden kann Folglich sind die Dime
194. en Wert in Dimension 1 der einem schlechten K rperbild entspricht und dem positiven Wert in Dimension 2 der Anorexie Symptomen bzw schlechtem psychosozialem Verhalten entspricht Jedoch ist anders als bei der Mehrzahl der Patienten kaum oder gar kein Fortschritt in Dimension 1 zu verzeichnen In Dimension 2 gibt es offensichtlich einen gewissen Fortschritt in Richtung normal um den Wert 0 zwischen anorektischem und bulimischem Verhalten aber dann tritt eine Verschiebung hin zu bulimischen Symptomen ein Untersuchung der Strukturen im Krankheitsverlauf Um weitere Informationen dazu herauszufinden wie die beiden Dimensionen mit den vier Diagnosekategorien und den vier Zeitpunkten in Bezug standen wurde eine Zusatzvariable Time diagnosis interaction Zeit Diagnose Interaktion erstellt indem eine Kreuzklassifikation der vier Kategorien von Patient diagnosis Patientendiagnose und der vier Kategorien von Time of interview Zeitpunkt der Befragung durchgef hrt wurde Daher weist Time diagnosis interaction Zeit Diagnose Interaktion 16 Kategorien auf wobei die erste Kategorie f r die Anorexia nervosa Patienten bei ihrem ersten Besuch steht Die f nfte Kategorie steht f r die Anorexia nervosa Patienten bei Zeitpunkt 2 usw bis zur 16 Kategorie die f r die Patienten mit atypischer Essst rung bei Zeitpunkt 4 steht Durch die Verwendung der Zusatzvariablen Time diagnosis interaction Zeit Diagnose Interaktion wird die Untersuchung
195. en anstelle der Unterschiede zwischen den beiden Variablen untersuchen m chten Zeilenprinzipal Die Distanzen zwischen Zeilenpunkten sind Approximationen der Distanzen in der Korrespondenztabelle entsprechend dem gew hlten Distanzma Die Zeilenwerte entsprechen dem gewichteten Durchschnitt der Spaltenwerte Verwenden Sie diese Methode wenn Sie die Unterschiede oder hnlichkeiten zwischen den Kategorien der Zeilenvariablen untersuchen m chten Spaltenprinzipal Die Distanzen zwischen Spaltenpunkten sind Approximationen der Distanzen in der Korrespondenztabelle entsprechend dem gew hlten Distanzma Die Spaltenwerte entsprechen dem gewichteten Durchschnitt der Zeilenwerte Verwenden Sie diese Methode wenn Sie die Unterschiede oder hnlichkeiten zwischen Kategorien der Spaltenvariablen untersuchen m chten Benutzerdefiniert Sie m ssen einen Wert zwischen 1 und 1 angeben Der Wert 1 entspricht dem Spaltenprinzipal Der Wert 1 entspricht dem Zeilenprinzipal Der Wert 0 entspricht der Einstellung Symmetrisch Bei allen brigen Werten wird die Tr gheit in unterschiedlichem Ma e ber Zeilen und Spaltenwerte gestreut Mit dieser Methode k nnen Sie Biplots genau an Ihre Bed rfnisse anpassen Korrespondenzanalyse Statistiken Im Dialogfeld Statistiken k nnen Sie festlegen welche numerische Ausgabe erzeugt werden soll 57 Korrespondenzanalyse Abbildung 5 5 Dialogfeld Statistiken E Korresponde
196. en durch eine psychologische und medizinische Bewertung zu diagnostizieren Es kann sich jedoch als schwierig erweisen einen Patienten einer von mehreren Klassen von E st rungen zuzuordnen da es keine standardisierte Sympomatologie anorektischen bulimischen Verhaltens gibt Gibt es Symptome anhand deren die Patienten deutlich in die vier Gruppen unterteilt werden k nnen Welche Symptome haben sie gemeinsam Um diese Fragen zu beantworten f hrten Wissenschaftler Van der Ham Meulman Van Strien als auch Van Engeland 1997 eine Studie an 55 Jugendlichen mit bekannten E st rungen durch wie in der folgenden Tabelle gezeigt Tabelle 10 2 Patientendiagnose Diagnose Anzahl der Patienten Anorexia nervosa 25 Anorexia mit Bulimia nervosa 9 Bulimia nervosa nach Anorexia 14 Atypische E st rung 7 Gesamtergebnis 55 Jeder Patient wurde vier Mal ber einen Zeitraum von vier Jahren untersucht es fanden also insgesamt 220 Beobachtungen statt Bei jeder Beobachtung wurden die Patienten anhand der 16 Symptome bewertet die in der folgenden Tabelle dargestellt sind Die Symptomwerte fehlen f r Patient 71 zum Zeitpunkt 2 Patient 76 zum Zeitpunkt 2 und Patient 47 zum Zeitpunkt 3 wodurch 217 g ltige Beobachtungen verbleiben Diese Daten finden Sie in anorectic sav F r weitere Informationen siehe Thema Beispieldateien in Anhang A in IBM SPSS Categories 19 Tabelle 10 3 Modifizierte Morgan Russell Unterskalen zur Messung des Wohlbefindens
197. en f r Variablen die als ordinal behandelt werden entspricht der Reihenfolge der urspr nglichen Kategorien Die Differenzen zwischen den Kategorien werden allerdings nicht beibehalten So entsteht ein nicht abnehmendes Transformationsdiagramm das jedoch nicht unbedingt eine gerade Linie zeigen muss Wenn aufeinanderfolgende Kategorien hnlichen Quantifikationen entsprechen ist die Unterscheidung der Kategorien ggf nicht notwendig die Kategorien k nnten in diesem Fall kombiniert werden Diese Kategorien bilden ein Plateau im Transformationsdiagramm Dieses Muster kann jedoch auch entstehen wenn eine ordinale Struktur ber eine Variable die als nominal behandelt werden sollte berlagert wird Zeigt eine nachfolgende nominale Behandlung der Variablen dasselbe Muster ist die Kombination der Kategorien gerechtfertigt Wenn die Quantifikationen f r eine als ordinal behandelte Variable entlang einer geraden Linie liegen d rfte dar ber hinaus eine numerische Transformierung angebrachter sein Bei Variablen die als nominal behandelt werden ist die Reihenfolge der Kategorien an der horizontalen Achse mit der Reihenfolge der Codes identisch die die Kategorien repr sentieren Interpretationen der Kategorienreihenfolge oder der Distanz zwischen den Kategorien sind 118 Kapitel 9 gegenstandslos Das Diagramm kann eine beliebige nichtlineare oder lineare Form annehmen Besteht ein steigender Trend sollte die ordinale Behandlung verfolgt we
198. en mehrfach nominal einzeln nominal ordinal oder numerisch skaliert Die in der Prozedur verwendete maximale Anzahl von Dimensionen h ngt vom Messniveau der optimalen Skalierung der Variablen ab Wenn alle Variablen als ordinal einzeln nominal oder numerisch angegeben sind entspricht die maximale Anzahl von Dimensionen dem kleineren der folgenden beiden Werte die Anzahl der Beobachtungen minus 1 oder die Gesamtanzahl der Variablen Wenn jedoch nur zwei Variablen Sets definiert sind entspricht die maximale Anzahl von Dimensionen der Anzahl von Variablen im kleineren Set Wenn einige Variablen mehrfach nominal sind entspricht die maximale Anzahl von Dimensionen der Gesamtanzahl von mehrfach nominalen Kategorien plus der Anzahl von nicht mehrfach nominalen Variablen minus der Anzahl von mehrfach nominalen Variablen Wenn die Analyse beispielsweise f nf Variablen umfasst von denen eine mehrfach nominal mit vier Kategorien ist ist die maximale Anzahl von Dimensionen gleich 4 4 1 also 7 Wenn Sie eine Zahl angeben die gr er als der H chstwert ist wird der H chstwert verwendet Verwandte Prozeduren Wenn jedes Set eine Variable enth lt ist die nichtlineare kanonische Korrelationsanalyse quivalent zur Hauptkomponentenanalyse mit optimaler Skalierung Wenn jede dieser Variablen mehrfach nominal ist entspricht die Analyse der Mehrfachkorrespondenzanalyse Wenn zwei Variablen Sets vorhanden sind und eines dieser Sets nur eine Variable enth
199. enbl cke k nnen durch Ableiten von Werten mithilfe der Ungleichung im Dreieck oder der Spearman Distanzen aufgef llt werden Ross Cliff Beim Ross Cliff Start werden die Ergebnisse einer Einzelwertzerlegung auf der zweifach zentrierten und quadratischen Distanzmatrix als Ausgangswerte f r die Zeilen und Spaltenobjekte verwendet Korrespondenz Beim Korrespondenzstart werden die Ergebnisse einer Korrespondenzanalyse der Daten in umgekehrter Reihenfolge hnlichkeiten anstelle von Un hnlichkeiten mit einer symmetrischen Normalisierung von Zeilen und Spaltenwerten verwendet Zentroide Die Prozedur beginnt mit der Positionierung von Zeilenobjekten in der Konfiguration auf der Grundlage einer Eigenwertzerlegung Anschlie end werden die Spaltenobjekte auf dem Zentroid der angegebenen Auswahl positioniert Geben Sie f r die Anzahl der Auswahl eine positive ganze Zahl zwischen 1 und der Anzahl der hnlichkeitsvariablen an 95 Multidimensionale Entfaltung PREFSCAL m Mehrere Zufallsstarts Die L sungen werden f r verschiedene zuf llig ausgew hlte Ausgangskonfigurationen berechnet Die L sung mit dem kleinsten penalisierten Stress wird als beste L sung angezeigt m Benutzerdefiniert Sie k nnen Variablen ausw hlen die die Koordinaten Ihrer eigenen Ausgangskonfiguration enthalten Die Anzahl der ausgew hlten Variablen muss der angegebenen H chstanzahl von Dimensionen entsprechen wobei die erste Variable den Koordinaten von Di
200. enden Sie die kategoriale nichtlineare kanonische Korrelationsanalyse So lassen Sie eine kategoriale Hauptkomponentenanalyse berechnen W hlen Sie die folgenden Befehle aus den Men s aus Analysieren gt Dimensionsreduktion gt Optimale Skalierung Abbildung 3 1 Dialogfeld Optimale Skalierung E Optimale Skalierung rMessniveau der optimalen Skalierung Alle variablen sind mehrfach nominal Einige Variablen sind nicht mehrfach nominal rAnzahl der Yariablen Sets Ein Set Mehrere Sets rAusgew hlte Analyse Kategoriale Hauptkomponenten EEE ann ae W hlen Sie Einige Variablen sind nicht mehrfach nominal aus W hlen Sie die Option Ein Set Klicken Sie auf Definieren 30 Kapitel 3 Abbildung 3 2 Dialogfeld Kategoriale Hauptkomponentenanalyse i Kategoriale Hauptkomponenten Analysevariablen amp Diagnosis diag2 weight 1 Spline ordinal 2 2 A timez mens 1 Spline ordinal 2 2 fast 1 Spline ordinal 2 2 kinge 1 Spline ordinal 2 2 vomit 1 Spline ordinal 2 2 Skala und Gewicht definieren Diagramme Zusatzvariablen oger 5 tidiMuttiple nominal kategorie 2 Skala definieren e Beschriftungsvariablen Wahlen Sie mindestens zwei Analysevariablen aus und geben Sie die Anzahl der Dimensionen in der L sung an Klicken Sie auf OK Sie k nnen au erdem Beschriftun
201. enen Profile Ein niedriger Rang bedeutet eine starke Bevorzugung Diese Variable gibt ein Gesamtma der Bevorzugung f r die Profile an Mithilfe der kategorialen Regression untersuchen Sie wie die f nf Faktoren mit der Bevorzugung zusammenh ngen Dieses Daten Set befindet sich in carpet sav F r weitere Informationen siehe Thema Beispieldateien in Anhang A in IBM SPSS Categories 19 Copyright SPSS Inc 1989 2010 101 102 Kapitel 9 Standardverfahren der linearen Regressionsanalyse gt Zum Erzeugen der Ausgabe nach dem Standardverfahren der linearen Regression w hlen Sie die folgenden Befehle aus den Men s aus Analysieren gt Regression gt Linear Anmerkung F r diese Funktion ist die Option Statistics Base erforderlich Abbildung 9 1 Dialogfeld Lineare Regression E Lineare Regression X Abhangige Variable i amp Package design packa J ail Preference pref amp Brand name brand amp Price price amp Good Housekeeping s Weiter amp Money back guarantee Unabh ngige rBlock 1 von 1 Methode Auswahlvariable Fallbeschriftungen W hlen Sie Preference als abh ngige Variable aus W hlen Sie die Eintr ge Package design bis Money back guarantee als unabh ngige Variablen aus Klicken Sie auf Diagramme 103 Kategoriale Regression Abbildung 9 2 Dialogfeld Diagramme Lineare Regression Diagramme s
202. enen Quellenvariable sein und im Bereich von 1 bis zur Anzahl der Quellen liegen Zeilendiagramme Wenn Transformationen f r Zeilen erfolgen k nnen Sie f r Transformationsdiagramme und Shepard Diagramme die Zeile angeben f r die die Diagramme erstellt werden sollen Die eingegebenen Zeilenanzahl muss im Bereich von 1 bis zur Anzahl der Zeilen liegen Multidimensionale Entfaltung Ausgabe Im Dialogfeld Ausgabe k nnen Sie die angezeigte Ausgabe steuern und Ausz ge davon in eigenen Dateien speichern 93 Kapitel 8 Abbildung 8 6 Dialogfeld Ausgabe EF Multidimensionale Entfaltung Ausgabe Anzeige a E Eingabedaten F tterationsprotokoll Endgtittiger gemeinsamer Raum iM Anpassungsma e M Anf ngliche Daten Stress Zerlegung Transformierte hnlichkeiten Angepasste Distanzen rIn neuer Datei speichern Gemeinsame Raumkoordinaten al T Distanzen Transformierte hnlichkeiten GE an ie Anzeigen W hlen Sie mindestens eine der folgenden Anzeigeoptionen aus Eingabedaten Zeigt die urspr nglichen hnlichkeiten und sofern vorhanden die Datengewichtungen die Ausgangskonfiguration und die festen Koordinaten an Mehrere Starts Zeigt den Startwert f r Zufallszahlen und den penalisierten Stresswert f r jeden Zufallsstart an Anf ngliche Daten Zeigt die Koordinaten des anf nglichen gemeinsamen Raums an Iterationsprotokoll Zeigt das Iteration
203. ensionale Skalierungsl sung berechnen zu k nnen Sie k nnen Optionen f r das Erstellen von Un hnlichkeitsma en aus Ihren Daten festlegen Ma Hier k nnen Sie das Un hnlichkeitsma f r Ihre Analyse festlegen W hlen Sie aus dem Gruppenfeld Ma die Option aus die Ihrem Datentyp entspricht W hlen Sie dann aus dem Dropdown Listenfeld ein Ma aus das diesem Messwerttyp entspricht Die folgenden Optionen sind verf gbar m Intervall Euklidischer Abstand quadrierter Euklidischer Abstand Tschebyscheff Block Minkowski oder ein benutzerdefiniertes Ma H ufigkeiten Chi Quadrat Ma oder Phi Quadrat Ma Bin r Euklidischer Abstand quadrierter Euklidischer Abstand Gr endifferenz Musterdifferenz Varianz und Distanzma nach Lance und Williams Distanzmatrix erstellen Mit dieser Funktion k nnen Sie die Einheit der Analyse w hlen Zur Auswahl stehen Zwischen den Variablen oder Zwischen den F llen Werte transformieren In bestimmten F llen zum Beispiel wenn die Variablen mit sehr unterschiedlichen Skalen gemessen werden empfiehlt sich das Standardisieren der Werte vor dem Berechnen der hnlichkeiten nicht auf bin re Daten anwendbar W hlen Sie eine Standardisierungsmethode aus dem Dropdown Listenfeld Standardisieren aus Wenn keine Standardisierung erforderlich ist w hlen Sie Keine aus 80 Kapitel 7 Definieren eines Modells f r die multidimensionale Skalierung Im Dial
204. ensionen Die horizontale Dimension scheint eine Unterscheidung zwischen weichem und harten Brot oder Toast aufzuweisen wobei die Artikel nach rechts entlang der Achse weicher werden Bei der vertikalen Dimension ist keine eindeutige Interpretation m glich jedoch ist m glicherweise eine Unterscheidung nach blichkeit vorhanden bei der die Artikel nach unten entlang der Achse konventioneller werden Es entstehen mehrere Gruppen von Fr hst cksartikeln Zum Beispiel bilden Donuts Cinnamon Buns und Danish Pastry eine Gruppe von weichen und eher unkonventionellen Artikeln Muffins und Cinnamon Toast bilden eine Gruppe von h rteren jedoch auch konventionelleren Artikeln Die anderen Toasts und h rteren Br tchen bilden eine Gruppe von harten und eher unkonventionellen Artikeln Toast pop up ist ein harter und u erst unkonventioneller Artikel Die durch die Zeilenobjekte dargestellten Personen sind deutlich nach der Bevorzugung von harten oder weichen Artikeln gruppiert und weisen in der vertikalen Dimension starke Variationen innerhalb der Gruppen auf Beispiel Drei Weg Entfaltung von bevorzugten Fr hst cksartikeln In einer klassischen Studie Green et al 1972 wurden 21 MBA Studenten der Wharton School mit ihren Lebensgef hrten darum gebeten 15 Fr hst cksartikel in der Vorzugsreihenfolge von 1 am meisten bevorzugt bis 15 am wenigsten bevorzugt zu ordnen Die Bevorzugungen wurden in sechs unterschied
205. ent eingeben Lasso Der Penalisierungsterm von Lasso basiert auf der Summe der absoluten Koeffizienten Die Angabe eines Penalisierungskoeffizienten hnelt der Ridge Regression Lasso ist aber rechenintensiver Elastic Net Elastic Net kombiniert einfach die Lasso und Ridge Regressionspenalisierungen und sucht ber das Raster der angegebenen Werte um die besten Lasso und Ridge Regressions Penalisierungskoeffizienten zu finden F r ein gegebenes Paar von Lasso und Ridge Regressionspenalisierungen ist Elastic Net wesentlich rechenintensiver als Lasso 24 Kapitel 2 Regelungsdiagramme anzeigen Dies sind Diagramme die Regressionskoeffizienten und Regelungspenalisierung gegen berstellen Wenn nach einem Bereich von Werten f r den besten Penalisierungskoeffizienten gesucht wird gibt es Einblick auf die nderung der Regressionskoeffizienten in diesem Bereich Elastic Net Diagramme F r die Elastic Net Methode werden getrennte Regelungsdiagramme durch die Werte der Ridge Regressions Penalisierung erzeugt Alle m glichen Diagramme verwendet jeden Wert im von Minimum und Maximum angegebenen Bereich der Ridge Regressions Penalisierungswerte F r einige Ridge Penalisierungen k nnen Sie eine Untermenge an Werten im Bereich zwischen Minimum und Maximum angeben Geben Sie die Nummer eines Penalisierungswerts ein oder geben Sie einen Bereich von Werten an und klicken Sie auf Hinzuf gen Kategoriale Regression Ausgabe I
206. ent eingebracht wird Die F lle entsprechen registrierten W hlern F r jeden Fall sind County Gemeinde und Wohnviertel des W hlers erfasst poll_cs_sample sav Diese hypothetische Datendatei enth lt eine Stichprobe der in poll_cs sav aufgef hrten W hler Die Stichprobe wurde gem dem in der Plandatei poll csplan angegebenen Stichprobenplan gezogen und in dieser Datendatei sind die Einschlusswahrscheinlichkeiten und Stichprobengewichtungen erfasst Beachten Sie jedoch Folgendes Da im Stichprobenplan die PPS Methode PPS probability proportional to size Wahrscheinlichkeit proportional zur Gr e verwendet wird gibt es au erdem eine Datei mit den gemeinsamen Auswahlwahrscheinlichkeiten poll_jointprob sav Die zus tzlichen Variablen zum demografischen Hintergrund der W hler und ihrer Meinung zum vorgeschlagenen Gesetzentwurf wurden nach der Ziehung der Stichprobe erfasst und zur Datendatei hinzugef gt property_assess sav Hierbei handelt es sich um eine hypothetische Datendatei in der es um die Bem hungen eines f r einen Bezirk County zust ndigen Immobilienbewerters geht trotz eingeschr nkter Ressourcen die Einsch tzungen des Werts von Immobilien auf dem aktuellsten Stand zu halten Die F lle entsprechen den Immobilien die im vergangenen Jahr in dem betreffenden County verkauft wurden Jeder Fall in der Datendatei enth lt die Gemeinde in der sich die Immobilie befindet den Bewerter der die Immobilie besichtigt hat die
207. er Variation notwendig ist Wenn die Analyse mehr als zwei Dimensionen umfasst werden dreidimensionale Diagramme der ersten drei Dimensionen erzeugt Weitere Dimensionen k nnen durch die Bearbeitung des Diagramms angezeigt werden Bereich und Skala definieren Abbildung 4 3 Dialogfeld Bereich und Skala definieren FFA OVERALS Bereich und Skala Minimum 1 Maximum Messniveau Ordinal Mehrfach nominal Einzeln nominal Diskret numerisch CBE are ie Sie m ssen f r jede Variable einen Bereich definieren Der angegebene H chstwert muss eine Ganzzahl sein Gebrochene Datenwerte werden in der Analyse abgeschnitten Ein Kategoriewert der au erhalb des angegebenen Bereiches liegt wird in der Analyse ignoriert Um eine m glichst kleine Ausgabe zu erzielen erstellen Sie mithilfe der Funktion Automatisch umkodieren verf gbar im Men Transformieren aufeinander folgende mit 1 beginnende Kategorien f r Variablen die als nominale oder ordinale Variablen behandelt werden Das Umkodieren in fortlaufende Ganzzahlen empfiehlt sich nicht f r Variablen die auf numerischem Niveau skaliert sind Um bei Variablen die als numerische Variablen behandelt werden eine m glichst kleine Ausgabe zu erzielen subtrahieren Sie f r alle Variablen von jedem Wert den Minimalwert und addieren Sie 1 Sie m ssen au erdem die f r die Quantifikation der einzelnen Variablen verwendete Skalierung
208. er als 1 sind was zu einem negativen Wert f r Cronbachs Alpha f hrt sollten Sie der zweidimensionalen L sung den Vorzug geben Die dreidimensionale L sung wird zu Anschauungszwecken dargestellt Abbildung 10 16 Streudiagramm Matrix der Objektwerte mit drei Dimensionen Dimension 1 2 Dimension 2 on 3 Dimensi Dimension 1 Dimension 2 Dimension 3 161 Kategoriale Hauptkomponentenanalyse Die oberste Zeile l t erkennen dass die erste Dimension PRIMARY GROUPS und MOBS von den anderen Gruppen abtrennt Beachten Sie dass sich die Reihenfolge der Objekte entlang der vertikalen Achse in keinem der Plots in der obersten Zeile ndert Alle diese Plots verwenden Dimension 1 als y Achse Die mittlere Plot Zeile erm glicht die Interpretation von Dimension 2 Die zweite Dimension hat sich gegen ber der zweidimensionalen L sung leicht ge ndert Zuvor wies die zweite Dimension drei deutliche Klumpen auf nun jedoch sind die Objekte weiter auf der Achse verteilt Die dritte Dimension unterst tzt die Trennung von MOBS und PRIMARY GROUPS die in der zweidimensionalen L sung nicht m glich war Untersuchen wir die Plots Dimension 2 versus Dimension 3 und Dimension 1 versus Dimension 2 genauer Auf der durch die Dimensionen 2 und 3 definierten Fl che formen die Objekte ungef hr ein Rechteck mit CROWDS MODERN COMMUNITY SECONDARY GROUPS und PUBLIC an den Eckpunkten Auf dieser Fl che erscheinen MOBS und PRI
209. er den Wert 0 degree Die Anzahl der Trennungsgrade im Stammbaum Ihre Eltern befinden sich 1 Knoten ber Ihnen Ihre Kinder entsprechend 1 Knoten unter Ihnen Um zu Ihren Geschwistern zu gelangen gehen Sie 1 Knoten nach oben zu Ihren Eltern und dann 1 Knoten abw rts zu Ihren Geschwistern Hier liegen also 2 Trennungsgrade vor Ihr Cousin ist 4 Trennungsgrade entfernt 2 Knoten nach oben zu Ihren Gro eltern dann 2 Knoten nach unten ber Tante Onkel bis zum Cousin 261 Multidimensionale Skalierung Die externen Variablen befinden sich in kinship_var sav Au erdem befindet sich eine Anfangskonfiguration aus einer fr heren Analyse in kinship_ini sav F r weitere Informationen siehe Thema Beispieldateien in Anhang A in JBM SPSS Categories 19 Durchf hren der Analyse Abbildung 14 9 Dialogfeld Modell E Multidimensionale Skalierung Modell rSkalierungsmodel rr hnlichkeitstransformationen Identit t Verhattnisskala Euklidisch gewichtet Intervall Euklidisch verallgemeinert Ordinal Reduzierter Rang H cet ndene Beobachtunge Rang 1 Spline rad rForm Be Untere Dreiecksmatrix Obere Dreiecksmatrix Gesamte Matrix Transformationen zuweisen Getrennt in jeder Quelle Alle Quellen gleichzeitig r hnlichketen Dimensionen Un hnlichkeiten Minimum hnlichkeiten Pe rasen aeerecnen L rire gt Zum Er
210. erfekt trennt Alle Objekte mit Gewinde weisen negative Objektwerte auf w hrend alle Objekte ohne Gewinde positive Werte aufweisen Die beiden Kategorien bilden zwar keine kompakten Gruppen die perfekte Differenzierung zwischen den Kategorien wird jedoch allgemein als gutes Ergebnis betrachtet 246 Kapitel 13 Abbildung 13 10 Objektwerte beschriftet mit Kopfform 4 konisch gew lbt o Dimension 2 gew lbt konisch FS gew lbt konisch 0 rund zylinder rmie mi Ylirzeapihertistmi Oo Sach Nach ha Aachach fisch 1 15 1 0 05 00 05 10 1 5 Dimension 1 Das mit Kopfform beschriftete Diagramm zeigt da diese Variable in beiden Dimensionen diskriminiert Die Objekte mit dem Wert FLACH bilden eine Gruppe in der rechten unteren Ecke des Diagramms w hrend die Objekte mit dem Wert GEW LBT eine Gruppe in der rechten oberen Ecke bilden Die Objekte mit dem Wert KONISCH liegen alle oben links Diese Objekte sind jedoch weiter verteilt als die anderen Gruppen und sind daher nicht so homogen Schlie lich k nnen die Objekte mit dem Wert ZYLINDERFORMIG nicht von den Objekten mit dem Wert RUND getrennt werden da beide in der linken unteren Ecke des Diagramms liegen 247 Abbildung 13 11 Objektwerte beschriftet mit Lange in cm 4 je 25cm 34 NS 5 7 2 5 cm a c A 1J 1 5cm a 6 0 5cCm 05cm o 0 12 gm 2cM cm cp amm Acm 1cm noan 1 cmO1 cm ITT T DT oT 15 10
211. erhaltensweisen liegenden room park allgemein weniger eingeschr nkt sind 302 Kapitel 15 hnlichkeitstransformationen Abbildung 15 30 Transformationsdiagramm Transformed Proximity 0 2 4 6 8 10 Raw Proximity Unconditional linear transformation with intercept Die Ahnlichkeiten wurden in dieser Analyse als linear behandelt sodass das Diagramm der transformierten Werte im Vergleich zu den urspriinglichen Ahnlichkeiten eine gerade Linie bildet Die Anpassungsg te dieser L sung ist gut mit einer anderen Transformation der hnlichkeiten kann jedoch m glicherweise eine bessere Anpassung erreicht werden ndern der hnlichkeitstransformation Ordinal gt Um eine L sung mit einer ordinalen Transformation der hnlichkeiten zu erstellen klicken Sie auf die Schaltfl che Zuletzt verwendete Dialogfelder und w hlen Sie Multidimensionale Entfaltung aus 303 Multidimensionale Entfaltung gt Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf Modell Abbildung 15 31 Dialogfeld Modell E Multidimensionale Entfaltung Modell Skalierungsmodel _ Ahnlichkeitstranstormationen Identit t Keine Euklidisch gewichtet Linear Euklidisch verallgemeinert Spline r hnlichkeiten Un hnlichkeiten hnlichkeiten 2a Ordinal r Dimensionen Gebundene Beobachtungen l sen zZ Transformationen zuweisen Injeder Zeile f r sich
212. erst ndnis der Daten beitr gt Beziehung zu anderen Prozeduren von Categories Wenn die Daten aus Distanzen innerhalb einer einzelnen Gruppe von Objekten eine quadratische und symmetrische Matrix bestehen verwenden Sie die multidimensionale Skalierung Beziehung zu Standardverfahren Die Prozedur Multidimensionale Entfaltung in SPSS Categories PREFSCAL bietet zahlreiche Verbesserungen gegen ber der in der Statistics Base verf gbaren Entfaltungsprozedur ber ALSCAL Mit PREFSCAL kann der gemeinsame Raum eingeschr nkt werden Au erdem wird in PREFSCAL versucht ein penalisiertes Stressma zu minimieren was dazu beitr gt degenerierte L sungen zu vermeiden f r die ltere Algorithmen anf llig sind Seitenverh ltnis in Diagrammen mit optimaler Skalierung Das Seitenverh ltnis in Diagrammen mit optimaler Skalierung ist isotropisch Bei einem zweidimensionalen Diagramm ist die Distanz die in Dimension 1 f r eine 1 Einheit steht gleich der Distanz die in Dimension 2 f r eine 1 Einheit steht Wenn Sie bei einem zweidimensionalen Diagramm den Bereich einer Dimension ndern ndert das System die Gr e der anderen Dimension um die physischen Abst nde gleich gro zu halten Das isotropische Seitenverh ltnis kann f r die Prozeduren f r die optimale Skalierung nicht au er Kraft gesetzt werden Empfohlene Literatur In folgenden Texten finden Sie allgemeine Informationen zu den Verfahren zur optimalen Skalierung
213. erung deaktiviert wurde entspricht der penalisierte Stress dem Kruskal Stress I der Stressanteil des Funktionswerts entspricht dem Ma f r die mangelhafte G te der Anpassung nach Kruskal Geringe Stresswerte deuten normalerweise darauf hin dass die L sung gut an die Daten angepasst ist Es gibt jedoch mehrere Hinweise auf eine degenerierte L sung m Der Variationskoeffizient f r die transformierten hnlichkeiten ist relativ zum Variationskoeffizienten f r die urspr nglichen hnlichkeiten sehr klein Dies weist darauf hin dass die transformierten hnlichkeiten f r jede Zeile nahezu konstant sind und die L sung somit keine Unterscheidung zwischen Objekten erm glicht 276 Kapitel 15 m Die Quadratsummen der Vermischungsindizes nach DeSarbo sind ein Ma f r die Vermischung der Punkte in den unterschiedlichen Gruppen Eine fehlende Vermischung deutet darauf hin dass die L sung m glicherweise degeneriert ist Je n her sich der Wert bei 0 befindet desto besser ist die Vermischung der L sung Der ausgegebene Wert ist sehr gro Dies deutet darauf hin dass die L sung nicht vermischt ist Shepards Index f r Nicht Degeneration ein Prozentwert verschiedener Distanzen ist gleich 0 Dies ist ein deutlicher Hinweis auf unzureichend unterschiedliche Abst nde und die L sung ist wahrscheinlich degeneriert Gemeinsamer Raum Abbildung 15 4 Verbundenes Diagramm des gemeinsamen Raums f r eine degenerierte L sung Dimen
214. es Standardfehle rs Inversion base height Pressure gradient mm Hg visibility miles Temperature degrees F Day ofthe year Abh ngige Variable Daily ozone level Diese Tabelle zeigt die standardisierten Regressionskoeffizienten f r die Einflussgr en Ein h ufiger Fehler beim Interpretieren dieser Werte ist es den Schwerpunkt auf die Koeffizienten zu legen und dabei die Quantifikationen zu vernachl ssigen Sie k nnen nicht davon ausgehen dass ein positiver Wert f r Inversion base height beispielsweise darauf schlie en l sst dass bei einer wachsenden Einflussgr e die vorhergesagten Ozonwerte ansteigen Alle Interpretationen m ssen sich relativ zu den transformierten Variablen verhalten sodass sich bei Erh hungen von Inversion base height auch die Ozonwerte erh hen Um die Auswirkungen der urspr nglichen Variablen untersuchen zu k nnen m ssen die Kategorien in einen Zusammenhang mit den Quantifikationen gebracht werden 127 Kategoriale Regression Abbildung 9 32 Transformationsdiagramm von Inversion base height nominal Transformation Inversion base height Quantifikationen 1 2 Zi 6E Ep 6p w wn N D o N w ao 00 00t 00 L4 00 019 00 LL 00 208 00 bb 00 66 00 rr OO OLZL OOTLL o OO OlFL O0 S LE 00 L091L 00 8zS 00 F08L 00 L62 00 1661 00986 00 1612 009 Lb o 00 S827 00 9L27 00 SODE 00 EERZ 00 9F LE 00 07 LE 00 6BE
215. espondenzanalyse Abbildung 12 2 Dialogfeld Korrespondenzanalyse A Korrespondenzanalyse x er Bereich detinieren f Spalte u Bereich definieren gt Wahlen Sie Image als Zeilenvariable aus Klicken Sie auf Bereich definieren 227 Abbildung 12 3 Dialogfeld Zeilenbereich definieren A Korrespondenzanalyse Zeilenbereich definieren X Kategorienbereich f r Zeilenvariable image Minimalwert Maximalwert Nebenbedingungen f r Kategorien Keine Kategorien m ssen gleich sein Erg nzende Kategorie Geben Sie 1 als Mindestwert ein Geben Sie 23 als H chstwert ein Klicken Sie auf Aktualisieren Klicken Sie auf Weiter W hlen Sie Marke als Spaltenvariable aus Abbildung 12 4 Dialogfeld Spaltenbereich definieren F Korrespondenzanalyse Spaltenbereich definieren X Kategorienbereich f r Spaltenvariable brand Minimalwert Maximalwert 6 Nebenbedingungen fur Kategorien Keine Kategorien m ssen gleich sein Erg nzende Kategorie Geben Sie 1 als Mindestwert ein Geben Sie 6 als H chstwert ein Klicken Sie im Dialogfeld Korrespondenzanalyse auf Bereich definieren Korrespondenzanalyse 228 Kapitel 12 Klicken Sie auf Aktualisieren Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Korrespondenzanalyse auf Modell Abbildung 12 5 Dialogfeld Modell A Kor
216. etischen Datendatei geht es um die berlebenszeiten von Patienten die nach einem Rehabilitationsprogramm wegen eines isch mischen Schlaganfalls mit einer Reihe von Problemen zu k mpfen haben Nach dem Schlaganfall werden das Auftreten von Herzinfarkt isch mischem Schlaganfall und h morrhagischem Schlaganfall sowie der Zeitpunkt des Ereignisses aufgezeichnet Die Stichprobe ist auf der linken Seite abgeschnitten da sie nur Patienten enth lt die bis zum Ende des Rehabilitationprogramms das nach dem Schlaganfall durchgef hrt wurde berlebten stroke_valid sav Diese hypothetische Datendatei enth lt den Zustand einer medizinischen Datenbank nachdem diese mithilfe der Prozedur Daten validieren berpr ft wurde Sie enth lt immer noch potenziell anomale F lle survey_sample sav Diese Datendatei enth lt Umfragedaten einschlie lich demografischer Daten und verschiedener Meinungskennzahlen Sie beruht auf einer Teilmenge der Variablen aus der NORC General Social Survey aus dem Jahr 1998 Allerdings wurden zu Demonstrationszwecken einige Daten abge ndert und weitere fiktive Variablen hinzugef gt telco sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Telekommunikationsunternehmens geht die Kundenabwanderung zu verringern Jeder Fall entspricht einem Kunden und enth lt verschiedene Informationen zum demografischen Hintergrund und zur Servicenutzung telco_extra sav Diese Datendat
217. ew hlten Grad Die St cke werden durch die vom Benutzer festgelegte Anzahl und die durch die Prozedur bestimmte Lage der inneren Knoten definiert Spline nominal Die einzige Information aus der beobachteten Variable die in der optimal skalierten Variable beibehalten wird ist die Gruppierung der Objekte in Kategorien Die Reihenfolge der Kategorien bei der beobachteten Variablenwird nicht beibehalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaziert Die resultierende Transformation ist ein glatter st ckweiser m glicherweise nichtmonotoner Polynom mit dem gew hlten Grad Die St cke werden durch die vom Benutzer festgelegte Anzahl und die durch die Prozedur bestimmte Lage der inneren Knoten definiert Mehrfach nominal Die einzige Information aus der beobachteten Variable die in der optimal skalierten Variable beibehalten wird ist die Gruppierung der Objekte in Kategorien Die Reihenfolge der Kategorien bei der beobachteten Variablenwird nicht beibehalten Die Kategoriepunkte werden in den Zentroiden der Objekte in den einzelnen Kategorien plaziert Die Bezeichnung Mehrfach bedeutet dass f r jede Dimension andere Gruppen von Quantifikationen berechnet werden Ordinal Die Reihenfolge der Kategorien bei der beobachteten Variable wird bei der optimal skalierten Variable beibehalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaz
218. f r diese Variable als zur gleichen Kategorie der zus tzlichen zugeh rig betrachtet werden m Fehlende Werte vorschreiben Fehlende Werte werden bei Objekten mit fehlenden Werten f r die ausgew hlte Variable gesetzt Sie k nnen die Methode ausw hlen nach der die Werte gesetzt werden W hlen Sie Modalwert wenn fehlende Werte durch die h ufigste Kategorie ersetzt werden sollen Falls mehrere Modalwerte vorhanden sind wird der Modalwert mit der kleinsten Kategorienummer verwendet Wenn Sie Zusatzkategorie ausw hlen werden fehlende Werte durch die gleiche Quantifikation einer zus tzlichen Kategorie ersetzt Dies bedeutet aber auch dass Objekte mit einem fehlenden Wert f r diese Variable als zur gleichen Kategorie der zus tzlichen zugeh rig betrachtet werden m Objekte mit fehlenden Werten f r diese Variable ausschlie en Objekte mit fehlenden Werten f r die ausgew hlte Variable werden aus der Analyse ausgeschlossen Diese Strategie ist f r Zusatzvariablen nicht verf gbar Mehrfachkorrespondenzanalyse Optionen Im Dialogfeld Kategoriale Hauptkomponenten Optionen k nnen Sie die anf ngliche Konfiguration ausw hlen Kriterien f r die Iterationen und die Konvergenz festlegen eine Normalisierungsmethode ausw hlen die Methode zum Beschriften der Diagramme ausw hlen und Zusatzobjekte angeben 66 Kapitel 6 Abbildung 6 6 Dialogfeld Optionen FA mca Option
219. f Objekt 173 Kategoriale Hauptkomponentenanalyse Abbildung 10 29 Objekt und Variablendiagramme Kategoriale Hauptkomponenten Objekt und Variablendiagramme Diagramme V Objektpunkte Objekte und variablen Biplot Variablenkoordinaten Zentroide A Objekte Ladungen und Zentroide Triplot Biplot und Triplotvariablen Verf gbar Ausgew hlt Einschlie en Alle Variablen Ausgew hlte Variablen binge vomit purge hyper fami eman Objekte beschriften Verf gbar Ausgew hlt Beschriften anhand Fallnummer Variable W hlen Sie aus dass Objekte nach Variable beschriftet werden sollen gt W hlen Sie time und diag als die Variablen aus nach denen die Objekte beschriftet werden sollen Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Kategoriale Hauptkomponenten auf Kategorie 174 Kapitel 10 Abbildung 10 30 Kategoriendiagramme fl Kategoriale Hauptkomponenten Kategoriendiagramme X Kategoriendiagramme verbundene Kategoriendiagramme Transformationsdiagramme Dimensionen f r mehrfach nominal Z Residuen Diagramme einschlie en Zentroide projizieren von Auf d rl Fordern Sie Kategoriendiagramme f r tidi an Fordern Sie Transformationsdiagramme f r weight bis body an W hlen Sie aus dass die Zentroide von tidi auf binge satt und preo projiziert werden sollen Klicken Sie auf
220. fen m chte bankloan_binning sav Hierbei handelt es sich um eine hypothetische Datendatei die Informationen zum Finanzstatus und demografischen Hintergrund von 5 000 fr heren Kunden enth lt behavior sav In einem klassischen Beispiel Price als auch Bouffard 1974 wurden 52 Sch ler Studenten gebeten die Kombinationen aus 15 Situationen und 15 Verhaltensweisen auf einer 10 Punkte Skala von 0 ausgesprochen angemessen bis 9 ausgesprochen unangemessen zu bewerten Die Werte werden ber die einzelnen Personen gemittelt und als Un hnlichkeiten verwendet behavior_ini sav Diese Datendatei enth lt eine Ausgangskonfiguration f r eine zweidimensionale L sung f r behavior sav brakes sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Qualit tskontrolle in einer Fabrik geht die Scheibenbremsen f r Hochleistungsautomobile herstellt Die Datendatei enth lt Messungen des Durchmessers von 16 Scheiben aus 8 Produktionsmaschinen Der Zieldurchmesser f r die Scheiben ist 322 Millimeter breakfast sav In einer klassischen Studie Green als auch Rao 1972 wurden 21 MBA Studenten der Wharton School mit ihren Lebensgef hrten darum gebeten 15 Fr hst cksartikel in der Vorzugsreihenfolge von 1 am meisten bevorzugt bis 15 am wenigsten bevorzugt zu ordnen Die Bevorzugungen wurden in sechs unterschiedlichen Szenarien erfasst von Overall preference Allgemein bevorzugt bis
221. fig mit der Marke CC verbunden Yuppies dagegen am h ufigsten mit der Marke CC und am wenigsten h ufig mit der Marke EE Empfohlene Literatur In folgenden Texten finden Sie weitere Informationen zur Korrespondenzanalyse Fisher R A 1938 Statistical methods for research workers Edinburgh Oliver and Boyd Fisher R A 1940 The precision of discriminant functions Annals of Eugenics 10 Gilula Z als auch S J Haberman 1988 The analysis of multivariate contingency tables by restricted canonical and restricted association models Journal of the American Statistical Association 83 Kapitel 13 Mehrfachkorrespondenzanalyse Der Zweck der Mehrfachkorrespondenzanalyse die auch als Homogenit tsanalyse bekannt ist besteht darin Quantifizierungen zu finden die in dem Sinne optimal sind da die Kategorien so weit wie m glich voneinander getrennt sind Dies bringt mit sich da Objekte innerhalb derselben Kategorie eng beieinander und Objekte in unterschiedlichen Kategorien m glichst weit entfernt voneinander dargestellt werden Der Ausdruck Homogenit t bezieht sich auch auf die Tatsache da die Analyse am erfolgreichsten ausf llt wenn die Variablen homogen sind d h wenn sie die Objekte in Klumpen mit der gleichen Kategorie oder hnlichen Kategorien aufteilen Beispiel Eigenschaften von Eisenwaren Um festzustellen wie die Mehrfachkorrespondenzanalyse funktioniert verwenden Sie Daten aus Hartigan Hartigan
222. formierten hnlichkeiten als auch Distanzen Die Distanzen werden durch Punkte angezeigt die transformierten hnlichkeiten durch eine Linie Abh ngig davon wie Transformationen angewendet werden wird f r jede Zeile oder Quelle eine separate Linie gezeichnet Eine unabh ngige Transformation erzeugt eine Linie m Streudiagramm der Anpassung Es wird ein Streudiagramm der transformierten hnlichkeiten im Vergleich zu den Distanzen angezeigt Wenn mehrere Quellen angegeben werden erh lt jede Quelle eine separate Farbe m Residuen Diagramme Es wird ein Streudiagramm der transformierten hnlichkeiten im Vergleich zu den Residuen transformierte hnlichkeiten minus Distanzen angezeigt Wenn mehrere Quellen angegeben werden erh lt jede Quelle eine separate Farbe Stile f r Zeilenobjekte Hiermit k nnen Sie umfassender festlegen wie Zeilenobjekte in den Diagrammen dargestellt werden Die Werte der optionalen Farbvariablen werden verwendet um alle Farben zu durchlaufen Die Werte der optionalen Markierungsvariablen werden verwendet um alle m glichen Markierungen zu durchlaufen Diagramme der Quellen F r Individueller Raum Streudiagramm der Anpassung und Residuen Diagramme sowie falls Transformationen nach Quellen angewendet werden f r Transformationsdiagramme und Shepard Diagramme k nnen Sie angeben f r welche Quellen Diagramme erstellt werden sollen Die eingegebenen Quellennummern m ssen Werte der im Hauptdialogfeld angegeb
223. g W hlen Sie Linear als hnlichkeitstransformation aus und aktivieren Sie die Option Konstanten Term einschlie en 297 Multidimensionale Entfaltung Wahlen Sie unter Transformationen zuweisen die Option Alle Quellen gleichzeitig aus Klicken Sie auf Weiter Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf Optionen Abbildung 15 26 Dialogfeld Optionen r usgangskonfiguration Klassisch Ross Cliff Korrespondenz Zentroide Zufallsstarts tart tarts Anpassen ai Multidimensionale Entfaltung Optionen riterationskriterien Stress Konvergenz 000001 Mindest Stress 0001 Maximalzahl der terationen 5000 rPenalisierungsterm St rke Bereich r ngepasste Konfiguration Verf gbar Variablen einlesen aus Datei C Program Files SPSSinc PASWY behavior_ini sav Die Anzahl muss der maximalen Dimensionalit t des Modells entsprechen Aktuell 2 Yariablen mit Zeilenkoordinaten m ssen vor Variablen mit Spaltenkoordinaten stehen Ausgew hlt W hlen Sie im Gruppenfeld Ausgangskonfiguration die Option Anpassen Wechseln Sie zu behavior_ini sav und w hlen Sie diese Datei als die Datei aus die die benutzerdefinierte Ausgangskonfiguration enth lt F r weitere Informationen siehe Thema Beispieldateien in Anhang A in IBM SPSS Categories 19 W hlen Sie dim und dim2 als Variablen f r die Ausgangskonfigur
224. g mehrfach nominal an b Der Iterationsvorgang wurde angehalten weil der Konvergenztestwert erreicht wurde Abbildung 10 8 Modellzusammenfassung Yarianz ber cksichtigt Cronbachs Gesamt Dimension Alpha Eigenwert der Varianz 1 67 774 2 26 746 Gesamtwert 94 520 a Die Summe von Cronbachs Alpha basiert auf der Summe der Eigenwerte Die Eigenwerte k nnen als Anzeichen daf r verwendet werden wie viele Dimensionen erforderlich sind In diesem Beispiel wurde die Standardanzahl von Dimensionen 2 verwendet Ist das die richtige Anzahl Als allgemeine Regel sollte der Eigenwert f r eine Dimension gr er als 1 sein wenn alle Variablen entweder einzeln nominal ordinal oder numerisch sind Da die zweidimensionale L sung 94 52 der Varianz erkl rt w rde eine dritte Dimension vermutlich kaum weitere Informationen ergeben Bei mehrfach nominalen Variablen gibt es also keine einfache Faustregel f r die Bestimmung der angemessenen Anzahl an Dimensionen Wenn die Anzahl der Variablen durch die Gesamtzahl der Kategorien minus der Anzahl der Variablen ersetzt wird gilt die oben angegebene Regel noch immer Doch diese Regel allein w rde vermutlich mehr Dimensionen zulassen als erforderlich sind Bei der Auswahl der Anzahl an Dimensionen ist die n tzlichste Richtlinie die Anzahl so klein zu halten dass sinnvolle Interpretationen m glich sind Die Modellzusammenfassungstabelle zeigt au erdem Cronbachs Alpha ein Reliabil
225. gemeinsamen Fokus der Analysen darstellt Selbst bei kleinen Tabellen kann es jedoch schwierig sein die Ursache von Abweichungen von 12 Kapitel 1 der Unabh ngigkeit zu ermitteln Der Nutzen der Korrespondenzanalyse besteht in der Anzeige derartiger Muster f r zweidimensionale Tabellen beliebiger Gr e Wenn ein Zusammenhang zwischen den Zeilen und den Spaltenvariablen besteht d h wenn der Chi Quadrat Wert signifikant ist kann die Korrespondenzanalyse die Ermittlung der Art dieser Beziehung erleichtern Mehrfachkorrespondenzanalyse Bei der Mehrfachkorrespondenzanalyse wird versucht eine L sung zu erstellen bei der Objekte innerhalb derselben Kategorie eng zusammen und Objekte in verschiedenen Kategorien in gro em Abstand zueinander geplottet werden Jedes Objekt liegt so nah wie m glich an den Kategoriepunkten der Kategorien die f r dieses Objekt gelten So unterteilen die Kategorien die Objekte in homogene Untergruppen Variablen werden als homogen betrachtet wenn sie Objekte die in denselben Kategorien vorliegen auch in dieselben Untergruppen einordnen Bei einer eindimensionalen L sung weist die Mehrfachkorrespondenzanalyse jeder Kategorie jeder Variablen optimale Skalenwerte Kategoriequantifikationen zu dergestalt dass die Kategorien insgesamt im Durchschnitt die maximale Streubreite aufweisen Bei einer zweidimensionalen L sung ermittelt die Mehrfachkorrespondenzanalyse ein zweites Set von Quantifizierungen der
226. gn vor Eine Erh hung von Package design um eine Standardabweichung f hrt zu einem Abfall der vorhergesagten Einstufung der Bevorzugung um 0 748 Standardabweichungen Package design wird jedoch nominal behandelt sodass ein Anstieg der Quantifikationen nicht unbedingt mit einem Anstieg bei den urspr nglichen Kategoriecodes einhergeht Standardisierte Koeffizienten werden h ufig fehlinterpretiert es wird meist angenommen dass diese Koeffizienten die Wichtigkeit der einzelnen Einflussgr en widerspiegeln Regressionskoeffizienten k nnen jedoch die Auswirkungen einer Einflussgr e auf die Beziehungen zwischen den Einflussgr en nicht vollst ndig beschreiben Um die Auswirkungen von Einflussgr en eingehend untersuchen zu k nnen m ssen alternative Statistiken in Verbindung mit den standardisierten Koeffizienten verwendet werden Korrelationen und Wichtigkeit Um den Beitrag der Einflussgr en zur Regression korrekt zu interpretieren reicht es nicht wenn Sie lediglich die Regressionskoeffizienten betrachten Dar ber hinaus sollten auch die Korrelationen die partiellen Korrelationen und die Teilkorrelationen ber cksichtigt werden Die nachstehende Tabelle zeigt diese korrelationalen Messwerte f r die einzelnen Variablen Die Korrelation nullter Ordnung ist die Korrelation zwischen der transformierten Einflussgr e und der transformierten Antwort Bei diesen Daten besteht die gr te Korrelation bei Package design Wenn Sie jedoch
227. gsvariablen f r die Diagramme und Zusatzvariablen bestimmen die in die gefundene L sung eingepa t werden Skala und Gewicht definieren in CATPCA Sie k nnen das Messniveau der optimalen Skalierung f r die Analysevariablen und die Zusatzvariablen festlegen In der Standardeinstellung werden sie als monotone Splines zweiten Grades ordinal mit zwei inneren Knoten skaliert Au erdem k nnen Sie die Gewichtung der Analysevariablen bestimmen 31 Kategoriale Hauptkomponentenanalyse CATPCA Abbildung 3 3 Skala und Gewichtung definieren EH Kategoriale Hauptkomponenten Skala und Gewichtung definieren Yariablengewichtung rMessniveau der optimalen Skalierung Spline ordinal Ordinal Spline nominal Nominal Mehrfach nominal Numerisch r Spline Variablengewichtung Sie k nnen f r jede Variable eine Gewichtung festlegen Bei dem angegebenen Wert muss es sich um eine positive ganze Zahl handeln Der Standardwert ist 1 Messniveau der optimalen Skalierung Sie k nnen auch das f r die Quantifikation der einzelnen Variablen verwendete Skalierungsniveau ausw hlen Spline ordinal Die Reihenfolge der Kategorien bei der beobachteten Variable wird bei der optimal skalierten Variable beibehalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaziert Die resultierende Transformation ist ein glatter st ckweiser monotoner Polynom mit dem g
228. gt Dies wird auch als Verh ltnistransformation bezeichnet Sie k nnen optional Konstanten Term einschlie en ausw hlen In diesem Fall werden die hnlichkeiten durch einen konstanten Term verschoben Dies wird auch als Intervalltransformation bezeichnet Spline Die transformierten hnlichkeiten sind eine gegl ttete nicht fallende st ckweise polynomiale Transformation der urspr nglichen hnlichkeiten Sie k nnen den Grad des Polynoms und die Anzahl der inneren Knoten angeben Sie k nnen optional Konstanten Term einschlie en ausw hlen In diesem Fall werden die hnlichkeiten durch einen konstanten Term verschoben Glatt Die transformierten hnlichkeiten weisen dieselbe Ordnung wie die urspr nglichen hnlichkeiten auf Es gilt jedoch eine Einschr nkung die die Unterschiede zwischen aufeinander folgenden Werten ber cksichtigt Das Ergebnis ist eine glatte ordinale Transformation Sie k nnen angeben ob die Bindung von gebundenen hnlichkeiten erhalten bleiben muss oder aufgehoben werden darf Ordinal Die transformierten hnlichkeiten weisen dieselbe Ordnung wie die urspr nglichen hnlichkeiten auf Sie k nnen angeben ob die Bindung von gebundenen hnlichkeiten erhalten bleiben muss oder aufgehoben werden darf Transformationen zuweisen Geben Sie an ob nur die hnlichkeiten innerhalb jeder Zeile oder nur die hnlichkeiten innerhalb jeder Quelle miteinander verglichen werden sollen oder ob die Vergleiche unabh
229. hauer mobs Mobs wie Menschenmassen jedoch mit wesentlich st rkerer Interaktion primary groups Prim rgruppen vertraulich secondary groups Sekund rgruppen freiwillig und modern community die moderne Gesellschaft eine lockere Konf deration die aus einer engen physischen N he und dem Bedarf an spezialisierten Dienstleistungen entsteht Die folgende Tabelle zeigt die Variablen im Daten Set die sich aus der Klassifizierung in sieben soziale Gruppen in den Guttman Bell Daten ergeben zusammen mit ihren Variablenlabeln und den Wertelabeln Kategorien die den Niveaus der einzelnen Variablen zugeordnet sind Dieses Daten Set finden Sie in guttman sav F r weitere Informationen siehe Thema Beispieldateien in Anhang A in IBM SPSS Categories 19 Neben der Auswahl von Variablen die in die Berechnung Copyright SPSS Inc 1989 2010 148 149 Kategoriale Hauptkomponentenanalyse der kategorialen Hauptkomponentenanalyse eingeschlossen werden sollen k nnen Sie Variablen ausw hlen die zur Beschriftung der Objekte in Diagrammen dienen sollen In diesem Beispiel sind die ersten f nf Variablen in den Daten in die Analyse eingeschlossen w hrend Cluster ausschlie lich als Beschriftungsvariable verwendet wird Bei Angabe einer kategorialen Hauptkomponentenanalyse m ssen Sie das optimale Skalierungsniveau f r jede Analysenvariable angeben In diesem Beispiel wird f r alle Analysevariablen ein ordinales Ni
230. haus M als auch F W Young 1985 An analysis and synthesis of multiple correspondence analysis optimal scaling dual scaling homogeneity analysis and other methods for quantifying categorical multivariate data Psychometrika 50 Theunissen N C M J J Meulman A L Den Ouden H M Koopman G H Verrips S P Verloove Vanhorick als auch J M Wit 2003 Changes can be studied when the measurement instrument is different at different time points Health Services and Outcomes Research Methodology 4 Tucker L R 1960 Intra individual and inter individual multidimensionality In Psychological Scaling Theory amp Applications H Gulliksen als auch S Messick Hgg New York John Wiley and Sons Van der Burg E 1988 Nonlinear canonical correlation and some related techniques Leiden DSWO Press Van der Burg E als auch J De Leeuw 1983 Nonlinear canonical correlation British Journal of Mathematical and Statistical Psychology 36 Van der Burg E J De Leeuw als auch R Verdegaal 1988 Homogeneity analysis with k sets of variables An alternating least squares method with optimal scaling features Psychometrika 53 Van der Ham T J J Meulman D C Van Strien als auch H Van Engeland 1997 Empirically based subgrouping of eating disorders in adolescents A longitudinal perspective British Journal of Psychiatry 170 Van der Kooi A J als auch J J Meulman 1997 MURALS Multiple regressio
231. he Essst rung Anorexia Nervosa Anorexia und Bulimia Nervosa Bullimia Nervosa nach Anorexia Atypische Essst rung o in Zeit Diagnose Wechselwirkung 2 0 50 0 00 0 50 Zeit Diagnose Wechselwirkung 1 H 376 5 B 470 25 Punkt gt Doppelklicken Sie dann zur Verbindung der Punkte auf das Diagramm und klicken Sie im Diagramm Editor auf das Tool zum Hinzuf gen von Interpolationslinien gt Schlie en Sie den Diagramm Editor 185 Kategoriale Hauptkomponentenanalyse Abbildung 10 43 Strukturen des Krankheitsverlaufs Patient Diagnosis O Anorexia Nervosa O Anorexia with Bulimia Nervosa Bullimia Nervosa after Anorexia Atypical Eating O Disorder Timeldiagnosis interaction Quantification dimension 2 1 50 1 00 0 50 0 00 0 50 1 00 Timeldiagnosis interaction Quantification dimension 1 Durch Verbindung der Kategoriepunkte f r die einzelnen Diagnosekategorien im Verlauf der Zeit ergeben sich Muster die sofort nahelegen dass die erste Dimension eine Relation zur Zeit und die zweite Dimension eine Relation zur Diagnose aufweist wie wir zuvor aus den Objektwertediagrammen ermittelt haben Dieses Diagramm zeigt jedoch zus tzlich dass sich die Krankheiten im Verlauf der Zeit tendenziell aneinander angleichen Au erdem ist der Fortschritt bei allen Gruppen zwischen den Zeitpunkten 1 und 2 am gr ten die anorektischen Patienten zeigen noch einen gewissen weiteren Fortschr
232. hkeiten entspricht 76 Kapitel 7 W hlen Sie optional Gewichtungsvariablen aus Die Anzahl muss der Anzahl der ausgew hlten hnlichkeitsvariablen entsprechen Achten Sie darauf dass die Reihenfolge der Gewichtungen der Reihenfolge der damit gewichteten hnlichkeiten entspricht gt Wenn mehrere Quellen vorhanden sind w hlen Sie optional eine Quellenvariable aus Die Anzahl der F lle in jeder hnlichkeitsvariablen muss der Anzahl der hnlichkeitsvariablen multipliziert mit der Anzahl der Quellen entsprechen Dar ber hinaus k nnen Sie ein Modell f r die multidimensionale Skalierung angeben Einschr nkungen f r den gemeinsamen Raum festlegen Konvergenzkriterien festlegen die zu verwendende Ausgangskonfiguration angeben sowie Diagramme und die Ausgabe ausw hlen hnlichkeiten in Spalten Wenn Sie im Dialogfeld Datenformat das Modell mit mehreren Spalten f r mehrere Quellen ausw hlen wird das Hauptdialogfeld folgenderma en dargestellt Abbildung 7 3 Dialogfeld hnlichkeiten in Spalten E Multidimensionale Skalierung hnlichkeiten in Spalten hnlichkeiten E prox f E prox2 I owna Zeilen gt EEE oira 2 Gewichtungen ME Et gt W hlen Sie mindestens zwei hnlichkeitsvariablen aus Es wird davon ausgegangen dass es sich bei den Variablen um Distanzmatrizen aus verschiedenen Quellen handelt W hlen Sie eine Zeilenvariable zum Festlegen der Z
233. hlenswert w re Dei Quantifikationen f r die Gruppen 26 30 36 40 und 41 45 k nnen nicht niedriger sein als die Quantifikation f r die Gruppe 20 25 Diese Werte werden daher auf den Grenzwert gesetzt Wenn Sie angeben dass diese Werte kleiner sein k nnen als die Quantifikation f r die niedrigste Altersgruppe also das Alter als nominal behandeln kann dies die Anpassungsg te erh hen Das Alter kann somit zwar als ordinale Variable angesehen werden eine Behandlung als ordinale Variable ist in diesem Fall wohl eher nicht angebracht W rde das Alter als numerisch behandelt werden und so die Distanzen zwischen den Kategorien aufrechterhalten w rde dies zu einer betr chtlichen Verringerung der Anpassungsg te f hren Einzelkategoriekoordinaten im Vergleich mit Mehrfachkategoriekoordinaten Bei jeder Variablen mit Behandlung als einfach nominal ordinal oder numerisch werden Quantifikationen Einzelkategoriekoordinaten und Mehrfachkategoriekoordinaten ermittelt Diese Statistiken werden f r Age in years dargestellt Abbildung 11 21 Koordinaten f r Age in years Koordinaten von Mehrere Einzelkategorien Dimension Dimension Randh ufigkeit Quantifikation 1 2 1 2 3 5 0 1 1 0 0 2 1 2 0 Fehlend Jede Kategorie f r die keine F lle erfasst wurden erh lt die Quantifikation 0 F r Age in years umfasst dies die Kategorien 31 35 46 50 und 51 55 Diese Kategorien m ssen nicht gemeinsam mit dem anderen K
234. hnelltest zur Erkennung von HIV Infektionen zu entwickeln Die Ergebnisse des Tests sind acht kr ftiger werdende Rotschattierungen wobei kr ftigeren Schattierungen auf eine h here Infektionswahrscheinlichkeit hindeuten Bei 2 000 Blutproben von denen die H lfte mit HIV infiziert war wurde ein Labortest durchgef hrt hourlywagedata sav Hierbei handelt es sich um eine hypothetische Datendatei zum Stundenlohn von Pflegepersonal in Praxen und Krankenh usern mit unterschiedlich langer Berufserfahrung insurance_claims sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um eine Versicherungsgesellschaft geht die ein Modell zur Kennzeichnung verd chtiger potenziell betr gerischer Anspr che erstellen m chte Jeder Fall entspricht einem Anspruch insure sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um eine Versicherungsgesellschaft geht die die Risikofaktoren untersucht die darauf hinweisen ob ein Kunde die Leistungen einer mit einer Laufzeit von 10 Jahren abgeschlossenen Lebensversicherung in Anspruch nehmen wird Jeder Fall in der Datendatei entspricht einem Paar von Vertr gen je einer mit Leistungsforderung und der andere ohne wobei die beiden Versicherungsnehmer in Alter und Geschlecht bereinstimmen 313 Beispieldateien judges sav Hierbei handelt es sich um eine hypothetische Datendatei mit den Wertungen von ausgebildeten Kampfrichtern sowie eines Sportliebhabers zu 300
235. hren Straft ter und erfasst Daten zu dessen demografischen Hintergrund einige Details zu seinem ersten Verbrechen sowie die Zeit bis zu seiner zweiten Festnahme sofern diese innerhalb von zwei Jahren nach der ersten Festnahme erfolgte recidivism_cs_sample sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen einer Strafverfolgungsbeh rde geht einen Einblick in die R ckfallraten in ihrem Zust ndigkeitsbereich zu gewinnen Jeder Fall entspricht einem fr heren Straft ter der im Juni 2003 erstmals aus der Haft entlassen wurde und erfasst Daten zu dessen demografischen Hintergrund einige Details zu seinem ersten Verbrechen sowie die Daten zu seiner zweiten Festnahme sofern diese bis Ende Juni 2006 erfolgte Die Straft ter wurden aus per Stichprobenziehung ermittelten Polizeidirektionen ausgew hlt gem dem in recidivism_cs csplan angegebenen Stichprobenplan Da hierbei eine PPS Methode PPS probability proportional to size Wahrscheinlichkeit proportional zur Gr e verwendet wird gibt es au erdem eine Datei mit den gemeinsamen Auswahlwahrscheinlichkeiten recidivism_cs_jointprob sav rfm_transactions sav Eine hypothetische Datendatei mit Kauftransaktionsdaten wie Kaufdatum gekauften Artikeln und Geldbetrag f r jede Transaktion salesperformance sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um Bewertung von zwei neuen Verkaufsschulungen geht 60 Mitarbeiter die
236. hrfachkategoriekoordinaten f r Age in years in Kategorie 2 und bleiben bis Kategorie 9 etwa auf demselben Niveau in dieser Kategorie erfolgt dann ein deutlicher Anstieg Ein hnliches Muster ist bei der zweiten Dimension zu sehen Diese Beziehungen werden in den Einzelkategoriekoordinaten entfernt bei denen die ordinale Einschr nkung angewendet wird In beiden Dimensionen findet nun kein Abfall der Koordinaten mehr statt Die unterschiedliche Struktur der beiden Koordinaten Sets legt nahe dass ggf eine nominale Behandlung angebrachter w re Zentroide und projizierte Zentroide Das Diagramm der Zentroide die mit Variablen beschriftet sind sollte auf dieselbe Weise interpretiert werden wie das Diagramm der Kategoriequantifikationen bei der Homogenit tsanalyse oder wie die Mehrfachkategoriekoordinaten bei der nichtlinearen Hauptkomponentenanalyse Ein solches Diagramm zeigt klar inwieweit die Variablen die Objektgruppen voneinander trennen Die Zentroiden befinden sich am Schwerpunkt der Objekte Beachten Sie dass die Kategorien f r Age in years nicht sehr deutlich getrennt sind Die Kategorien mit den niedrigeren Altersgruppen sind im linken Bereich des Diagramms gruppiert Wie bereits erw hnt wurde ist das Messniveau mit ordinaler Skalierung f r Age in years wahrscheinlich zu streng Abbildung 11 22 Zentroide mit Variablen beschriftet Age in years 154 dog s 2 z i g O Marital status nee a Pets owned 104 O village
237. iben Fehlende Werte werden bei Objekten mit fehlenden Werten f r die ausgew hlte Variable gesetzt Sie k nnen die Methode ausw hlen nach der die Werte gesetzt werden W hlen Sie Modalwert wenn fehlende Werte durch die h ufigste Kategorie ersetzt werden sollen Falls mehrere Modalwerte vorhanden sind wird der Modalwert mit der kleinsten Kategorienummer verwendet Wenn Sie Zusatzkategorie ausw hlen werden fehlende Werte durch die gleiche Quantifikation einer zus tzlichen Kategorie ersetzt Dies bedeutet aber auch dass Objekte mit einem fehlenden Wert f r diese Variable als zur gleichen Kategorie der zus tzlichen zugeh rig betrachtet werden m Objekte mit fehlenden Werten f r diese Variable ausschlie en Objekte mit fehlenden Werten f r die ausgew hlte Variable werden aus der Analyse ausgeschlossen Diese Strategie ist f r Zusatzvariablen nicht verf gbar Kategoriale Hauptkomponenten Optionen Im Dialogfeld Kategoriale Hauptkomponenten Optionen k nnen Sie die anf ngliche Konfiguration ausw hlen Kriterien f r die Iterationen und die Konvergenz festlegen eine Normalisierungsmethode ausw hlen die Methode zum Beschriften der Diagramme ausw hlen und Zusatzobjekte angeben Abbildung 3 6 Dialogfeld Optionen fa Kategoriale Hauptkomponenten Optionen Zusatzobjekte Normalisierungsmethode Bereich von Fallen Einzelner Fall rip Konvergenz 00001 Maximalzahl der
238. ichkeiten Un hnlichkeiten hnlichkeiten Dimensionen Abnlichkeitstransformationen O Keine Linear Spline Grad Innere Knoten Glatt ordinal m Konstanten Term einschlie en E Gebundene Beobachtungen l sen Transformationen zuweisen In jeder Zeile f r sich Getrennt in jeder Quelle Alle Quellen gleichzeitig gt Wahlen Sie Euklidisch gewichtet als Skalierungsmodell Klicken Sie auf Weiter Multidimensionale Entfaltung gt Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf Optionen 282 Kapitel 15 Abbildung 15 10 Dialogfeld Optionen Multidimensionale Entfaltung Optionen Ausgangskonfiguration Iterationskriterien Klassisch Stress Konvergenz Berechnung nach 4 je Mindest Stress Rosset Maximalzahl der tterationen Korrespondenz Zentroide Penalisierungsterm St rke Zufallsstarts Anzahl Starts Bereich Anpassen Angepasste Konfiguration Yariablen einlesen aus Datei Die Anzahl muss der maximalen Dimensionalitat des Modells entsprechen Aktuell 2 Yariablen mit Zeilenkoordinaten m ssen vor Variablen mit Spaltenkoordinaten stehen Verf gbar Ausg hit etter borechen Hite Wahlen Sie Spearman als Annahmemethode f r die Ausgangskonfiguration Klassisch aus gt Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Multidimensionale E
239. ie Antwort auf die kategorialen Einflu werte selbst einer Regression unterzogen wird Folglich wird f r jede Variable ein Koeffizient gesch tzt Bei kategorialen Variablen sind die Kategoriewerte jedoch willk rlich Durch verschiedene Kodierungsarten der Kategorien ergeben sich jeweils unterschiedliche Koeffizienten wodurch ein analysen bergreifender Vergleich gleicher Variablen erschwert wird CATREG erweitert die Standardmethode durch eine gleichzeitige Skalierung nominaler ordinaler und numerischer Variablen Die Prozedur quantifiziert kategoriale Variablen sodass in den Quantifikationen die Merkmale der urspr nglichen Kategorien zum Ausdruck kommen Dadurch werden quantifizierte kategoriale Variablen auf dieselbe Weise wie numerische Variablen behandelt Durch die Verwendung nichtlinearer Transformationen k nnen Variablen auf einer Vielzahl von Ebenen analysiert und somit das jeweils geeignetste Modell gefunden werden Beispiel Mithilfe der kategorialen Regression k nnte beispielsweise beschrieben werden wie die Zufriedenheit im Beruf von der Berufsgruppe der geografischen Region und der Fahrtzeit abh ngt Unter Umst nden k nnte sich herausstellen dass bei leitenden Angestellten und geringer Fahrtzeit zum Arbeitsplatz ein hohes Zufriedenheitsniveau zu verzeichnen ist Mithilfe der resultierenden Regressionsgleichung k nnte die Zufriedenheit im Beruf f r eine beliebige Kombination der drei unabh ngigen Variablen prognostiziert werde
240. ie auch bei Gewinde in der vorherigen Analyse der Fall bilden die Objekte keine kompakten Gruppen doch die Differenzierung der Objekte nach Kategorien ist perfekt 251 Mehrfachkorrespondenzanalyse Abbildung 13 18 Objektwerte beschriftet mit Einkerbung des Kopfes nach der Entfernung des Ausrei ers 5 Keine Keine Keine Schlitz 14 e Schitz Schliz N Schlitz c o g 5 Keine a 0 Schitz Schlitz o Kein e Schlitz he a Schlitz 07 Keine 414 Schlitz Keine Keine Mo AS eo 15 10 05 00 05 10 15 Dimension 1 Das Objektwertediagramm mit der Beschriftung Einkerbung des Kopfes zeigt da die erste Dimension perfekt zwischen Objekten mit und ohne Einkerbung diskriminiert wie auch in der vorherigen Analyse der Fall Im Gegensatz zur vorherigen Analyse kann die zweite Dimension nun zwischen den beiden Kategorien unterscheiden Die Auslassung von SCHRAUBE1 dem einzigen Objekt mit einem Kreuzschlitz hat erhebliche Auswirkungen auf die Interpretation der zweiten Dimension Diese Dimension differenziert nun die Objekte auf der Grundlage von Messing Kopfform und Ldnge in cm Empfohlene Literatur In folgenden Texten finden Sie weitere Informationen zur Mehrfachkorrespondenzanalyse Benz cri J P 1992 Correspondence analysis handbook New York Marcel Dekker Guttman L 1941 The quantification of a class of attributes A theory and method of scale construction In The Prediction of Personal Adjust
241. ie die Art der Formatierung des Daten Sets an Die hnlichkeiten befinden sich in einer Matrix ber mehrere Spalten verteilt oder in einer einzigen Spalte mit zwei verschiedenen Variablen zur Kennzeichnung der Zeile und Spalte jeder hnlichkeit m hnlichkeiten stammen aus mehreren Spalten einer Matrix Die hnlichkeits Matrix erstreckt sich ber mehrere Spalten deren Anzahl der Anzahl der Objekte entspricht Hiermit ffnen Sie das Dialogfeld hnlichkeiten in Matrizen ber mehrere Spalten m hnlichkeiten stammen aus einer einzigen Spalte Die Ahnlichkeits Matrix befindet sich in einer einzigen Spalte bzw Variablen Es sind zwei weitere Variablen erforderlich welche die Zeile und Spalte jeder Zelle angeben Hiermit ffnen Sie das Dialogfeld hnlichkeiten in einer einzigen Spalte 75 Multidimensionale Skalierung PROXSCAL Mehrere Quellen Wenn mehrere Quellen f r hnlichkeiten vorhanden sind geben Sie die Art der Formatierung des Daten Sets an Die hnlichkeiten befinden sich ber mehrere Spalten verteilt in gestapelten Matrizen in mehreren Spalten mit einer Quelle pro Spalte oder in einer einzigen Spalte m hnlichkeiten stammen aus mehreren Spalten in gestapelten Matrizen Die hnlichkeits Matrizen erstrecken sich ber mehrere Spalten deren Anzahl der Anzahl der Objekte entspricht und sind bereinandergestapelt in mehreren Zeilen deren Anzahl der Anzahl der Objekte mal der Anzahl der Quellen entspricht Hier
242. iert Einstufen Die Variable wird durch Bilden einer Rangfolge diskretisiert Multiplizieren Die aktuellen Werte der Variablen werden standardisiert mit 10 multipliziert und gerundet Anschlie end wird eine Konstante zu den Werten addiert sodass der niedrigste diskretisierte Wert 1 betr gt 64 Kapitel 6 Gruppierung Folgende Optionen sind bei der Diskretisierung von Variablen durch Gruppierung verf gbar Anzahl Kategorien Geben Sie eine Anzahl von Kategorien an Legen Sie au erdem fest ob die Werte der Variablen ber die Kategorien ungef hr normal oder gleichverteilt werden sollen Gleiche Intervalle Die Variablen werden in Kategorien umkodiert die durch diese gleich gro en Intervalle definiert werden Sie m ssen die Gr e der Intervalle angeben Mehrfachkorrespondenzanalyse Fehlende Werte Im Dialogfeld Kategoriale Hauptkomponenten Fehlende Werte k nnen Sie die Strategie f r die Verarbeitung von fehlenden Werten in den Analyse und Zusatzvariablen festlegen Abbildung 6 5 Dialogfeld Fehlende Werte fF MCA Fehlende Werte r Strategie f r fehlenden Verte Analysevariablen head VVerte ausschlie en Modalwert indhead YVerte ausschlie en Modalwert bottom VVerte ausschlie en Modalwert brass VVerte ausschlie en Modalwert length erte ausschlie en Modalwert Zusatzvariablen Ane r Strategie Modalwert Zusatzkategorie Fehlende Werte vorschr
243. iert Die resultierende Transformation ist besser angepa t aber weniger glatt als bei Spline ordinal 32 Kapitel 3 m Nominal Die einzige Information aus der beobachteten Variable die in der optimal skalierten Variable beibehalten wird ist die Gruppierung der Objekte in Kategorien Die Reihenfolge der Kategorien bei der beobachteten Variablenwird nicht beibehalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaziert Die resultierende Transformation ist besser angepa t aber weniger glatt als bei Spline nominal m Numerisch Die Kategorien werden als geordnet mit gleichen Abst nden behandelt Intervallniveau Die Reihenfolge der Kategorien und die gleichen Abst nde zwischen den Kategorienummern in der beobachteten Variablenbleiben in der optimal skalierten Variablen erhalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaziert Wenn alle Variablen auf numerischem Niveau skaliert sind entspricht die Analyse der normalen Hauptkomponentenanalyse Kategoriale Hauptkomponenten Diskretisierung Im Dialogfeld Kategoriale Hauptkomponenten Diskretisierung k nnen Sie eine Methode zum Umkodieren der Variablen festlegen Sofern nicht anders angegeben werden Variablen mit Dezimalwerten in sieben Kategorien gruppiert die nahezu normalverteilt sind Wenn die Variable weniger als sieben unterschiedliche Werte aufweist
244. ieselbe Datenmatrix eine allgemeine Distanzmatrix oder eine verbundene Kontingenztafel handeln kann die eine aggregierte Matrix ist bei der sowohl die Zeilen als auch die Spalten Kategorien von Variablen repr sentieren Die Mehrfachkorrespondenzanalyse kann auch als Hauptkomponentenanalyse von Daten betrachtet werden die auf dem mehrfach nominalen Niveau skaliert wurden Beziehung zu Standardverfahren Die Mehrfachkorrespondenzanalyse kann als Analyse einer mehrdimensionalen Kontingenztafel betrachtet werden Mehrdimensionale Kontingenztafeln k nnen auch mit der Prozedur Crosstabs analysiert werden doch Crosstabs gibt getrennte Zusammenfassungsstatistiken f r die einzelnen Kategorien jeder Kontrollvariablen aus Bei der Mehrfachkorrespondenzanalyse kann h ufig die Beziehung zwischen allen Variablen in einem 13 Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten einzelnen zweidimensionalen Diagramm zusammengefa t werden Eine erweiterte Verwendung der Mehrfachkorrespondenzanalyse besteht darin die urspr nglichen Kategoriewerte mit den optimalen Skalenwerten aus der ersten Dimension zu ersetzen und eine sekund re multivariate Analyse durchzuf hren Da die Mehrfachkorrespondenzanalyse die Kategoriebeschriftungen durch numerische Skalenwerte ersetzt k nnen nach der Mehrfachkorrespondenzanalyse viele verschiedene Prozeduren angewendet werden f r die numerische Daten erforderlich sind Die Prozedur Fakt
245. ifikationen zu einer Senkung des vorhergesagten Ozonwerts Die Linie ist zwar recht gezackt l sst jedoch die zugrunde liegende Form immer noch erkennen Die Transformationsdiagramme zeigen daher dass Temperature auf ordinaler Ebene skaliert werden sollte f r alle anderen Einflussgr en sollte statt dessen die nominale Skalierung verwendet werden 132 Kapitel 9 Zum Neuberechnen der Regression mit Skalierung von Temperature auf ordinaler Ebene ffnen Sie erneut das Dialogfeld Kategoriale Regression Abbildung 9 37 Dialogfeld Skala definieren i Kategoriale Regression Skala definieren X Messniveau der optimalen Skalierung Spline ordinal Ordinal Spline nominal Nominal Numerisch Spline Grad 2 Innere Knoten eter Anecnen L rire W hlen Sie Temperature aus und klicken Sie auf Skala definieren W hlen Sie als Messniveau der optimalen Skalierung die Option Ordinal aus Klicken Sie auf Weiter vy v v y Klicken Sie im Dialogfeld Kategoriale Regression auf Speichern Abbildung 9 38 Speichern fH Kategoriale Regression Speichern K Yorhergesagte Werte in Arbeitsdatei speichern Residuen in Arbeitsdatei speichern rDiskretisierte Daten III rNormalisierte Modelle und Koeffizienten Diskretisierte Daten erstellen Neues Daten Set erstellen eues Datenblatt erstellen Daten Set Name DatenSet6 Datenblatt Name Neue Datendatei
246. iligen Gegenst ck aus der Standardstatistik beschrieben Hinweis Diese Prozeduren und ihre Implementierung in IBM SPSS Statistics wurden von der Data Theory Scaling System Group DTSS entwickelt die aus Mitgliedern der Institute f r P dagogik und Psychologie der sozialwissenschaftlichen Fakult t der Universit t Leiden besteht Was ist optimale Skalierung Der Sinn der optimalen Skalierung ist es den Kategorien jeder Variablen numerische Quantifizierungen zuzuweisen und dadurch zu erm glichen dass Standardprozeduren verwendet werden k nnen um eine L sung f r die quantifizierten Variablen zu erhalten Die optimalen Skalenwerte werden den Kategorien der einzelnen Variablen anhand des Optimierungskriteriums f r die verwendete Prozedur zugewiesen Anders als die urspr nglichen Labels der nominalen oder ordinalen Variablen in der Analyse haben diese Skalenwerte metrische Eigenschaften In den meisten Prozeduren in Categories wird die optimale Quantifizierung f r die einzelnen skalierten Variablen ber eine iterative Methode alternierende kleinste Quadrate genannt erzielt bei der zun chst die aktuellen Quantifizierungen verwendet werden um eine L sung zu finden und dann die Quantifizierungen anhand dieser L sung aktualisiert werden Anschlie end werden die aktualisierten Quantifizierungen verwendet um eine neue L sung zu finden anhand derer wiederum die Quantifizierungen aktualisiert werden usw Dieser Vorgang wird fortge
247. imensionen der L sung betrachten wir die Komponentenladungen Alle Variablen weisen eine positive Komponentenladung in der ersten Dimension auf was bedeutet dass ein gemeinsamer Faktor vorliegt der mit allen Variablen positiv korreliert Abbildung 10 36 Komponentenladungsdiagramme 0 75 vomit mood Dimension 2 fami 0 0 0 2 0 4 0 6 0 8 Dimension 1 Die zweite Dimension trennt die Variablen Die Variablen Binge eating Fre attacken Vomiting Erbrechen und Purging Abf hrmittel bilden ein B ndel mit gro en positiven Ladungen in der zweiten Dimension Diese Symptome werden blicherweise als charakteristisch f r bulimisches Verhalten betrachtet Die Variablen Emancipation from family Emanzipation von der Familie School employment record schulische berufliche Leistungen Sexual attitude sexuelle Einstellung Body weight K rpergewicht und Menstruation Menstruation bilden ein weiteres B ndel in das auch Restriction of food intake fasting Einschr nkung der Nahrungsaufnahme Fasten und Family relations Familienbeziehungen aufgenommen werden kann da die Vektoren dieser Variablen eng beim Hauptklumpen liegen und diese Variablen als Symptome f r Anorexie gelten Fasten Gewicht Menstruation oder psychosozialer Natur sind Emanzipation schulische berufliche Leistungen sexuelle Einstellung Familienbeziehungen Die Vektoren dieses B ndels sind rechtwinklig lotrecht zu den Vektoren von binge
248. iminiert vergleicht das Diagramm der Kategoriequantifikationen auch die Variablendiskrimination Eine Variable mit Kategorien die weit auseinander liegen bietet eine bessere Diskrimination als eine Variable mit Kategorien 245 Mehrfachkorrespondenzanalyse die eng beieinander liegen So liegen entlang Dimension 1 die beiden Kategorien von Messing wesentlich enger beieinander als die beiden Kategorien von Gewinde was bedeutet da Gewinde entlang dieser Dimension eine bessere Diskrimination aufweist als Messing Entlang Dimension 2 sind die Abst nde jedoch sehr hnlich was nahelegt da diese Variablen entlang dieser Dimension bis zum selben Grad diskriminieren Das weiter oben er rterte Diskriminationsma identifiziert diese Beziehungen indem Varianzen verwendet werden um die Verteilung der Kategorien widerzuspiegeln Genauere Untersuchung der Objektwerte Tiefere Einblicke in die Daten k nnen durch Untersuchung der nach den einzelnen Variablen beschrifteten Objektwertediagramme gewonnen werden Idealerweise sollten hnliche Objekte ausschlie liche Gruppen bilden und diese sollten weit voneinander entfernt liegen Abbildung 13 9 Objektwerte beschriftet mit Gewinde 4 je Ja 3 N 7 5 z Nein 7 c E A u Ja o G Hes Nein 0 Jia Ja a Nein Neilfjein Ja o NeinO Nein 15 10 05 00 05 10 15 Dimension 1 Das mit Gewinde beschriftete Diagramm zeigt da die erste Dimension Jaund Nein p
249. ind keine Komponentenladungen vorhanden Bei diesen Variablen k nnen jedoch die Zentroide in das Diagramm aufgenommen werden Sie k nnen alle mehrfach nominalen Variablen verwenden oder eine Teilmenge ausw hlen 43 Kategoriale Hauptkomponentenanalyse CATPCA Zus tzliche Funktionen beim Befehl CATPCA Sie k nnen die kategoriale Hauptkomponentenanalyse an Ihre Bed rfnisse anpassen indem Sie Ihre Auswahl in ein Syntax Fenster einf gen und die daraus resultierende Befehlssyntax f r CATPCA bearbeiten Mit der Befehlssyntax Sprache verf gen Sie au erdem ber folgende M glichkeiten m Mit dem Unterbefehl SAVE k nnen Sie Stammnamen f r die transformierten Variablen Objektwerte und Approximationen festlegen wenn Sie diese in der Arbeitsdatei speichern m Mit dem Unterbefehl PLOT kann die H chstl nge f r Beschriftungen f r jedes Diagramm getrennt festgelegt werden m Mit dem Unterbefehl PLOT kann eine separate Variablenliste f r Residuen Diagramme festgelegt werden Vollst ndige Informationen zur Syntax finden Sie in der Command Syntax Reference Kapitel Nichtlineare kanonische Korrelationsanalyse OVERALS Die nichtlineare kanonische Korrelationsanalyse entspricht der kategorialen kanonischen Korrelationsanalyse mit optimaler Skalierung Ziel dieser Prozedur ist es den Grad der gegenseitigen hnlichkeit von Sets kategorialer Variablen zu bestimmen Die nichtlineare kanonische Korrelationsanalyse ist auch u
250. ionale Entfaltung angeben Einschr nkungen f r den gemeinsamen Raum festlegen Konvergenzkriterien festlegen die zu verwendende Ausgangskonfiguration angeben sowie Diagramme und die Ausgabe ausw hlen Definieren eines Modells f r die multidimensionale Entfaltung Im Dialogfeld Modell k nnen Sie ein Skalierungsmodell die minimale und maximale Anzahl seiner Dimensionen die Struktur der Distanzmatrix und die f r die hnlichkeiten zu verwendende Transformation angeben sowie festlegen ob hnlichkeiten abh ngig von der Zeile abh ngig von der Quelle oder unabh ngig von der Quelle transformiert werden 91 Abbildung 8 2 Dialogfeld Modell E Multidimensionale Entfaltung Modell r Skalierungsmodell Identit t Euklidisch gewichtet Euklidisch verallgemeinert r hnlichkeiten Un hnlichkeiten hnlichkeiten Dimensionen _ _J r hnlichkeitstransformationen O Keine Linear Spline O Glatt Ordinal Gebundene Beobachtungen l sen Transformationen zuweisen In jeder Zeile f r sich Getrennt in jeder Quelle Alle Quellen gleichzeitig Ce een im I Multidimensionale Entfaltung PREFSCAL Skalierungsmodell W hlen Sie eine der folgenden Alternativen aus m Identit t Alle Quellen weisen dieselbe Konfiguration auf m Euklidisch gewichtet Hierbei handelt es sich um ein Modell f r individuelle Differenzen Jede Que
251. ionale Entfaltung der hnlichkeiten individuell anpassen indem Sie die Auswahl in ein Syntaxfenster einf gen und die daraus resultierende Befehlssyntax f r PREFSCAL bearbeiten Mit der Befehlssyntax Sprache verf gen Sie au erdem ber folgende M glichkeiten m Wenn mehrere Quellen verf gbar sind k nnen Sie f r individuelle R ume Streudiagramme der Anpassung und Residuendiagramme bei Transformationen von Matrizen auch f r Transformationsdiagramme und Shepard Diagramme Listen mit mehreren Quellen angeben mit dem Unterbefehl PLOT m Bei Transformationen von Zeilen k nnen Sie f r Transformationsdiagramme und Shepard Diagramme Listen mit mehreren Zeilen angeben mit dem Unterbefehl PLOT m Sie k nnen anstelle einer Zeilen ID Variablen eine Anzahl von Zeilen angeben mit dem Unterbefehl INPUT m Sie k nnen anstelle einer Quellen ID Variablen eine Anzahl von Quellen angeben mit dem Unterbefehl INPUT Vollst ndige Informationen zur Syntax finden Sie in der Command Syntax Reference Teil II Beispiele Kapitel Kategoriale Regression Das Ziel der kategorialen Regression mit optimaler Skalierung liegt darin die Beziehung zwischen einer Antwortvariablen und einer Gruppe von Einflussgr en zu beschreiben Durch die Quantifizierung dieser Beziehung k nnen Werte der Antwort f r jede Kombination von Einflussgr en vorhergesagt werden In diesem Kapitel werden die Analysen im Rahmen der Regression mit optima
252. ionalit t eines Variablen Sets zu verringern und dabei gleichzeitig die Variation soweit wie m glich zu ber cksichtigen Jeder Kategorie jeder Variablen werden Skalenwerte zugewiesen dergestalt dass diese Werte in Bezug auf die Hauptkomponentenl sung optimal sind Die Objekte in der Analyse erhalten Komponentenwerte auf der Grundlage der quantifizierten Daten Diagramme der Komponentenwerte lassen Muster in Bezug auf die Objekte in der Analyse sichtbar werden und k nnen ungew hnliche Objekte in den Daten kenntlich machen Die L sung einer kategorialen Hauptkomponentenanalyse maximiert die Korrelationen der Objektwerte mit den einzelnen quantifizierten Variablen f r die Anzahl der angegebenen Komponenten Dimensionen Eine wichtige Anwendung der kategorialen Hauptkomponentenanalyse ist die Untersuchung von Pr ferenzdaten bei der die Befragten eine Reihe von Items nach Ihrer Pr ferenz einstufen oder bewerten Bei der blichen IBM SPSS Statistics Datenkonfiguration stellen die Zeilen Einzelwerte und die Spalten Ma e f r die Items dar Die zeilen bergreifenden Scores sind Pr ferenzscores beispielsweise auf einer Skala von 0 bis 10 Dadurch werden die Daten zeilenabh ngig Bei Pr ferenzdaten kann es sinnvoll sein die Einzelwerte als Variablen zu behandeln Mit der Prozedur Transponieren k nnen Sie die Daten transponieren Die Bewerter werden die Variablen und alle Variablen werden als ordinal deklariert In CATPCA k nnen prob
253. ischen Korrelationsanalyse mit optimaler Skalierung und zwei Sets von denen ein Set jeweils nur eine Variable enth lt Bei letzterem Verfahren wird die hnlichkeit der Sets abgeleitet indem jedes Set mit einer unbekannten Variablen verglichen wird die irgendwo zwischen allen Sets liegt Bei der kategorialen Regression wird die hnlichkeit der transformierten Responsevariablen und der gewichteten Kombination transformierter Einflu variablen unmittelbar bewertet Beziehung zu Standardverfahren Beim Standardverfahren der linearen Regression k nnen kategoriale Variablen entweder als Indikatorvariablen umkodiert oder genauso wie Variablen auf Intervallniveau behandelt werden Beim ersten Ansatz enth lt das Modell eine gesonderte Konstante und Steigung f r die einzelnen Niveaukombinationen f r die kategorialen Variablen Dies f hrt zu einer gro en Anzahl zu interpretierender Parameter Im zweiten Ansatz wird f r jede Variable nur ein einziger Parameter gesch tzt Durch die willk rliche Festlegung der Kategoriekodierungen werden jedoch Verallgemeinerungen unm glich Wenn einige Variablen nicht stetig sind stehen alternative Analysen zur Verf gung Bei stetiger Responsevariabler und kategorialen Einflu variablen wird h ufig eine Varianzanalyse durchgef hrt Bei kategorialer Responsevariabler und stetigen Einflu variablen kann eine logistische Regression oder eine Diskriminanzanalyse angemessen sein Wenn sowohl die Responsevariable als au
254. ist werden Sie als Zusatzvariablen verarbeitet und m ssen deshalb nicht als Zusatzvariablen ausgew hlt werden Kategoriale Hauptkomponenten Ausgabe Im Dialogfeld Kategoriale Hauptkomponenten Ausgabe k nnen Sie festlegen dass Tabellen f r Objektwerte Komponentenladungen das Iterationsprotokoll Korrelationen der urspr nglichen und transformierten Variablen ber cksichtigte Varianz pro Variable und Dimension Kategorienquantifikationen f r ausgew hlte Variablen und deskriptive Statistiken f r ausgew hlte Variablen erstellt werden sollen Abbildung 3 7 Dialogfeld Ausgabe Ei Kategoriale Hauptkomponenten Ausgabe Tabellen IM Objektwerte T Korrelationen der Originalvariablen X Komponentenladungen V Korrelationen der transformierten Variablen F tterstionsprotokoll E Varianz ber cksichtigt f r Quartifizierte Variablen Kategorienquantifikationen Deskriptive Statistik r Optionen f r Objektwerte Diese Kategorien ber cksichtigen Objektwerte bechriften mit 38 Kapitel 3 Objektwerte Hiermit werden die Objektwerte angezeigt Die folgenden Optionen sind verf gbar Diese Kategorien ber cksichtigen Hiermit werden die Kategorienummern der ausgew hlten Analysevariablen angezeigt m Objektwerte beschriften nach Sie k nnen eine der in der Liste Beschriftungsvariablen enthaltenen Variablen ausw hlen um die Objekte zu beschriften Komponenten
255. it tsma das durch die Prozedur maximiert wird Quantifikationen F r die einzelnen Variablen werden die Quantifizierungen die Vektorkoordinaten und die Zentroid Koordinaten angezeigt Die Quantifizierungen sind die den einzelnen Kategorien zugewiesenen Werte Die Zentroid Koordinaten sind der Durchschnitt der Objektwerte von Objekten in derselben Kategorie Die Vektorkoordinaten sind die Koordinaten der Kategorien wenn sie sich auf einer Linie befinden m ssen die die Variable im Objektraum repr sentiert Dies ist f r Variablen mit ordinalem und numerischem Skalierungsniveau erforderlich 156 Kapitel 10 Abbildung 10 9 Quantifizierungen f r die Intensit t der Interaktion Zentroidkoordinaten Yektorkoordinaten mn T Kategorie sehr schwach schwach mittel hoch Normalisierung mit Yariablen Prinzipal Quantifikation Ein kurzer Blick auf die Quantifizierungen im verbundenen Diagramm der Kategoriepunkte gentigt um zu sehen dass bei manchen Variablen einige Kategorien durch die kategoriale Hauptkomponentenanalyse nicht so klar getrennt wurden wie bei einem echt ordinalen Niveau zu erwarten gewesen w re Die Variablen Intensit t und H ufigkeit Frequenz beispielsweise weisen gleiche oder fast gleiche Quantifzierungen f r ihre beiden mittleren Kategorien auf Bei dieser Art von Ergebnis sollten Sie alternative kategoriale Hauptkomponentenanalysen versuchen vielleicht mit einigen reduzierten Kategorien ode
256. it bei Schema B vier Kategorien auf die systemdefiniert fehlende Werte erhalten Bei Schema C gibt es au erdem vier Kategorien die Indikatoren f r systemdefiniert fehlende Werte erhalten Im Gegensatz dazu gibt es bei Schema A keine systemdefiniert fehlenden Quantifizierungen Die 6 Kapitel 1 Verwendung aufeinander folgender Ganzzahlen als Codes f r als nominal oder ordinal behandelte Variablen f hrt zu einer deutlich kleineren Ausgabe ohne die Ergebnisse zu beeintr chtigen Die Kodierungsschemata f r Variablen die als numerisch behandelt werden unterliegen gr eren Einschr nkungen als dies bei ordinalen Variablen der Fall ist Bei diesen Variablen ist die Differenz zwischen aufeinander folgenden Kategorien von Bedeutung In der folgenden Tabelle werden drei Kodierungsschemata f r Alter angezeigt Tabelle 1 3 Alternative Kodierungsschemata f r das Alter Schema Kategorie D K R 20 20 1 1 22 22 3 2 25 25 6 3 27 27 8 4 Bei allen Aufzeichnungen numerischer Variablen miissen die Differenzen zwischen den Kategorien erhalten bleiben Die Verwendung der urspriinglichen Werte ist eine Methode um die Beibehaltung der Differenzen zu gew hrleisten Dies kann jedoch dazu f hren dass viele Kategorien Indikatoren f r systemdefiniert fehlende Werte aufweisen Beispiel Schema A verwendet die urspr nglich beobachteten Werte Bei allen Prozeduren von Categories mit Ausnahme der Korrespondenzanalyse
257. itsdatei gespeichert werden m Daten Sets sind in der aktuellen Sitzung verf gbar In nachfolgenden Sitzungen stehen Daten Sets nur zur Verf gung wenn Sie sie ausdr cklich als Datendateien speichern Die Namen von Daten Sets m ssen den Regeln zum Benennen von Variablen entsprechen m Die Namen f r die Dateien und Daten Sets m ssen sich bei allen Arten von gespeicherten Daten unterscheiden m Wenn Sie die Objektwerte oder die transformierten Werte in der Arbeitsdatei speichern k nnen Sie die Anzahl der mehrfach nominalen Dimensionen angeben 39 Kategoriale Hauptkomponentenanalyse CATPCA Abbildung 3 8 Speichern fl Kategoriale Hauptkomponenten Speichern Diskretisierte Daten Diskretisierte Daten erstellen Neues Datenblatt erstellen Datenblatt Name Diskretisierte_Daten IM Variablen erstellen Neue Datendatei schreiben Neues Datenblatt erstellen Datenblatt Name Transformierte_Vars Neue Datendatei schreiben Datei rObjektwerte rApproximationen rTransformierte Yariablen M In Arbeitsdatei speichern M In Arbeitsdatei speichern i Objektwerte erstellen Neues Datenblatt erstellen M In Arbeitsdatei speichern F Approximationen erstellen Neues Datenblatt erstellen Datenblatt Name Objektwerte Datenblatt Name Neue Datendatei schreiben Annaherungen Neue Datendatei schreiben I Date Datei Mehrfach nominale Dimensionen alle Ers
258. itt von 2 bis 3 bei den anderen Gruppen ist jedoch kaum weiterer Fortschritt zu verzeichnen Unterschiedliche Entwicklung f r ausgew hlte Variablen Aus jedem der durch die Komponentenladungen identifizierten Symptomb ndel wurde eine Variable als Repr sentant des B ndels ausgew hlt Binge eating Fre attacken wurde aus dem Bulimie B ndel ausgew hlt Sexual attitude sexuelle Einstellung aus dem B ndel Anorexie psychosoziales Verhalten und Preoccupation with food and weight Besch ftigung mit Essen und Gewicht aus dem dritten B ndel Um die m glichen unterschiedlichen Krankheitsverl ufe zu untersuchen wurden die Projektionen von Time diagnosis interaction Zeit Diagnose Interaktion auf Binge eating Fre attacken Sexual attitude sexuelle Einstellung und Preoccupation with food and weight 186 Kapitel 10 Besch ftigung mit Essen und Gewicht berechnet und in der folgenden Abbildung grafisch dargestellt Abbildung 10 44 Projizierte Zentroide von Time diagnosis interaction Zeit Diagnose Interaktion auf Binge eating Fre attacken Sexual attitude sexuelle Einstellung und Preoccupation with food and weight Besch ftigung mit Essen und Gewicht 1 Zentroide projiziert O auf Binge eating auf Preoccupation 10 14 O with food and weight 1 18 4 15 17 41 auf Sexual 5 10 7 attitude 18 913 16 8 ats 0718414 92 16 8 2 12 F 6 1s 2 3 4 1
259. k nnen Sie festlegen ob in den Diagrammen Variablen und Wertlabels oder Variablennamen und Werte verwendet werden sollen Sie k nnen auch eine H chstl nge f r die Beschriftungen festlegen Diagrammdimensionen Hiermit legen Sie fest wie die Statistiken in der Ausgabe angezeigt werden Alle Dimensionen in der L sung anzeigen Alle Dimensionen in der L sung werden in einer Streudiagramm Matrix angezeigt m Anzahl der Dimensionen beschr nken Die angezeigten Dimensionen werden auf geplottete Paare beschr nkt Wenn Sie die Dimensionen beschr nken m ssen Sie die niedrigste und die h chste Dimension ausw hlen die jeweils geplottet werden soll Die niedrigste Dimension muss im Bereich von 1 bis zur Anzahl der Dimensionen in der L sung minus 1 liegen und wird gegen h here Dimensionen geplottet Der Wert f r die h chste Dimension muss im Bereich von 2 bis zur Anzahl der Dimensionen in der L sung liegen und gibt die h chste Dimension an die beim Plotten der Dimensionspaare verwendet wird Diese Spezifikation gilt f r alle angeforderten multidimensionalen Plots Konfiguration Sie k nnen die Koordinaten einer Konfiguration aus einer Datei einlesen Die erste Variable in der Datei muss die Koordinaten der ersten Dimension die zweite Variable die Koordinaten der zweiten Dimension usw enthalten m Initial Die in der Datei angegebene Konfiguration wird als Ausgangspunkt f r die Analyse verwendet m Fest Die in der Datei angeg
260. kretisieren Sie diese Variablen in gleiche Intervalle mit der L nge 1 8 Variablen k nnen auf unterschiedliche Weise diskretisiert werden Die hier angegebenen Werte sind rein subjektiv Wenn Sie weniger Kategorien erzielen m chten verwenden Sie l ngere Intervalle Day of the year k nnte beispielsweise in Monate oder in Jahreszeiten aufgegliedert werden Auswahl des Transformationstyps Jede Variable kann in einer von mehreren verschiedenen Ebenen analysiert werden Das Ziel ist jedoch die Vorhersage der Antwort darum sollten Sie die Antwort direkt mithilfe des numerischen Messniveaus der optimalen Skalierung skalieren Die Reihenfolge und die Differenzen zwischen den Kategorien werden entsprechend in der transformierten Variablen beibehalten Zum Ausf hren einer kategorialen Regressionsanalyse w hlen Sie die folgenden Befehle aus den Men s aus Analysieren gt Regression gt Optimale Skalierung CATREG 123 Kategoriale Regression Abbildung 9 25 Dialogfeld Kategoriale Regression Skala definieren W hlen Sie Daily ozone level als abh ngige Variable aus W hlen Sie Inversion base height bis Day of the year als unabh ngige Variablen aus W hlen Sie Daily ozone level und klicken Sie auf Skala definieren Abbildung 9 26 Dialogfeld Skala definieren A Kategoriale Regression Skala definieren X Messniveau der optimalen Skalierung Spline ordinal Ordinal Spline nominal
261. l nach oben entlang der Achse weicher werden Bei der horizontalen Dimension ist nun keine eindeutige Interpretation m glich jedoch ist m glicherweise eine Unterscheidung nach Bequemlichkeit vorhanden bei der die Artikel nach links entlang der Achse konventioneller werden Die durch die Zeilenobjekte dargestellten Personen sind immer noch deutlich nach der Bevorzugung von harten oder weichen Artikeln gruppiert und weisen in der horizontalen Dimension starke Variationen innerhalb der Gruppen auf 286 Kapitel 15 Individueller Raum Abbildung 15 14 Dimensionsgewichtungen Spezifit t Quelle Overall preference Breakfast with juice bacon and eggs and beverage Breakfast with juice cold cereal and beverage Breakfast with juice pancakes sausage and beverage Breakfast with beverage only Snack with beverage only Wichtigkeitb a Die Spezifit t gibt an wie typisch eine Quelle ist Der Bereich f r die Spezifit t liegt zwischen null und eins Dabei weist null aufeine durchschnittliche Quelle mit identischen Dimensionsgewichtungen hin Eins weist auf eine sehr spezifische Quelle mit einer ungew hnlich gro en Dimensionsgewichtung und anderen Gewichtungen nahe null hin b Relative Wichtigkeit jeder Dimension als Verh ltnis der Quadratsumme einer Dimension zur Gesamtquadratsumme F r jede Quelle wird ein individueller Raum berechnet In den Dimensionsgewichtungen wird die Beteiligung der individuellen
262. ladungen Hiermit werden Komponentenladungen f r alle Variablen angezeigt bei denen keine mehrfach nominalen Skalierungsniveaus vorliegen Iterationsprotokoll F r jede Iteration werden ber cksichtigte Varianz Verlust sowie Steigerung der ber cksichtigten Varianz ausgegeben Korrelationen der Originalvariablen Hiermit werden die Korrelationsmatrix der urspr nglichen Variablen und die Eigenwerte dieser Matrix ausgegeben Korrelationen der transformierten Variablen Hiermit werden die Korrelationsmatrix der transformierten optimal skalierten Variablen und die Eigenwerte dieser Matrix ausgegeben Varianz ber cksichtigt f r Hiermit wird die ber cksichtigte Varianz nach Zentroidkoordinaten und nach Vektorkoordinaten sowie die Gesamtsumme kombinierte Zentroid und Vektorkoordinaten pro Variable und Dimension ausgegeben Kategorienquantifikationen Dies sind die Kategoriequantifikationen und koordinaten pro Dimension jeder ausgew hlten Variable Deskriptive Statistiken Hiermit werden H ufigkeiten Anzahl der fehlenden Werte und Modalwert f r die ausgew hlten Variablen ausgegeben Kategoriale Hauptkomponenten Speichern Im Dialogfeld Speichern k nnen Sie festlegen dass diskretisierte Daten Objektwerte transformierte Werte und N herungen in einer IBM SPSS Statistics Datendatei oder in einem Daten Set gespeichert werden Au erdem k nnen die transformierten Werte die Objektwerte und die Approximationen in der Arbe
263. lationen in Kategoriale Regression 113 Iterationskriterien in Multidimensionale Entfaltung 93 in Multidimensionale Skalierung 82 Iterationsprotokoll bei der Mehrfachkorrespondenzanalyse 67 in der Kategorialen Hauptkomponentenanalyse 37 154 in Multidimensionale Entfaltung 97 in Multidimensionale Skalierung 86 Kategoriale Hauptkomponentenanalyse 28 35 148 161 Iterationsprotokoll 154 Kategoriepunkte 181 Komponentenladungen 158 161 178 Messniveau der optimalen Skalierung 30 Modellzusammenfassung 154 160 177 Objektwerte 157 160 179 Quantifizierungen 155 175 Variablen speichern 38 zus tzliche Funktionen beim Befehl 43 Kategoriale Regression 16 101 Anpassungsg te des Modells 114 Grafik 16 Interkorrelationen 113 Korrelationen 114 115 Messniveau der optimalen Skalierung 17 Regelung 23 Residuen 119 Speichern 26 Statistik 16 Transformationsdiagramme 117 Wichtigkeit 115 zus tzliche Funktionen beim Befehl 27 Kategoriekoordinaten in Nichtlineare kanonische Korrelationsanalyse 213 Kategoriendiagramme bei der Mehrfachkorrespondenzanalyse 70 in der Kategorialen Hauptkomponentenanalyse 41 Kategorienquantifikationen bei der Mehrfachkorrespondenzanalyse 67 243 in der Kategorialen Hauptkomponentenanalyse 37 in Kategoriale Regression 24 in Nichtlineare kanonische Korrelationsanalyse 48 Kategoriepunkte in der Kategorialen Hauptkomponentenanalyse 181 Koeffizienten in
264. le gen hert werden In diesem Fall sollten die Spaltenwerte dem gewichteten Durchschnitt der Zeilenwerte entsprechen Die Zeilenwerte werden so standardisiert dass eine gewichtete Summe der quadrierten Distanzen zum Zentroid 1 entsteht Bei dieser Methode werden die Distanzen zwischen den Spaltenkategorien maximiert Verwenden Sie diese Methode wenn Sie haupts chlich ermitteln m chten inwieweit sich die Kategorien der Spaltenvariable voneinander unterscheiden Symmetrisch Die Zeilen und Spalten k nnen auch symmetrisch behandelt werden Bei dieser Normalisierung wird die Tr gheit gleichm ig ber die Zeilen und Spaltenwerte gestreut Beachten Sie in diesem Fall dass weder die Distanzen zwischen den Zeilenpunkten noch die Distanzen zwischen den Spaltenpunkten eine N herung der Chi Quadrat Distanzen bilden Verwenden Sie diese Methode wenn Sie haupts chlich die Unterschiede oder hnlichkeiten zwischen den beiden Variablen untersuchen m chten Diese Methode wird in der Regel f r Biplots herangezogen Prinzipal Bei einer vierten Option der Prinzipal Normalisierung wird die Tr gheit zweimal in der L sung gestreut zun chst ber die Zeilenwerte und dann ber die Spaltenwerte Verwenden Sie diese Methode wenn Sie die Distanzen zwischen den Zeilenpunkten und die Distanzen zwischen den Spaltenpunkten ermitteln m chten sofern der Zusammenhang zwischen den Zeilen und Spaltenpunkten dabei nicht relevant ist Biplots sind f r diese No
265. lemlos mehr Variablen als Objekte verwendet werden Beziehung zu anderen Prozeduren von Categories Wenn alle Variablen als mehrfach nominal deklariert werden f hrt die kategoriale Hauptkomponentenanalyse zu einer Analyse die einer Mehrfachkorrespondenzanalyse die f r dieselben Variablen durchgef hrt wurde entspricht Daher kann die kategoriale Hauptkomponentenanalyse als eine Art Mehrfachkorrespondenzanalyse betrachtet werden bei der einige der Variablen als ordinal oder numerisch deklariert sind Beziehung zu Standardverfahren Wenn alle Variablen auf dem numerischen Niveau skaliert sind entspricht die kategoriale Hauptkomponentenanalyse der normalen Hauptkomponentenanalyse Allgemeiner gesagt Die kategoriale Hauptkomponentenanalyse ist eine Alternative zur Berechnung der Korrelationen zwischen nichtnumerischen Skalen und ihrer Analyse mithilfe der normalen Hauptkomponentenanalyse oder der Faktoranalyse Die unreflektierte Verwendung des blichen Korrelationskoeffizienten nach Pearson als Zusammenhangsma f r ordinale Daten kann zu einer nicht trivialen Verzerrung in der Sch tzung der Korrelationen f hren Nichtlineare kanonische Korrelationsanalyse Die nichtlineare kanonische Korrelationsanalyse ist eine sehr allgemeine Prozedur mit vielen verschiedenen Anwendungen Ziel der nichtlinearen kanonischen Korrelationsanalyse ist die Analyse der Beziehungen zwischen zwei oder mehr Sets von Variablen anstatt zwischen den Variablen selbst
266. len Raums Snack with beverage only sind die Auswirkungen dieses Szenarios auf die Bevorzugungen dargestellt Diese Quelle ist st rker an der zweiten Dimension beteiligt sodass die Unterscheidung zwischen den Artikeln meist auf die zweite Dimension zur ckzuf hren ist Aufgrund der geringen Spezifit t dieser Quelle ist entlang der ersten Dimension jedoch immer noch eine deutliche Unterscheidung vorhanden Verwenden einer anderen Ausgangskonfiguration Die endg ltige Konfiguration kann von den Startpunkten abh ngen die dem Algorithmus bergeben werden Im Idealfall sollte die allgemeine Struktur der L sung gleich bleiben andernfalls f llt das Ermitteln der richtigen L sung m glicherweise schwer Durch die Verwendung verschiedener Ausgangskonfigurationen z B mit einem Korrespondenzstart der Drei Weg Analyse der Fr hst cksdaten k nnen jedoch Einzelheiten st rker herausgestellt werden gt Um eine L sung mit einem Korrespondenzstart zu erstellen klicken Sie auf die Schaltfl che Zuletzt verwendete Dialogfelder und w hlen Sie Multidimensionale Entfaltung aus 290 Kapitel 15 gt Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf Optionen Abbildung 15 18 Dialogfeld Optionen E Multidimensionale Entfaltung Optionen rAusgangskonfiguration __ rterationskriterien Klassisch Stress Konvergenz 000001 Ross Cliff Mindest Stress 0001 Korrespondenz M
267. lende Werte k nnen Sie die Strategie f r die Verarbeitung von fehlenden Werten in den Analyse und Zusatzvariablen festlegen Abbildung 2 4 Dialogfeld Fehlende Werte Ei Kategoriale Regression Fehlende Werte r Strategie f r fehlende Werte Analysevariablen pref Ausschlie en package Ausschlie en brand Ausschlie en price Ausschlie en seallAusschlie en money Ausschlie en r Strategie Fehlende VYerte ersetzen Objekte mit fehlenden Werten f r diese Variable ausschlie en Modalwert Zusatzkategorie He Strategie Legen Sie fest ob Objekte mit fehlenden Werten ausgeschlossen werden sollen listenweiser Ausschluss oder ob fehlende Werte vorgeschrieben Aktivbehandlung m Objekte mit fehlenden Werten f r diese Variable ausschlie en Objekte mit fehlenden Werten f r die ausgew hlte Variable werden aus der Analyse ausgeschlossen Diese Strategie ist f r Zusatzvariablen nicht verf gbar m Fehlende Werte vorschreiben Fehlende Werte werden bei Objekten mit fehlenden Werten f r die ausgew hlte Variable gesetzt Sie k nnen die Methode ausw hlen nach der die Werte gesetzt werden W hlen Sie Modalwert wenn fehlende Werte durch die h ufigste Kategorie ersetzt werden sollen Falls mehrere Modalwerte vorhanden sind wird der Modalwert mit der kleinsten Kategorienummer verwendet Wenn Sie Zusatzkategorie ausw hlen werden fehlende Werte durch die gleiche Quan
268. ler Skalierung anhand von zwei Beispielen dargestellt Das erste Beispiel erl utert die grundlegenden Konzepte mithilfe eines kleinen Daten Sets Im zweiten Beispiel wird eine deutlich gr ere Gruppe von Variablen und Beobachtungen herangezogen Beispiel Daten f r Teppichreiniger In einem beliebten Beispiel m chte die Firma Green als auch Wind 1973 einen neuen Teppichreiniger vermarkten und dazu den Einfluss von f nf Faktoren auf die Bevorzugung durch den Verbraucher untersuchen Verpackungsgestaltung Markenname Preis G tesiegel Good Housekeeping und Geld zur ck Garantie Die Verpackungsgestaltung setzt sich aus drei Faktorenebenen zusammen die sich durch die Position der Auftrageb rste unterscheiden Au erdem gibt es drei Markennamen K2R Glory und Bissell drei Preisstufen sowie je zwei Ebenen Nein oder Ja f r die letzten beiden Faktoren Die nachstehende Tabelle zeigt die Variablen in der Teppichreiniger Untersuchung mit den zugeh rigen Beschriftungen und Werten Tabelle 9 1 Erkl rende Variablen in der Teppichreiniger Untersuchung Variablenname Variablenlabel Wertelabel package Package design A B C brand Brand name K2R Glory Bissell price Price 1 19 1 39 1 59 seal G tesiegel Good Nein Ja Housekeeping money Money back Nein Ja guarantee 10 Kunden stufen 22 Profile ein die durch diese Faktoren definiert sind Die Variable Preference enth lt den Rang der durchschnittlichen Einstufung f r die verschied
269. lfe oo EXYemm e RELE le imur E 1 ver AF 4 d wee We Diagnose O1 Centroids Projected on Preoccupation with food and weight H 376 5 B 470 25 Pun gt Doppelklicken Sie dann zur Verbindung der Punkte auf das Diagramm und klicken Sie im Diagramm Editor auf das Tool zum Hinzuf gen von Interpolationslinien gt Schlie en Sie den Diagramm Editor Preoccupation with food and weight Besch ftigung mit Essen und Gewicht ist eine Variable die die Kernsymptome repr sentiert die allen vier Gruppen gemeinsam sind Anders als bei den Patienten mit atypischer E st rung weisen die anorektische Gruppe und die beiden bulimischen Gruppen sowohl am Anfang als auch am Ende sehr hnliche Niveaus auf 197 Kategoriale Hauptkomponentenanalyse Empfohlene Literatur In folgenden Texten finden Sie weitere Informationen zur kategorialen Hauptkomponentenanalyse De Haas M J A Algera H F J M Van Tuijl als auch J J Meulman 2000 Macro and micro goal setting In search of coherence Applied Psychology 49 De Leeuw J 1982 Nonlinear principal components analysis In COMPSTAT Proceedings in Computational Statistics Wien Physica Verlag Eckart C als auch G Young 1936 The approximation of one matrix by another one of lower rank Psychometrika 1 Gabriel K R 1971 The biplot graphic display of matrices with application to principal components analysis Biometrik
270. lich in den Quantifikationen eingebracht werden Bei einem ordinalen oder nominalen Messniveau f r die Skalierung werden die Differenzen zwischen den Antwortkategorien ignoriert Werden die Antwortkategorien dagegen linear transformiert bleiben die Differenzen zwischen den Kategorien erhalten Die Antwort sollte somit numerisch skaliert werden diese Vorgehensweise wird hier verfolgt 109 Kategoriale Regression Durchf hren der Analyse gt Zum Ausf hren einer kategorialen Regressionsanalyse w hlen Sie die folgenden Befehle aus den Men s aus Analysieren gt Regression gt Optimale Skalierung CATREG Abbildung 9 9 Dialogfeld Kategoriale Regression i Kategoriale Regression X Abhangige Variable Standardized Residual Le Unabhangige Variable n package Spline ordinal 2 2 brand Spline ordinal 2 2 price Spline ordinal 2 2 seal Spline ordinal 2 2 money Spline ordinal 2 2 Skala definieren W hlen Sie Preference als abh ngige Variable aus W hlen Sie die Eintr ge Package design bis Money back guarantee als unabh ngige Variablen aus W hlen Sie Preference aus und klicken Sie auf Skala definieren Abbildung 9 10 Dialogfeld Skala definieren a Kategoriale Regression Skala definieren K Messniveau der optimalen Skalierung Spline ordinal Ordinal Spline nominal Nominal Numerisch Spline Innere Knoten 2 rasen aeerecnen L rure
271. lichen Szenarien erfasst von Overall preference Allgemein bevorzugt bis Snack with beverage only Imbiss nur mit Getr nk Diese Informationen finden Sie in der Datei breakfast sav F r weitere Informationen siehe Thema Beispieldateien in Anhang A in IBM SPSS Categories 19 280 Kapitel 15 Die sechs Szenarien k nnen als getrennte Quellen behandelt werden F hren Sie mit PREFSCAL eine Drei Weg Entfaltung der Zeilen Spalten und Quellen durch Syntax mit denen Sie diese Analysen nachvollziehen k nnen befindet sich in der Datei prefscal_breakfast sps Durchf hren der Analyse gt Um eine Analyse vom Ty Multidimensionale Entfaltung durchzuf hren w hlen Sie die folgenden Befehle aus den Men s aus Analysieren gt metrisch gt Multidimensionale Entfaltung PREFSCAL Abbildung 15 8 Hauptdialogfeld Multidimensionale Entfaltung E Multidimensionale Entfaltung hnlichkeiten E Gender gender al Toast pop up TP N Buttered toast BT Bl English muffin and ll Jelly donut uo Gewichtungen Quellen W hlen Sie Toast pop up bis Corn muffin and butter als Ahnlichkeitsvariablen aus Wahlen Sie Menu scenarios als Ursprungsvariable Klicken Sie auf Modell 281 Abbildung 15 9 Dialogfeld Modell Skalierungsmodell Identit t Euklidisch gewichtet Euklidisch verallgemeinert fH Multidimensionale Entfaltung Modell X hnl
272. lichkeiten in der hnlichkeitsvariablen aus gt W hlen Sie eine Spaltenvariable zum Festlegen der Spaltenpositionen f r die hnlichkeiten in der hnlichkeitsvariablen aus gt Wenn mehrere Quellen vorhanden sind w hlen Sie eine Quellenvariable aus Zellen der Distanzmatrix denen keine Zeilen Spaltenposition zugewiesen ist werden f r jede Quelle als fehlend behandelt W hlen Sie optional eine Gewichtungsvariable aus Dar ber hinaus k nnen Sie ein Modell f r die multidimensionale Skalierung angeben Einschr nkungen f r den gemeinsamen Raum festlegen Konvergenzkriterien festlegen die zu verwendende Ausgangskonfiguration angeben sowie Diagramme und die Ausgabe ausw hlen 78 Kapitel 7 hnlichkeiten aus Daten erstellen Wenn Sie im Dialogfeld Datenformat die Option zum Erstellen von hnlichkeiten aus Daten ausw hlen wird das Hauptdialogfeld folgenderma en dargestellt Abbildung 7 5 Dialogfeld Ahnlichkeiten aus Daten erstellen A Multidimensionale Skalierung hnlichkeiten aus Daten erstellen variablen amp Grandfather gfather L Aunt aunt 8 Grandmother gmother E Brother brother Grandson gson f E Cousin cousin Mother mother Acadia RER E Nephew nephew L Father father 2 Niece niece Sister sister L Son son Quellen 9 uncie uncle Distanzen erstellen mit Mas Euklidische Distanz oc entgen _ Zuractsetzen anerecnen_ ture
273. liegen Die Quantifikationen von Ausrei ern weichen so deutlich von anderen Objekten ab dass diese Elemente an den Grenzen des Diagramms liegen und so eine oder auch mehrere Dimensionen dominieren Bei Ausrei ern stehen zwei M glichkeiten zur Auswahl Sie k nnen die Ausrei er schlicht aus den Daten entfernen und dann die nichtlineare kanonische Korrelationsanalyse wiederholen Sie k nnen die extremen Antworten der Ausrei erobjekte aber auch umkodieren indem Sie einige Kategorien zusammenfassen zusammenf hren Aus dem Diagramm der Objektwerte geht hervor dass keine Ausrei er f r die Untersuchungsdaten vorhanden sind Abbildung 11 12 Objektwerte Dimension 2 N N oO n Dimension 1 F lle gewichtet nach Anzahl der Objekte Ber cksichtigen der hnlichkeiten zwischen Sets Der Zusammenhang zwischen den Sets in einer nichtlinearen kanonischen Korrelationsanalyse kann auf verschiedene Weise gemessen werden die Ergebnisse werden dabei jeweils in einer separaten Tabelle oder Gruppe von Tabellen aufgef hrt 207 Nichtlineare kanonische Korrelationsanalyse Zusammenfassung der Analyse Die Anpassungs und Verlustwerte zeigen die Anpassungsg te der nichtlinearen kanonischen Korrelationsanalysel sung f r die optimal quantifizierten Daten im Hinblick auf die Zusammenh nge zwischen den Sets Die Tabelle mit der Zusammenfassung der Analyse enth lt den Anpassungswert die Verlustwerte und die Eigen
274. lit t quantifiziert Aufgrund dessen k nnen nichtlineare Beziehungen zwischen Variablen modelliert werden Beispiel Eine kategoriale Hauptkomponentenanalyse lie e sich verwenden um den Zusammenhang zwischen Berufsgruppe beruflicher Stellung Region Anzahl von Dienstreisen hoch mittel und gering und der Zufriedenheit im Beruf grafisch darzustellen Das Ergebnis k nnte sein dass ein Gro teil der Varianz mit zwei Dimensionen erkl rt werden kann In der ersten Dimension lie en sich Berufsgruppe von Region trennen und in der zweiten Dimension k nnten berufliche Stellung und H ufigkeit von Dienstreisen getrennt werden Au erdem k nnte sich ein Zusammenhang zwischen hoher Zufriedenheit im Beruf und einer mittleren H ufigkeit von Dienstreisen ergeben Statistiken und Diagramme H ufigkeiten fehlende Werte Messniveau der optimalen Skalierung Modalwert ber cksichtige Varianz nach Koordinaten der Zentroiden Vektorkoordinaten Gesamtsumme pro Variable und Dimension Komponentenladungen f r vektorquantifizierte Variablen Quantifikationen und Koordinaten der Kategorien Iterationsprotokoll Korrelationen der transformierten Variablen und Eigenwerte der Korrelationsmatrix Korrelationen der urspr nglichen Variablen und Eigenwerte der Korrelationsmatrix Objektwerte Diagramme der Kategorien und verkn pften Kategorien Transformationsdiagramme Residuen Diagramme Diagramme der projizierten Zentroide Objektdiagramme Biplots Triplots und
275. lle hat einen individuellen Raum in dem jede Dimension des gemeinsamen Raums unterschiedlich gewichtet ist m Euklidisch verallgemeinert Hierbei handelt es sich um ein Modell f r individuelle Differenzen Jede Quelle besitzt einen individuellen Wahrnehmungsraum der einer Rotation des gemeinsamen Raums mit einer anschlie endenden unterschiedlichen Gewichtung der Dimensionen entspricht hnlichkeiten Geben Sie an ob die Distanzmatrix hnlichkeits oder Un hnlichkeitsma e enth lt Dimensionen Standardm ig wird eine L sung in zwei Dimensionen berechnet Minimum 2 Maximum 2 Sie k nnen f r das Minimum und Maximum eine beliebige ganze Zahl zwischen 1 und der Anzahl der Objekte minus 1 angeben solange das Minimum kleiner oder gleich dem Maximum ist Die Prozedur berechnet eine L sung in der h chsten Dimension und reduziert die Dimensionalit t dann schrittweise bis die niedrigste Dimensionalit t erreicht ist hnlichkeitstransformationen W hlen Sie eine der folgenden Alternativen aus m Keine Die hnlichkeiten werden nicht transformiert Sie k nnen optional Konstanten Term einschlie en ausw hlen In diesem Fall werden die hnlichkeiten durch einen konstanten Term verschoben 92 Kapitel 8 Linear Die transformierten hnlichkeiten sind proportional zu den urspr nglichen hnlichkeiten Hierbei wird in der Transformationsfunktion eine Steigung gesch tzt und der Schnittpunkt mit der y Achse auf 0 festgele
276. lt also dem Gesamt Zentroid Die Marken CC und DD liegen gemeinsam im rechten Bereich die Marken BB und FF treffen sich dagegen im unteren Teil des Diagramms Die Marken AA und EE weisen keine Ahnlichkeiten mit den anderen Marken auf Abbildung 12 11 Diagramm der Marken Prinzipal Normalisierung Dimension 2 1 0 0 in 0 0 0 5 1 0 Dimension 1 Symmetrische Normalisierung Wie h ngen die Marken mit den Image Attributen zusammen Die Prinzipal Normalisierung ist f r diese Beziehungen nicht geeignet Um den Schwerpunkt auf den Zusammenhang untereinander zu legen verwenden Sie die symmetrische Normalisierung Die Tr gheit wird nicht zweimal gestreut wie bei der Prinzipal Normalisierung sondern gleichm ig auf die Zeilen und Spalten aufgeteilt Die Distanzen zwischen den Kategorien einer bestimmten Variablen k nnen 234 Kapitel 12 nicht interpretiert werden die Distanzen zwischen den Kategorien verschiedener Variablen sind dagegen sehr wohl aussagekr ftig Abbildung 12 12 Dialogfeld Modell E Korrespondenzanalyse Modell Dimensionen in der L sung rDistanzma Chi Quadrat Euklidisch r Standardisierungsmethode Zeilen und Spaltenmittel werden entfernt rNormalisierungsmethode Symmetrisch Zeilenprinzipal Anpassen Prinzipal Spattenprinzipal Ce aes ie gt Zum Anlegen der nachstehenden L sung mit symmetrischer Normalisierung ffnen Sie
277. ltidimensionale Skalierung Diagramme Version 1 Im Dialogfeld Diagramme k nnen Sie die zu erstellenden Diagramme festlegen Wenn das Datenformat hnlichkeiten in Spalten ausgew hlt wurde wird das Dialogfeld Diagramme wie folgt angezeigt Geben Sie f r die Diagramme Individuelle Raumgewichtungen Urspr ngliche ber transformierte hnlichkeiten und Transformierte hnlichkeiten ber Distanzen die Quellen an f r die die Diagramme erzeugt werden sollen Die Liste der verf gbaren Quellen entspricht der Liste der hnlichkeitsvariablen im Hauptdialogfeld Abbildung 7 10 Dialogfeld Diagramme Version 1 EF Multidimensionale Skalierung Diagramme r Diagramme Hs M Urspr ngliche ber transformierte hnlichkeiten E Gemeinsamer Raum F Transformierte hnlichkeiten gegen Distanzen Ei Diagramme der Quellen a Alle Quellen Quellen ausw hlen verf gbar Ausgew hlt ze ie me Lie Stress Ein Diagramm wird erstellt in dem der normalisierte Roh Stress tiber die Dimensionen abgebildet wird Dieses Diagramm wird nur erstellt wenn die H chstanzahl von Dimensionen gr er als die Mindestanzahl von Dimensionen ist Gemeinsamer Raum Eine Streudiagramm Matrix der Koordinaten des gemeinsamen Raums wird angezeigt Individueller Raum F r jede Quelle werden die Koordinaten der individuellen R ume in Streudiagramm Matrizen angezeigt Dies ist nu
278. m einer Poisson Rate modelliert werden Das Aggregat der Betriebsmonate f r jede Zelle der durch die Kreuzklassifizierung der Faktoren gebildeten Tabelle gibt die Werte f r die Risikoanf lligkeit an site sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Unternehmens geht neue Standorte f r die betriebliche Expansion auszuw hlen Das Unternehmen beauftragte zwei Berater unabh ngig voneinander mit der Bewertung der Standorte Neben einem umfassenden Bericht gaben die Berater auch eine 316 Anhang A zusammenfassende Wertung f r jeden Standort als good gut fair mittelm ig oder poor schlecht ab smokers sav Diese Datendatei wurde aus der Umfrage National Household Survey of Drug Abuse aus dem Jahr 1998 abstrahiert und stellt eine Wahrscheinlichkeitsstichprobe US amerikanischer Haushalte dar http dx doi org 10 3886 ICPSRO2934 Daher sollte der erste Schritt bei der Analyse dieser Datendatei darin bestehen die Daten entsprechend den Bev lkerungstrends zu gewichten stroke_clean sav Diese hypothetische Datendatei enth lt den Zustand einer medizinischen Datenbank nachdem diese mithilfe der Prozeduren in der Option Data Preparation bereinigt wurde stroke_invalid sav Diese hypothetische Datendatei enth lt den urspr nglichen Zustand einer medizinischen Datenbank der mehrere Dateneingabefehler aufweist stroke_survival In dieser hypoth
279. m Dialogfeld Ausgabe wird festgelegt welche statistischen Gr en ausgegeben werden sollen Abbildung 2 7 Dialogfeld Ausgabe EH Kategoriale Regression Ausgabe r Tabellen rNeue Stichprobenziehung Multiples R keine Kreuzvalidierung iM anova M Koeffizienten 632 Bootstrap F tterstionsprotokoll E Korrelationen der Originalvariablen T Korrelationen der transformierten Variablen Analysevariablen Kategorienquantifikationen pref package brand price seal money Deskriptive Statistik re Tabellen Es werden die folgenden Tabellen erstellt m Multiples R Umfa t R2 korrigiertes R2 und korrigiertes R2 unter Ber cksichtigung der optimalen Skalierung 25 Kategoriale Regression CATREG ANOVA Diese Option enth lt Quadratsummen f r die Regression und die Residuen Mittel der Quadrate und F Zwei ANOVA Tabellen werden angezeigt eine Tabelle mit Freiheitsgraden f r die Regression die der Anzahl der Einflu variablen entspricht und eine Tabelle mit Freiheitsgraden f r die Regression unter Ber cksichtigung der optimalen Skalierung Koeffizienten Diese Option gibt drei Tabellen aus eine Koeffiziententabelle mit Beta Koeffizienten dem Standardfehler der Beta Koeffizienten t Werten und der Signifikanz eine Tabelle der optimalen Skalierung der Koeffizienten mit dem Standardfehler der Beta Koeffizienten unter Ber cksichtigung der optimalen Skalierungsfreiheit
280. mationen k nnten Sie jedoch noch bessere Resultate erzielen Die hnlichkeiten sowie die Variablen gener und degree besitzen beispielsweise jeweils eine nat rliche Reihenfolge k nnten jedoch mit einer ordinalen Transformation noch besser modelliert werden als mit einer linearen Transformation 267 Abbildung 14 16 Dialogfeld Modell rSkalierungsmodell Identit t Euklidisch gewichtet Euklidisch verallgemeinert Reduzierter Rang Rang 1 rForm Untere Dreiecksmatrix Obere Dreiecksmatrix Gesamte Matrix hnlichkeiten Un hnlichkeiten hnlichkeiten fH Multidimensionale Skalierung Modell X r hnlichkeitstransformationen Yerhattnisskala Intervall Ordinal Z Gebundene Beobachtungen l sen Spline Grad Knoten innen Transformationen zuweisen Getrennt in jeder Quelle Alle Quellen gleichzeitig r Dimensionen Minimum Multidimensionale Skalierung Um die Analyse zu wiederholen und dabei die hnlichkeiten sowie die Variablen gener und degree auf einem ordinalen Messniveau neu zu skalieren Bindungen werden beibehalten ffnen Sie erneut das Dialogfeld Multidimensionale Skalierung und klicken Sie auf Modell W hlen Sie Ordinal als hnlichkeitstransformation Klicken Sie auf Weiter Klicken Sie im Dialogfeld Multidimensionale Skalierung auf Einschr nkungen 268 Kapitel 14 Abbildung 14 17 Dialogfeld Einschr nku
281. mension 1 die zweite Variable den Koordinaten von Dimension 2 entspricht usw Die Anzahl der F lle in jeder Variablen muss der Gesamtzahl der Zeilen und Spaltenobjekte entsprechen Die Zeilen und Spaltenkoordinaten m ssen gestapelt sein wobei die Spaltenkoordinaten den Zeilenkoordinaten folgen Iterationskriterien Geben Sie Werte f r Iterationskriterien an m Stress Konvergenz Der Algorithmus beendet die Iterationen wenn die relative Differenz von aufeinander folgenden penalisierten Stresswerten unter dem hier angegebenen Wert liegt Dieser Wert darf nicht negativ sein m Mindest Stress Der Algorithmus wird beendet wenn der penalisierte Stress unter den hier angegebenen Wert f llt Dieser Wert darf nicht negativ sein m Maximale Anzahl der Iterationen Der Algorithmus f hrt die hier angegebene Anzahl von Iterationen durch falls nicht vorher eines der oben genannten Kriterien erf llt wird Penalisierungsterm Der Algorithmus versucht den penalisierten Stress zu minimieren Der penalisierte Stress ist ein Ma f r die G te der Anpassung das dem Produkt des Kruskal Stress I und einem Penalisierungsterm auf der Basis des Variationskoeffizienten der transformierten hnlichkeiten entspricht In diesen Feldern k nnen Sie die St rke und den Bereich des Penalisierungsterms festlegen m St rke Je kleiner der Wert des St rkeparameters ist desto st rker wird die Penalisierung Geben Sie einen Wert zwischen 0 0 und 1 0 an m Ber
282. ment P Horst Hg New York Social Science Research Council Meulman J J 1982 Homogeneity analysis of incomplete data Leiden DSWO Press Meulman J J 1996 Fitting a distance model to homogeneous subsets of variables Points of view analysis of categorical data Journal of Classification 13 Meulman J J als auch W J Heiser 1997 Graphical display of interaction in multiway contingency tables by use of homogeneity analysis In Visual Display of Categorical Data M Greenacre als auch J Blasius Hgg New York Academic Press Nishisato S 1984 Forced classification A simple application of a quantification method Psychometrika 49 252 Kapitel 13 Tenenhaus M als auch F W Young 1985 An analysis and synthesis of multiple correspondence analysis optimal scaling dual scaling homogeneity analysis and other methods for quantifying categorical multivariate data Psychometrika 50 Van Rijckevorsel J 1987 The application of fuzzy coding and horseshoes in multiple correspondence analysis Leiden DSWO Press Kapitel Multidimensionale Skalierung Das Ziel der multidimensionalen Skalierung f r eine gegebene Gruppe von Objekten besteht darin eine Darstellung der Objekte in einem flachdimensionierten Raum zu finden Diese L sung wird mithilfe der hnlichkeiten zwischen den Objekten ermittelt Bei der Prozedur werden die quadrierten Abweichungen zwischen den urspr nglichen ggf transformier
283. mit ffnen Sie das Dialogfeld hnlichkeiten in Matrizen ber mehrere Spalten m hnlichkeiten stammen aus Spalten eine Quelle pro Spalte Die Ahnlichkeits Matrizen sind in mehreren Spalten bzw Variablen zusammengefasst Es sind zwei weitere Variablen erforderlich welche die Zeile und Spalte jeder Zelle angeben Hiermit ffnen Sie das Dialogfeld hnlichkeiten in Spalten m hnlichkeiten sind in einer Spalte gestapelt Die Ahnlichkeits Matrizen sind in einer einzigen Spalte bzw Variablen zusammengefasst Es sind drei weitere Variablen erforderlich welche die Zeile Spalte und Quelle jeder Zelle angeben Hiermit ffnen Sie das Dialogfeld hnlichkeiten in einer einzigen Spalte Klicken Sie auf Definieren hnlichkeiten in mehreren Spalten von Matrizen Wenn Sie im Dialogfeld Datenformat das Datenmodell mit hnlichkeiten in Matrizen ausw hlen aus einer oder mehreren Quellen wird das Hauptdialogfeld folgenderma en dargestellt Abbildung 7 2 Zange hnlichkeiten in mehreren Spalten von Matrizen Multidimensionale Skalierung hnlichkeiten in mehreren Spalten von Matrizen hnlichkeiten L Aunt aunt z amp Brother brother Cousin cousin m yz Z Daughter daughter Gewichtungen Suellen gt W hlen Sie mindestens drei Ahnlichkeitsvariablen aus Achten Sie darauf dass die Reihenfolge der Variablen in der Liste der Reihenfolge der Spalten mit den hnlic
284. mme verbundene Kategoriendiagramme en 4 r Transformationsdiagramme e mDiskriminationsma e I Diagramm anzeigen Alle Variablen verwenden Ausgew hlte Variablen verwenden Lweter_ anerecnen _tite Kategoriendiagramme F r jede ausgew hlte Variable wird ein Diagramm mit Zentroidkoordinaten erstellt Die Kategorien werden in den Zentroiden der Objekte in den einzelnen Kategorien plaziert Verbundene Kategoriendiagramme Hierbei handelt es sich um ein einzelnes Diagramm mit Zentroidkoordinaten jeder ausgew hlten Variablen Transformationsdiagramme Hierbei wird ein Diagramm der optimalen Kategorienquantifikationen gegen die Kategorienummern erstellt Sie k nnen die gew nschte Anzahl von Dimensionen angeben Pro Dimension wird ein Diagramm erstellt Sie k nnen au erdem festlegen dass f r jede ausgew hlte Variable ein Diagramm der Residuen ausgegeben wird Diskriminationsma e Erstellt ein einzelnes Diagramm der Diskriminationsma e f r die ausgew hlten Variablen 72 Kapitel 6 Zus tzliche Funktionen beim Befehl MULTIPLE CORRESPONDENCE Sie k nnen die Mehrfachkorrespondenzanalyse an Ihre Bed rfnisse anpassen wenn Sie Ihre Auswahl in ein Syntax Fenster einf gen und die resultierende Befehlssyntax f r den Befehl MULTIPLE CORRESPONDENCE bearbeiten Mit der Befehlssyntax Sprache verf gen Sie au erdem ber folgende M glichkeiten m Mit dem Unterbefehl SAVE k
285. mme leichter verst ndlich sind als mehrdimensionale r umliche Darstellungen Wenn weniger als die H chstzahl der m glichen Dimensionen verwendet werden beschreibt die in der Analyse erstellte Statistik wie gut die Zeilen und Spaltenkategorien in der flachdimensionierten Darstellung repr sentiert werden Vorausgesetzt die Darstellung der zweidimensionalen L sung weist eine gute Qualit t auf k nnen Sie Plots der Zeilenpunkte und der Spaltenpunkte untersuchen um herauszufinden welche Kategorien der Zeilenvariablen hnlich sind welche Kategorien der Spaltenvariablen hnlich sind und welche Zeilen und Spaltenkategorien einander hnlich sind Beziehung zu anderen Prozeduren von Categories Die einfache Korrespondenzanalyse ist auf zweidimensionale Tabellen beschr nkt Liegen mehr als zwei relevante Variablen vor k nnen Sie die Variablen zu Interaktionsvariablen zusammenfassen Bei den Variablen Region T tigkeit und Alter beispielsweise k nnten Region und T tigkeit zu der neuen Variablen Regt tigkeit zusammengefa t werden die wie in der untenstehenden Tabelle gezeigt 12 Kategorien aufweist Diese neue Variable f hrt zu einer zweidimensionalen Tabelle mit Alter 12 Zeilen 4 Spalten die mithilfe der Korrespondenzanalyse analysiert werden kann Tabelle 1 4 Kombinationen von Region und T tigkeit Kategoriecode Kategoriedefinition Kategoriecode Kategoriedefinition 1 Norden Praktikant 7 Osten Praktikant
286. n rElastic Net Diagramme Alle m glichen Elastic Net Diagramme erzeugen Elastic Net Diagramme f r einige Ridge Strafen erzeugen Wertebereich Erster Letzter Einzelner Vert Lasso Elastic Net Inkrement ba bo Minimum Maximum Ridge Strafwerte Ridge Regression Liste der Strafwerte Fe il Lasso 0 0 vi Regularisierungsdiagramme anzeigen Coe ae C me Methode Regelungsmethoden k nnen den Vorhersagefehler verbessern indem Sie die Variabilit t in den Sch tzungen der Regressionskoeffizienten verringern indem Sie die Sch tzungen zu 0 hin verringern Lasso und Elastic Net verringern einige Koeffizientensch tzungen auf genau 0 und bieten so eine Form der variablen Auswahl Wenn eine Regelungsmethode angefordert wird werden das geregelte Modell und die Koeffizienten f r jeden Penalisierungskoeffizientenwert in eine externe IBM SPSS Statistics Datendatei oder ein Daten Set in der aktuellen Sitzung geschrieben F r weitere Informationen siehe Thema Kategoriale Regression Speichern auf S 26 Ridge Regression Ridge Regression verringert Koeffizienten durch die Einf hrung eines Penalisierungsterms der Summe der Koeffizienten zum Quadrat mal eines Penalisierungskoeffizienten Dieser Koeffizient kann zwischen 0 keine Penalisierung und 1 liegen Das Verfahren sucht nach dem besten Wert der Penalisierung wenn Sie einen Bereich und ein Inkrem
287. n Statistiken und Diagramme H ufigkeiten Regressionskoeffizienten ANOVA Tabelle Iterationsprotokoll Kategorienquantifikationen Korrelationen zwischen nicht transformierten Einflu variablen Korrelationen zwischen transformierten Einflu variablen Residuen Diagramme und Transformationsdiagramme Daten Mit CATREG werden Kategorienummervariablen verarbeitet Diese Kategorienummern m ssen positive Ganzzahlen sein Im Dialogfeld Diskretisierung k nnen Sie Variablen mit Dezimalbr chen und String Variablen in positive Ganzzahlen umwandeln Copyright SPSS Inc 1989 2010 16 17 Kategoriale Regression CATREG Annahmen Es ist nur eine Antwortvariable zul ssig die maximale Anzahl der Einflu variablen betr gt jedoch 200 Die Daten m ssen mindestens drei g ltige F lle enthalten Die Anzahl g ltiger F lle mu die Anzahl der Einflu variablen plus eins bersteigen Verwandte Prozeduren CATREG entspricht der kategorialen kanonischen Korrelationsanalyse mit optimaler Skalierung OVERALS und zwei Sets von denen ein Set jeweils nur eine Variable enth lt Eine Skalierung aller Variablen auf numerischem Niveau entspricht der normalen Mehrfachregressionsanalyse So lassen Sie eine kategoriale Regression berechnen gt Wahlen Sie die folgenden Befehle aus den Men s aus Analysieren gt Regression gt Optimale Skalierung CATREG Abbildung 2 1 Dialogfeld Kategoriale Regression i333 Kategoriale Regressi
288. n Eine Kreuztabelle gibt den Charakter der Beziehung zwischen den beiden Variablen jedoch nicht immer klar wieder Dies gilt insbesondere dann wenn die relevanten Variablen nominal sind ohne nat rliche Reihenfolge oder nat rlichen Rang und zahlreiche Kategorien besitzen Eine Kreuztabelle kann zwar aussagen dass die beobachteten Zellh ufigkeiten deutlich von den erwarteten Werten in einer 1079 Kreuztabelle von Berufsgruppe und Fr hst cksflocken abweichen Es kann jedoch sehr schwierig zu bestimmen sein welche Berufsgruppen einen hnlichen Geschmack aufweisen oder welcher genau dies ist Mit einer Korrespondenzanalyse k nnen Sie die Beziehung zwischen zwei nominalen Variablen grafisch in einem mehrdimensionalen Raum untersuchen Hierbei werden Zeilen und Spaltenwerte berechnet und Diagramme auf der Grundlage dieser Werte angelegt hnliche Kategorien werden in den Diagrammen nahe beieinander dargestellt Auf diese Weise ist leicht ersichtlich welche Kategorien einer Variablen einander hneln oder welche Kategorien beider Variablen zusammenh ngen Bei der Korrespondenzanalyse ist es au erdem m glich Zusatzpunkte in den Raum einzugliedern der durch die aktiven Punkte definiert ist Falls die Reihenfolge der Kategorien gem den Werten nicht erw nscht oder nicht intuitiv ist stehen Ordnungs Einschr nkungen zur Verf gung mit denen Sie festlegen k nnen dass die Werte f r einige Kategorien gleich sein m ssen Beispiel Bei der Vari
289. n Objektwerte und transformierte Werte in einer IBM SPSS Statistics Datendatei oder in einem Daten Set gespeichert werden Au erdem k nnen die transformierten Werte und die Objektwerte in der Arbeitsdatei gespeichert werden m Daten Sets sind in der aktuellen Sitzung verf gbar In nachfolgenden Sitzungen stehen Daten Sets nur zur Verf gung wenn Sie sie ausdr cklich als Datendateien speichern Die Namen von Daten Sets m ssen den Regeln zum Benennen von Variablen entsprechen m Die Namen f r die Dateien und Daten Sets m ssen sich bei allen Arten von gespeicherten Daten unterscheiden m Wenn Sie die Objektwerte oder die transformierten Werte in der Arbeitsdatei speichern k nnen Sie die Anzahl der mehrfach nominalen Dimensionen angeben Abbildung 6 8 Speichern FFA MCA Speichern rDiskretisierte Daten Neues Datenblatt erstellen Datenblatt Name Neue Datendatei schreiben Diskretisierte Daten erstellen r Transformierte Yariablen Neues Datenblatt erstellen Datenblatt Name Neue Datendatei schreiben Fi Transformierte Variablen in Arbeitsdatei speichern Fi Transformierte Variablen erstellen transformierte_vars rObjektwerte V Objektwerte erstellen Neues Datenblatt erstellen Datenblatt Name Neue Datendatei schreiben F Objektwerte in Arbeitsdatei speichern objektwerte Mehrfach nominale Dimensionen Alle Erste Cee ne ie
290. n Package design Brand name Price Good Housekeeping seal Money back guarantee 115 Kategoriale Regression Die nachstehende Tabelle zeigt die standardisierten Regressionskoeffizienten Bei der kategorialen Regression werden die Variablen standardisiert aus diesem Grund werden nur standardisierte Koeffizienten zur ckgegeben Diese Werte werden durch die zugeh rigen Standardfehler dividiert und ergeben so jeweils einen F Test f r die einzelnen Variablen Der Test f r jede Variable ist allerdings davon abh ngig dass die anderen Einflussgr en im Modell vorliegen Mit dem Test wird also ermittelt ob das Auslassen einer Einflussvariable aus dem Modell w hrend alle anderen Einflussgr en vorhanden sind zu einer deutlichen Verschlechterung der Vorhersagefunktionen des Modells f hren w rde Diese Werte sollten nicht beim Auslassen mehrerer Variablen gleichzeitig f r ein nachfolgendes Modell verwendet werden Alternierende kleinste Quadrate optimieren zudem die Quantifikationen dies impliziert dass diese Tests auf konservative Weise interpretiert werden m ssen Abbildung 9 19 Standardisierte Koeffizienten f r transformierte Einflussgr en Standardisierte Koeffizienten ei Standardf Beta ehler df F Sig Package design 155 289 Brand name i 578 Price i E 39 312 Good Housekeeping seal 35 299 Money back guarantee i 7 175 Abh ngige Yariable Preference Der gr te Koeffizient liegt f r Package desi
291. n Visual Display of Categorical Data M Greenacre als auch J Blasius Hgg New York Academic Press Meulman J J als auch P Verboon 1993 Points of view analysis revisited Fitting multidimensional structures to optimal distance components with cluster restrictions on the variables Psychometrika 58 Meulman J J A J Van der Kooij als auch A Babinec 2000 New features of categorical principal components analysis for complicated data sets including data mining In Classification Automation and New Media W Gaul als auch G Ritter Hgg Berlin Springer Verlag Meulman J J A J Van der Kooij als auch W J Heiser 2004 Principal components analysis with nonlinear optimal scaling transformations for ordinal and nominal data In Handbook of Quantitative Methodology for the Social Sciences D Kaplan Hg Thousand Oaks Kalifornien Sage Publications Inc Nishisato S 1980 Analysis of categorical data Dual scaling and its applications Toronto University of Toronto Press Nishisato S 1984 Forced classification A simple application of a quantification method Psychometrika 49 Nishisato S 1994 Elements of dual scaling An introduction to practical data analysis Hillsdale N J Lawrence Erlbaum Associates Inc Pratt J W 1987 Dividing the indivisible Using simple symmetry to partition variance explained In Proceedings of the Second International Conference in Statistics T Pukkil
292. n chsten Set zu wechseln klicken Sie auf Weiter und w hlen Sie die Variablen aus die in das zweite Set aufgenommen werden sollen Auf Wunsch k nnen Sie weitere Sets hinzuf gen Klicken Sie auf Zur ck um zum zuvor definierten Variablen Set zur ckzukehren Legen Sie f r jede Variable den Wertebereich und das Messniveau Niveau der optimalen Skalierung fest Klicken Sie auf OK Die folgenden Optionen sind verf gbar m Sie k nnen eine oder mehrere Variablen ausw hlen um Punktbeschriftungen f r Objektwertediagramme anzugeben Jede Variable erzeugt ein separates Diagramm dessen Punkte mit den Werten dieser Variablen beschriftet sind F r jede dieser Variablen zur Diagrammbeschriftung muss ein Bereich festgelegt werden In diesem Dialogfeld kann eine Variable nicht gleichzeitig in der Analyse und als Beschriftungsvariable verwendet werden Wenn Sie das Objektwertediagramm mit einer in der Analyse verwendeten Variablen beschriften m chten verwenden Sie die Funktion Berechnen verf gbar im Men Transformieren um eine Kopie dieser Variablen zu erstellen Verwenden Sie die 47 Nichtlineare kanonische Korrelationsanalyse OVERALS neue Variable um das Diagramm zu beschriften Wahlweise k nnen Sie dazu auch die Befehlssyntax verwenden m Sie k nnen die in der L sung gew nschte Anzahl der Dimensionen angeben Im allgemeinen sollten Sie nur so viele Dimensionen ausw hlen wie zum Erkl ren des gr ten Teils d
293. n Anwendungen zu nutzen Weitere Informationen zu den Inhalten der Ver ffentlichungen sowie Ausz ge aus den Kapiteln finden Sie auf der folgenden Autoren Website http www norusis com Danksagungen Die Prozeduren f r die optimale Skalierung und ihre Implementierung in IBM SPSS Statistics wurden von der Data Theory Scaling System Group DTSS entwickelt die aus Mitgliedern der Institute f r P dagogik und Psychologie der sozialwissenschaftlichen Fakult t der Universit t Leiden besteht Willem Heiser Jacqueline Meulman Gerda van den Berg und Patrick Groenen waren an den urspr nglichen Prozeduren aus dem Jahr 1990 beteiligt Jacqueline Meulman und Peter Neufeglise waren an der Entwicklung von Prozeduren f r die kategoriale Regression die Korrespondenzanalyse die kategoriale Hauptkomponentenanalyse und die multidimensionale Skalierung beteiligt Au erdem leistete Anita van der Kooij Beitr ge insbesondere zu CATREG CORRESPONDENCE und CATPCA Willem Heiser Jacques Commandeur Frank Busing Gerda van den Berg und Patrick Groenen waren an der Entwicklung der Prozedur PROXSCAL beteiligt Frank Busing Willem Heiser Patrick Groenen und Peter Neufeglise waren an der Entwicklung der Prozedur PREFSCAL beteiligt Teil I Benutzerhandbuch Inhalt 1 Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten 1 Was ist optimale Skalierung 2 2222 ccc cect tenet eee 1 Warum sollte optimale Skalier
294. n and optimal scaling using alternating least squares In Softstat 97 F Faulbaum als auch W Bandilla Hgg Stuttgart Gustav Fischer Van Rijckevorsel J 1987 The application of fuzzy coding and horseshoes in multiple correspondence analysis Leiden DSWO Press Verboon P als auch I A Van der Lans 1994 Robust canonical discriminant analysis Psychometrika 59 Verdegaal R 1985 Meer sets analyse voor kwalitatieve gegevens in niederldndischer Sprache Leiden Department of Data Theory Universitat Leiden Vlek C als auch P J Stallen 1981 Judging risks and benefits in the small and in the large Organizational Behavior and Human Performance 28 Wagenaar W A 1988 Paradoxes of gambling behaviour London Lawrence Erlbaum Associates Inc Ware J H D W Dockery A Spiro II F E Speizer als auch B G Ferris Jr 1984 Passive smoking gas cooking and respiratory health of children living in six cities American Review of Respiratory Diseases 129 Winsberg S als auch J O Ramsay 1980 Monotonic transformations to additivity using splines Biometrika 67 Winsberg S als auch J O Ramsay 1983 Monotone spline transformations for dimension reduction Psychometrika 48 Wolter K M 1985 Introduction to variance estimation Berlin Springer Verlag 326 Bibliografie Young F W 1981 Quantitative analysis of qualitative data Psychometrika 46 Young F W J De L
295. n der Anzahl von F llen die in die Analyse einbezogen werden sollen falls Sie nicht alle F lle in der Arbeitsdatei verwenden m chten mit dem Unterbefehl NOBSERVATIONS m Festlegen der Stammnamen f r Variablen die durch Speichern der Objektwerte erstellt wurden mit dem Unterbefehl sAvE m Festlegen der zu speichernden Anzahl an Dimensionen sodass nicht alle extrahierten Dimensionen gespeichert werden mit dem Unterbefehl sAvE m Schreiben von Kategoriequantifikationen in eine Matrixdatei mit dem Unterbefehl MATRIX Erzeugen von Diagrammen mit geringer Aufl sung die lesbarer sind als die blichen hochaufl senden Diagramme mit dem Befehl SET m Erstellen von Zentroid und Transformationsdiagrammen f r bestimmte Variablen mit dem Unterbefehl PLOT Vollst ndige Informationen zur Syntax finden Sie in der Command Syntax Reference Kapitel Korrespondenzanalyse Ein Ziel der Korrespondenzanalyse besteht darin die Beziehungen zwischen zwei nominalen Variablen in einer Korrespondenztabelle in einem flachdimensionierten Raum und gleichzeitig die Beziehungen zwischen den Kategorien f r jede Variable zu beschreiben F r jede Variable werden die Beziehungen zwischen den Kategorien durch die Distanzen zwischen den Kategoriepunkten in einem Diagramm dargestellt wobei hnliche Kategorien jeweils nahe beieinander liegen Durch die Projizierung von Punkten f r eine Variable auf dem Vektor vom Ursprung zu einem Kategoriepunkt
296. n der Korrespondenzanalyse 224 Projizierte Zentroide in Nichtlineare kanonische Korrelationsanalyse 214 Quantifizierungen in der Kategorialen Hauptkomponentenanalyse 155 175 in Nichtlineare kanonische Korrelationsanalyse 211 R2 in Kategoriale Regression 114 Regressionskoeffizienten in Kategoriale Regression 24 Residuen in Kategoriale Regression 119 Residuen Diagramme in Multidimensionale Entfaltung 95 Ridge Regression in Kategoriale Regression 23 Shepard Diagramme in Multidimensionale Entfaltung 95 Shepards Index f r Nicht Degeneration in Multidimensionale Entfaltung 275 278 284 291 300 Skalierungsmodell in Multidimensionale Entfaltung 90 Spaltenprinzipal Normalisierung in der Korrespondenzanalyse 224 Spaltenwertdiagramme in der Korrespondenzanalyse 232 Standardisierung in der Korrespondenzanalyse 54 Stress Diagramme in Multidimensionale Entfaltung 95 in Multidimensionale Skalierung 84 Stressma e in Multidimensionale Entfaltung 97 in Multidimensionale Skalierung 86 264 269 Streudiagramm der Anpassung in Multidimensionale Entfaltung 95 Symmetrische Normalisierung in der Korrespondenzanalyse 224 Teilkorrelationen in Kategoriale Regression 115 trademarks 320 Tr gheit in der Korrespondenzanalyse 56 Transformationsdiagramme bei der Mehrfachkorrespondenzanalyse 70 330 Index in der Kategorialen Hauptkomponentenanalyse 4
297. n die Distanzen zwischen den Objekten optimiert Dies ist n tzlich wenn Sie haupts chlich an den Unterschieden oder bereinstimmungen zwischen den Objekten interessiert sind m Symmetrisch Verwenden Sie diese Normalisierungsmethode wenn Sie haupts chlich an den Beziehungen zwischen den Objekten und den Variablen interessiert sind 67 Mehrfachkorrespondenzanalyse m Unabh ngig Verwenden Sie diese Normalisierungsmethode wenn Sie die Distanzen zwischen den Objekten und die Korrelationen zwischen den Variablen getrennt untersuchen m chten m Benutzerdefiniert Sie k nnen einen beliebigen reellen Wert aus dem abgeschlossenen Intervall 1 1 eingeben Der Wert 1 entspricht der Methode Objektprinzipal der Wert 0 der Methode Symmetrisch und der Wert 1 der Methode Variablenprinzipal Bei Werten gr er als 1 und kleiner als 1 wird der Eigenwert sowohl ber Objekte als auch Variablen gestreut Mit dieser Methode k nnen Sie Biplots und Triplots genau an Ihre Bed rfnisse anpassen Kriterien Sie k nnen die maximale Anzahl von Iterationen festlegen die in der Prozedur bei den Berechnungen durchlaufen werden Au erdem k nnen Sie einen Wert f r das Konvergenzkriterium ausw hlen Die Prozedur wird abgebrochen wenn die Differenz der Gesamtanpassung zwischen den letzten zwei Iterationen kleiner als der Konvergenzwert ist oder die Maximalzahl von Iterationen erreicht wurde Diagramme beschriften mit Hiermit
298. nalit t Dieses Diagramm wird nur erstellt wenn die H chstanzahl von Dimensionen gr er als die Mindestanzahl von Dimensionen ist Endg ltiger gemeinsamer Raum Eine Streudiagramm Matrix der Koordinaten des gemeinsamen Raums wird angezeigt 97 Multidimensionale Entfaltung PREFSCAL m Raumgewichtungen Ein Streudiagramm der individuellen Raumgewichtungen wird erstellt Dies ist nur m glich wenn im Dialogfeld Modell eines der Modelle f r individuelle Differenzen angegeben ist F r das Modell Euklidisch gewichtet werden die Gewichtungen f r alle Quellen mit einer Dimension auf jeder Achse in einem Diagramm angezeigt F r das Modell Euklidisch verallgemeinert wird ein Diagramm pro Dimension erstellt das f r jede Quelle die Rotation und Gewichtung der jeweiligen Dimension anzeigt m Individueller Raum Eine Streudiagramm Matrix der Koordinaten des individuellen Raums jeder Quelle wird angezeigt Dies ist nur m glich wenn im Dialogfeld Modell eines der Modelle f r individuelle Differenzen angegeben ist m Transformationsdiagramme Es wird ein Streudiagramm der urspr nglichen hnlichkeiten im Vergleich zu den transformierten hnlichkeiten erstellt Abh ngig davon wie Transformationen angewendet werden wird jeder Zeile oder Quelle eine separate Farbe zugewiesen Eine unabh ngige Transformation erzeugt eine Farbe m Shepard Diagramme Die urspr nglichen hnlichkeiten im Vergleich zu sowohl trans
299. ndenzanalyse Beitrag der Tr gheit der der Dimension an der Dimension Tr gheit des Punktes Pt ee 2 1 2 bersicht 825 992 266 715 805 973 755 964 774 555 962 559 948 580 670 537 951 972 500 Zwei Dimensionen tragen einen Gro teil der Tr gheit bei den meisten Zeilenpunkten bei Die gro en Anteile der ersten Dimension an gesund neu attraktiv fettarm n hrstoffreich und Frauen zeigen dass diese Punkte in einer Dimension sehr stark repr sentiert sind Die h heren Dimensionen tragen folglich nur wenig zur Tr gheit dieser Punkte bei die sehr nahe an der horizontalen Achse liegen Die zweite Dimension liefert die gr ten Beitr ge f r M nner premium und stark Beide Dimensionen haben einen sehr geringen Anteil an der Tr gheit f r S d Australien und h sslich diese Punkte sind daher unterrepr sentiert 232 Kapitel 12 Die bersicht der Spaltenpunkte zeigt die Beitr ge im Zusammenhang mit den Spaltenpunkten Die Marken CC und DD tragen am st rksten zur ersten Dimension bei die Marken EE und FF erkl ren einen Gro teil der Tr gheit f r die zweite Dimension Sowohl AA als auch BB bringen nur sehr geringe Beitr ge zu den Dimensionen Abbildung 12 9 Beitr ge der Marken Wert in des Punktes an der Tr gheit der der Dimension an der bersich Dimension Tr gheit des Punktes t ber Gesamt Tr gheit 1 2 1 2 bersicht Dimension AA
300. nds com und Hersteller Websites entnommen car_sales_uprepared sav Hierbei handelt es sich um eine modifizierte Version der Datei car_sales sav die keinerlei transformierte Versionen der Felder enth lt carpet sav In einem beliebten Beispiel m chte Green als auch Wind 1973 einen neuen Teppichreiniger vermarkten und dazu den Einfluss von f nf Faktoren auf die Bevorzugung durch den Verbraucher untersuchen Verpackungsgestaltung Markenname Preis G tesiegel Good Housekeeping und Geld zur ck Garantie Die Verpackungsgestaltung setzt sich aus drei Faktorenebenen zusammen die sich durch die Position der Auftrageb rste unterscheiden Au erdem gibt es drei Markennamen K2R Glory und Bissell drei Preisstufen sowie je zwei Ebenen Nein oder Ja f r die letzten beiden Faktoren 10 Kunden stufen 22 Profile ein die durch diese Faktoren definiert sind Die Variable Preference enth lt den Rang der durchschnittlichen Einstufung f r die verschiedenen Profile Ein niedriger Rang bedeutet eine starke Bevorzugung Diese Variable gibt ein Gesamtma der Bevorzugung f r die Profile an carpet_prefs sav Diese Datendatei beruht auf denselben Beispielen wie f r carpet sav beschrieben enth lt jedoch die tats chlichen Einstufungen durch jeden der 10 Kunden Die Kunden wurden gebeten die 22 Produktprofile in der Reihenfolge ihrer Pr ferenzen einzustufen Die Variablen PREF bis PREF22 enthalten die IDs der zugeordneten Profile wie in carpet_plan
301. ner anschlie endenden unterschiedlichen Gewichtung der Dimensionen entspricht Reduzierter Rang Bei diesem Modell handelt es sich um ein verallgemeinertes euklidisches Modell f r das Sie den Rang des individuellen Raums angeben k nnen Der angegebene Rang muss gr er oder gleich 1 und kleiner als die H chstanzahl von Dimensionen sein Form Geben Sie an ob die hnlichkeiten der unteren oder oberen Dreiecksmatrix der Distanzmatrix entnommen werden sollen Sie k nnen angeben dass die gesamte Matrix verwendet werden soll In diesem Fall wird die gewichtete Summe der unteren und oberen 81 Multidimensionale Skalierung PROXSCAL Dreiecksmatrix analysiert Obwohl nur die angegebenen Abschnitte verwendet werden muss in jeden Fall die gesamte Matrix einschlie lich der Diagonalen angegeben werden hnlichkeiten Geben Sie an ob die Distanzmatrix hnlichkeits oder Un hnlichkeitsma e enth lt hnlichkeitstransformationen W hlen Sie eine der folgenden Alternativen aus m Verh ltnis Die transformierten hnlichkeiten sind proportional zu den urspr nglichen hnlichkeiten Diese Option ist nur f r hnlichkeiten mit positiven Werten zul ssig m Intervall Die transformierten hnlichkeiten sind proportional zu den urspr nglichen hnlichkeiten plus einem konstanten Term Durch die Konstante wird sichergestellt dass alle hnlichkeiten positive Werte haben m Ordinal Die transformierten hnlichkeiten weisen dieselbe
302. ng Einschr nkungen Xj Einschr nkungen im gemeinsamen Raum Keine Einschr nkungen Einige Koordinaten sind fest Lineare Kombination der unabh ngigen variablen Einschr nkungsvariablen Variablen einlesen aus Verf gbar Ausgew hlt EEE BE Transformationen f r unabh ngige variablen interval Grad 2 Knoten 1 Wahlen Sie Lineare Kombination der unabh ngigen Variablen gt Klicken Sie auf Datei und w hlen Sie die Quelle der unabh ngigen Variablen aus W hlen Sie die Datei kinship_var sav aus 257 Multidimensionale Skalierung Abbildung 14 5 Dialogfeld Einschr nkungen fH Multidimensionale Skalierung Einschr nkungen X Einschr nkungen im gemeinsamen Raum Keine Einschr nkungen Einige Koordinaten sind fest Lineare Kombination der unabh ngigen variablen Einschr nkungsvariablen Variablen einlesen aus Datei C Program Files SPSSinc PASVVSt kinship_var sav Verf gbar Ausgew hlt gender gener BEE a Anse Transformationen f r unabh ngige Variablen Interval Grad 2 Knoten 1 W hlen Sie gender gener und degree als Einschr nkungsvariablen aus Beachten Sie dass die Variable gender einen benutzerdefiniert fehlenden Wert aufweist 9 Fehlend f r Cousin Im Rahmen der Prozedur wird dies als g ltige Kategorie behandelt Die lineare Transformation nach dem Standardverfahren ist daher
303. ng liegt bietet in den ersten beiden Dimensionen berhaupt keine Unterscheidung Dies ergibt einen Sinn da alle Objekte aus Messing oder auch nicht aus Messing bestehen k nnen Kategorienquantifikationen Erinnern wir uns da ein Diskriminationsma die Varianz der quantifizierten Variablen entlang einer bestimmten Dimension ist Das Diagramm der Diskriminationsma e enth lt diese Varianzen wodurch angezeigt wird welche Variablen entlang welcher Dimension eine Unterscheidung 244 Kapitel 13 bieten Dieselbe Varianz k nnte jedoch vorliegen wenn alle Kategorien m ig weit voneinander entfernt liegen oder wenn die meisten Kategorien eng zusammen liegen einige Kategorien jedoch von dieser Gruppe abweichen Das Diskriminationsdiagramm bietet keine Unterscheidung zwischen diesen beiden Zust nden Diagramme zur Kategorienquantifikation bieten eine alternative Methode zur Anzeige der Diskrimination von Variablen durch die Kategoriebeziehungen identifiziert werden k nnen In diesem Diagramm werden die Koordinaten der einzelnen Kategorien in jeder Dimension angezeigt So k nnen Sie bestimmen welche Kategorien f r welche Variable hnlich sind Abbildung 13 8 Kategorienquantifikationen 4 o 7 s Kreuz O Einkerbung des Kopfes O gewinde 3 25cm Grundform O Kopfform Lange in cm N 5 E lt o konisch 7 E gew lbt a j 1 5 cm Ja scharf Yehi Nein u fiach SAIF 0 5cm o o o o A Keine zylinde2f rmig te fe Tem flach
304. ng nicht erfassen gt Um die am besten geeignete Linie ber die Punkte im Streudiagramm anzeigen zu lassen aktivieren Sie die Grafik indem Sie darauf doppelklicken W hlen Sie im Diagramm Editor einen Punkt aus gt Klicken Sie auf das Werkzeug zum Einf gen einer Anpassungslinie beim Gesamtwert und schlie en Sie den Diagramm Editor 140 Kapitel 9 Abbildung 9 49 Streudiagramm mit Anpassungslinie 40 00 30 00 T gt 9 20 00 N o Ss Q 10 00 0 00 0 00 100 00 200 00 300 00 400 00 Day of the year Eine lineare Regression von Daily ozone level ber Day of the year ergibt einen Wert von 0 004 f r R2 Diese Anpassungsg te l sst erkennen dass Day of the year keinen vorhersagbaren Wert f r Daily ozone level aufweist Beim vorliegenden Muster in der Abbildung ist dies nicht weiter berraschend Wenn Sie jedoch die optimale Skalierung verwenden k nnen Sie die quadratische Beziehung linearisieren und die Antwort mithilfe der transformierten Variablen Day of the year vorhersagen 141 Kategoriale Regression Abbildung 9 50 Dialogfeld Kategoriale Regression iii Kategoriale Regression X L vn E Inversion base height i E Pressure gradient mm 9 Visibility miles vis Unabh ngige Variable n Skala definieren Temperature degrees 8E Daily ozone level Quan 8E Inversion base height E Pressure gradient mm E visibility miles Quanti 8E Temper
305. ngen E Multidimensionale Skalierung Einschrankungen rEinschr nkungen im gemeinsamen Raum Keine Einschr nkungen Einige Koordinaten sind fest Lineare Kombination der unabh ngigen variablen rEinschr nkungsvariablen Yariablen einlesen aus Datei C Program Files SPSSinc PASVYSt kinship_var sav verf gbar Ausgew hlt gender Nominal gener Ordinal gt Wahlen Sie gener und degree Wahlen Sie in der Dropdown Liste f r die Transformationen unabh ngiger Variablen den Eintrag Ordinal Bindungen beibehalten Klicken Sie auf ndern Klicken Sie auf Weiter Klicken Sie im Dialogfeld Multidimensionale Skalierung auf OK Transformations Diagramme Mithilfe der Transformationsdiagramme k nnen Sie rasch pr fen ob die urspr nglichen Transformationen angemessen waren Wenn die Diagramme ungef hr linear sind ist die lineare Annahme geeignet Pr fen Sie andernfalls die Stressma e ob eine Verbesserung bei der Anpassung vorliegt Ermitteln Sie au erdem anhand des Diagramms mit dem gemeinsamen Raum ob die Interpretation aussagekr ftigere Ergebnisse liefert Die unabh ngigen Variablen resultieren jeweils in einer ungef hr linearen Transformation diese Variablen sollten daher ggf als numerisch interpretiert werden Die hnlichkeiten liefern allerdings keine lineare Transformation sodass hier eine ordinale Transformation in Betracht gezogen werden sollte 26
306. ngen 272 Drei Weg Entfaltung 279 Einschr nkungen im gemeinsamen Raum 92 Gemeinsamer Raum 276 279 285 292 301 305 Grafik 89 95 Individueller Raum 286 293 Ma e 275 278 284 291 300 304 Modell 90 Optionen 93 Statistik 89 zus tzliche Funktionen beim Befehl 99 Multidimensionale Skalierung 73 75 79 253 Ausgabe 86 Einschr nkungen 81 Gemeinsamer Raum 265 269 Grafik 73 84 85 Modell 80 Optionen 82 Statistik 73 Stressma e 264 269 Transformationsdiagramme 268 zus tzliche Funktionen beim Befehl 88 Multiples R in Kategoriale Regression 24 Nichtlineare kanonische Korrelationsanalyse 44 47 48 199 Gewichte 208 Grafik 44 Kategoriekoordinaten 213 Komponentenladungen 208 210 Quantifizierungen 211 Statistik 44 Zentroide 214 Zusammenfassung der Analyse 207 zus tzliche Funktionen beim Befehl 50 Normalisierung in der Korrespondenzanalyse 54 224 Objektpunktdiagramme bei der Mehrfachkorrespondenzanalyse 70 in der Kategorialen Hauptkomponentenanalyse 39 Objektwerte bei der Mehrfachkorrespondenzanalyse 67 241 245 in der Kategorialen Hauptkomponentenanalyse 37 157 160 179 in Nichtlineare kanonische Korrelationsanalyse 48 Partielle Korrelationen in Kategoriale Regression 115 Penalisierter Stress in Multidimensionale Entfaltung 275 284 291 300 304 Index Penalisierungsterm in Multidimensionale Entfaltung 93 PREFSCAL 89 Prinzipal Normalisierung i
307. nkt Sie k nnen festlegen dass bestimmte Spaltenkategorien anderen Spaltenkategorien entsprechen m ssen Au erdem k nnen Sie eine Spaltenkategorien als erg nzende Kategorie definieren Kategorien m ssen gleich sein Die Kategorien m ssen gleiche Werte haben Verwenden Sie Gleichheitsbeschr nkungen wenn die erhaltene Ordnung der Kategorien nicht erw nscht oder nicht intuitiv ist Die maximale Anzahl der Spaltenkategorien f r die Gleichheitsbeschr nkungen festgelegt werden k nnen entspricht der Gesamtzahl aktiver Spaltenkategorien minus 1 Zum Definieren anderer Gleichheitsbeschr nkungen f r Kategoriegruppen k nnen Sie die Syntax verwenden Beispielsweise k nnen Sie mithilfe der Syntax festlegen dass die Kategorien 1 und 2 sowie die Kategorien 3 und 4 gleich sein m ssen m Erg nzende Kategorie Erg nzende Kategorien haben keine Auswirkungen auf die Analyse werden jedoch in dem durch die aktiven Kategorien definierten Raum dargestellt Erg nzende Kategorien spielen keine Rolle bei der Definition von Dimensionen Die maximale Anzahl der erg nzenden Spaltenkategorien entspricht der Gesamtanzahl der Spaltenkategorien minus 2 Korrespondenzanalyse Modell Im Dialogfeld Modell k nnen Sie die Anzahl der Dimensionen die Distanzma e sowie die Standardisierungsmethode und die Normalisierungsmethode angeben 55 Korrespondenzanalyse Abbildung 5 4 Dialogfeld Modell H Korrespondenzanalyse Modell Dimen
308. nnen Sie Stammnamen f r die transformierten Variablen Objektwerte und Approximationen festlegen wenn Sie diese in der Arbeitsdatei speichern m Mit dem Unterbefehl PLOT kann die H chstl nge f r Beschriftungen f r jedes Diagramm getrennt festgelegt werden m Mit dem Unterbefehl PLOT kann eine separate Variablenliste f r Residuen Diagramme festgelegt werden Vollst ndige Informationen zur Syntax finden Sie in der Command Syntax Reference Kapitel 7 Multidimensionale Skalierung PROXSCAL Bei der multidimensionalen Skalierung wird versucht die Struktur in einem Set von hnlichkeitsma en zwischen Objekten zu ermitteln Dies wird durch das Zuweisen von Beobachtungen zu bestimmten Positionen in einem konzeptuellen Raum mit wenigen Dimensionen erzielt wobei die Abst nde zwischen den Punkten des Raumes mit den vorgegebenen Un hnlichkeiten bzw hnlichkeiten so gut wie m glich bereinstimmen Als Ergebnis werden die Objekte in diesem Raum mit wenigen Dimensionen mithilfe der Methode der kleinsten Quadrate dargestellt was h ufig zu einem besseren Verst ndnis der Daten beitr gt Beispiel Die multidimensionale Skalierung kann das Ermitteln von Wahrnehmungsbeziehungen erheblich erleichtern Der Hersteller eines Produkts kann zum Beispiel eine Umfrage durchf hren um das Produktimage zu ermitteln und ein Daten Set zu erhalten das die wahrgenommene hnlichkeit N he des Produkts mit Konkurrenzprodukten beschreibt Unter
309. nsformierte hnlichkeiten Transformierte hnlichkeiten gegen Distanzen Y Transtormierte unabh ngige variablen variablen und Dimensionskorrelationen Diagramme der Quellen Alle Quellen Quellen ausw hlen Quellennummer Quellen Hinzuf gen Andern eier aeerecnen re Multidimensionale Skalierung gt W hlen Sie Urspr ngliche ber transformierte hnlichkeiten und Transformierte unabh ngige Variablen Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Multidimensionale Skalierung auf Ausgabe 264 Kapitel 14 Abbildung 14 12 Dialogfeld Ausgabe i Multidimensionale Skalierung Ausgabe X rAnzeige M Gemeinsame Raumkoordinaten B Stress t r Zutallstarts A Individuelle Raumkoordinaten E kterationsprotokoll A Individuelle Raumgewichtungen Fi Multiple Stressma e Distanzen M Stress Zerlegung Transformierte hnlichkeiten Transformierte unabh ngige Variablen i Eingabedaten Yariablen und Dimensionskorrelationen rin neuer Datei speichern T Gemeinsame Raumkoordinaten BB individuelle Raumgewichtungen Distanzen Transformierte hnlichkeiten Transformierte unabh ngige Variablen Da ei i ei aeerecnen L re W hlen Sie Eingabedaten Stress Zerlegung und Variablen und Dimensionskorrelationen Klicken Sie auf Weiter Kli
310. nsionen nach durchschnittlicher Diskrimination geordnet Die erste Dimension weist die gr te durchschnittliche Diskrimination auf die zweite Dimension weist die zweitgr te durchschnittliche Diskrimination auf usw Auf diese Weise werden alle Dimensionen in der L sung geordnet Abbildung 13 7 Diagramm der Diskriminationsma e 1 0 L nge in cm 0 8 N Einkerbung des Kgpfe c 06 K f o m7 E 04 A 02 ssing Grundform gewinde 0 0 0 0 0 2 0 4 0 6 0 8 1 0 Dimension 1 Wie beim Objektwertediagramm angezeigt zeigt das Diagramm der Diskriminationsma e an da die erste Dimension mit den Variablen Gewinde und Grundform in Zusammenhang steht Diese Variablen weisen gro e Diskriminationsma e in der ersten Dimension und kleine Diskriminationsma e in der zweiten Dimension auf Daher weisen f r diese beiden Variablen die Kategorien nur in der ersten Dimension eine gro e Streubreite auf L nge in cm weist einen gro en Wert in der zweiten Dimension auf jedoch einen kleinen Wert in der ersten Dimension Als Ergebnis liegt L nge am n chsten an der zweiten Dimension was mit der Beobachtung aus dem Objektwertediagramm bereinstimmt da die zweite Dimension die l ngsten Objekte vom Rest zu trennen scheint Einkerbung des Kopfes und Kopfform weisen in beiden Dimensionen relative gro e Werte auf was eine Diskrimination sowohl in der ersten als auch in der zweiten Dimension anzeigt Die Variable Messing die sehr nah am Urspru
311. nter der Akronym OVERALS bekannt Die kanonische Standard Korrelationsanalyse ist eine Erweiterung der mehrfachen Regression wobei das zweite Set nicht nur eine Antwortvariable sondern mehrere Antwortvariablen enth lt Ziel ist es einen m glichst gro en Teil der Varianz in der Beziehung zwischen zwei Sets von numerischen Variablen in einem Raum mit wenigen Dimensionen zu erkl ren Zun chst werden die Variablen in jedem Set linear so kombiniert dass die linearen Kombinationen maximal miteinander korrelieren Nach diesen Kombinationen werden weitere lineare Kombinationen ermittelt die nicht mit den vorherigen Kombinationen korrelieren und ber die h chstm gliche Korrelation verf gen Der Einsatz der optimalen Skalierung erweitert die Standardanalyse in drei entscheidenden Punkten Erstens erm glicht OVERALS mehr als zwei Variablen Sets Zweitens k nnen Variablen nominal ordinal oder numerisch skaliert werden Als Folge davon k nnen nichtlineare Beziehungen zwischen Variablen analysiert werden Drittens werden nicht die Korrelationen zwischen den Variablen Sets maximiert sondern die Sets werden mit einem unbekannten durch die Objektwerte definierten Kompromiss Set verglichen Beispiel Mit der kategorialen kanonischen Korrelationsanalyse mit optimaler Skalierung kann die Beziehung zwischen zwei Variablen Sets grafisch dargestellt werden von denen das eine die Berufsgruppe und die Ausbildungsdauer in Jahren und das andere die Region des W
312. ntersuchen die beim Wechsel zum einzeln nominalen Messniveau mit optimaler Skalierung entstehen k nnen Sie die Analyse wiederholen 217 Nichtlineare kanonische Korrelationsanalyse So f hren Sie die Analyse durch gt Rufen Sie das Dialogfeld Nichtlineare kanonische Korrelationsanalyse erneut auf und wechseln Sie zum ersten Set W hlen Sie age aus und klicken Sie auf Bereich und Skala definieren W hlen Sie im Dialogfeld Bereich und Skala definieren den Skalierungsbereich Einzeln nominal aus Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Nichtlineare kanonische Korrelationsanalyse auf OK Die Eigenwerte f r eine zweidimensionale L sung sind gleich 0 806 bzw 0 757 die Gesamtanpassung betr gt 1 564 Abbildung 11 26 Eigenwerte f r die zweidimensionale L sung ee une Summe Yerlustfunktion Set1 Set2 Set 3 Mittelwert Eigenwert Anpassung Die Tabellen fiir die Mehrfachanpassung und Einzelanpassung zeigen dass Age in years immer noch einen hohen Diskriminationswert aufweist wie die Summe der Werte fiir die Mehrfachanpassung belegt Im Gegensatz zu den fr heren Ergebnissen zeigt die Untersuchung der Einzelanpassungswerte jedoch dass die Diskrimination nahezu vollst ndig in der zweiten Dimension erfolgt Abbildung 11 27 Aufteilen der Anpassung und der Verluste Mehrfachanpassung an Einzelne Verlustfunktion Dimension mension Summe 1 2 summe 1 Summe
313. ntfaltung auf Diagramme 283 Multidimensionale Entfaltung Abbildung 15 11 Dialogfeld Diagramme fa Multidimensionale Entfaltung Diagramme X rDiagramme ia Mehrere Starts Anf nglicher gemeinsamer Raum A Stress pro Dimension Fi Endg ltiger gemeinsamer Raum V Raumgewichtungen Y Individueller Raum E Transformationsdiagramme Shepard Diagramme E Streudiagramm der Anpassung E Residuen Diagramme rStile f r Zeilenobjekte Ly Farben gt Markierungen Menu scenarios srcid Gender gender Toast pop up TP Buttered toast BT rDiagramme der Quellen Alle Quellen Quellen uf gen nden _ Entfernen Quellen ausw hlen Quellennummer r Zeilendiagramme Alle Zeilen Hinzuf gen Andern Entfernen Zeilen ausw hlen Zeilennummer Cee Anrecnen _ Hate W hlen Sie in der Gruppe Diagramme die Option Individueller Raum Klicken Sie auf Weiter Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf OK Im Folgenden finden Sie die durch diese Optionen generierte Befehlssyntax PREFSCAL VARIABLES TP BT EMM JD CT BMM HRB TMd BTJ TMn CB DP GD CC CMB INPUT SOURCES srcid INITIAL CLASSICAL SPEARMAN CONDITION ROW TRANSFORMATION NONE PROXIMITIES DISSIMILARITIES MODEL WEIGHTED CRITERIA DIMENSIONS 2 2 DIFFSTRESS 000001 MINSTRESS 0001 284
314. nzanalyse Statistiken Fi Korrespondenztabelle Fi bersicht der Zeilenpunkte V bersicht der Spaltenpunkte Fi Permutationen der Korrespondenztabelle H chste Dimension f r Permutationen Y Zeilenprofile V Spaltenprofile Konfidenzstatistiken f r M Zeilenpunkte Spattenpunkte C een i Korrespondenztabelle Eine Kreuztabelle f r die Eingabevariable mit Randh ufigkeiten der Zeilen und Spalten bersicht der Zeilenpunkte F r jede Zeilenkategorie werden die Werte die Masse die Tr gheit der Anteil der Dimension an der Tr gheit und der Anteil der Dimension an der Tr gheit des Punkts angezeigt bersicht der Spaltenpunkte F r jede Spaltenkategorie werden die Werte die Masse die Tr gheit der Anteil der Dimension an der Tr gheit und der Anteil der Dimension an der Tr gheit des Punkts angezeigt Zeilenprofile F r jede Zeilenkategorie wird die Verteilung ber die Kategorien der Spaltenvariablen angezeigt Spaltenprofile F r jede Spaltenkategorie wird die Verteilung ber die Kategorien der Zeilenvariablen angezeigt Permutationen der Korrespondenztabelle Die Korrespondenztabelle wird so umstrukturiert dass die Zeilen und Spalten entsprechend den Werten der ersten Dimension in aufsteigender Reihenfolge angezeigt werden Optional k nnen Sie auch eine maximale Dimensionszahl angeben f r die Permutationstabellen erzeugt werden sollen Dadurch wird f r jede Dimension von 1 bi
315. nzeige M H ufigkeiten IM Einfache und mehrfache Anpassung E Zentroide iM Kategorienquantifikationen _ terationsprotokoll E Objektwerte Fi Gewichte und Komponentenladungen rDiagramm E Kategorienkoordinaten M Kategorienzentroide N Objektwerte Transformationen i Komponentenladungen E Objektwerte speichern Ti Zuf llige Anfangskonfiguration verwenden Kriterien Anzahl der tterationen Konvergenz oo001 eter autres mre Deaktivieren Sie die Option Zentroide und w hlen Sie in der Gruppe Anzeigen die Option Gewichte und Komponentenladungen W hlen Sie in der Gruppe Diagramm die Optionen Kategorienzentroide und Transformationen W hlen Sie Zuf llige Anfangskonfiguration verwenden Klicken Sie auf Weiter Klicken Sie im Dialogfeld Nichtlineare kanonische Korrelationsanalyse auf OK 206 Kapitel 11 Bei der kategorialen kanonischen Korrelationsanalyse mit optimaler Skalierung wird zun chst eine Liste der Variablen erzeugt in der das zugeh rige Messniveau mit optimaler Skalierung vermerkt ist und dann eine Tabelle aus der die H ufigkeit der Objekte in den Kategorien hervorgeht Diese Tabelle ist besonders wichtig wenn Daten fehlen weil nahezu leere Kategorien die L sung eher dominieren In diesem Beispiel fehlen keine Daten Bei einer zweiten Vorab berpr fung untersuchen Sie ob Ausrei er im Diagramm der Objektwerte vor
316. nzeln nominaler Quantifizierung kennen Sie normalerweise nicht die Reihenfolge der Kategorien m chten jedoch dass durch die Analyse eine festgelegt wird Wenn die Reihenfolge der Kategorien bekannt ist sollten Sie eine ordinale Quantifizierung verwenden Wenn sich die Kategorien nicht ordnen lassen sollten Sie eine mehrfach nominale Quantifizierung verwenden Transformationsdiagramme Die verschiedenen Niveaus auf denen die einzelnen Variablen skaliert werden k nnen bringen verschiedene Einschr nkungen f r die Quantifizierungen mit sich Transformationsdiagramme illustrieren die Beziehung zwischen den Quantifizierungen und den urspr nglichen Kategorien die sich aus dem jeweils ausgew hlten Messniveau der optimalen Skalierung ergibt So ergibt sich beispielsweise ein lineares Transformationsdiagramm wenn eine Variable als numerisch behandelt wird Als ordinal behandelte Variablen f hren zu einem nicht fallenden 4 Kapitel 1 Transformationsdiagramm Transformationsdiagramme f r als nominal behandelte Variablen die die Form eines U oder eines umgedrehten U aufweisen stellen eine quadratische Beziehung dar Nominale Variablen k nnen auch Transformationsdiagramme ohne offensichtliche Trends ergeben indem die Reihenfolge der Kategorien vollst ndig ge ndert wird Folgende Abbildung zeigt ein Beispiel Transformationsdiagramm Transformationsdiagramme sind besonders gut geeignet um zu bestimmen wie gut das ausgew hl
317. ogfeld Modell k nnen Sie ein Skalierungsmodell die minimale und maximale Anzahl seiner Dimensionen die Struktur der Distanzmatrix und die f r die hnlichkeiten zu verwendende Transformation angeben sowie festlegen ob hnlichkeiten f r jede Quelle getrennt oder unabh ngig von der Quelle transformiert werden Abbildung 7 7 Dialogfeld Modell E Multidimensionale Skalierung Modell r Skalierungsmodell hnlichkeitstransformationen Identit t verh ttnisskala Euklidisch gewichtet Intervall Euklidisch verallgemeinert Ordinal Reduzierter Rang A Spline ph Untere Dreiecksmatrix Transformationen zuweisen ine Getrennt in jeder Quelle O cosanta Matris Alle Quellen gleichzeitig r hnlichketen pDimensionen Minimum e Un hnlichkeiten a Maximum 10 hnlichkeiten 5 GE an me Skalierungsmodell W hlen Sie eine der folgenden Alternativen aus Identit t Alle Quellen weisen dieselbe Konfiguration auf Euklidisch gewichtet Hierbei handelt es sich um ein Modell f r individuelle Differenzen Jede Quelle hat einen individuellen Raum in dem jede Dimension des gemeinsamen Raums unterschiedlich gewichtet ist Euklidisch verallgemeinert Hierbei handelt es sich um ein Modell f r individuelle Differenzen Jede Quelle besitzt einen individuellen Wahrnehmungsraum der einer Rotation des gemeinsamen Raums mit ei
318. ogfeld Optimale Skalierung A Optimale Skalierung rMessniveau der optimalen Skalierung Alle variablen sind mehrfach nominal Einige Variablen sind nicht mehrfach nominal rAnzahl der Yariablen Sets Ein Set Mehrere Sets rAusgew hlte Analyse Mehrfachkorrespondenzanalyse asi nen W hlen Sie die Option Alle Variablen sind mehrfach nominal aus gt Wahlen Sie die Option Ein Set Klicken Sie auf Definieren 62 Kapitel 6 Abbildung 6 2 Dialogfeld Mehrfachkorrespondenzanalyse fff Mehrfachkorrespondenzanalyse Analysevariablen Diagramme Zusatzvariablen ovjek Beschriftungsvariablen Dimensionen in der L sung EEE gt Wahlen Sie mindestens zwei Analysevariablen aus und geben Sie die Anzahl der Dimensionen in der L sung an Klicken Sie auf OK Sie k nnen au erdem Beschriftungsvariablen f r die Diagramme und Zusatzvariablen bestimmen die in die gefundene L sung eingepa t werden Definition des Variablengewichts bei der Mehrfachkorrespondenzanalyse Sie k nnen das Gweicht f r die Analysevariablen festlegen Abbildung 6 3 Dialogfeld Variablengewicht definieren fA MCA Variablengewicht definie ren Ix Yariablengewichtung fh Covet anerecnen rire Variablengewichtung Sie k nnen f r jede Variable eine Gewichtung festlegen Bei dem angegebenen Wert muss es sich um eine positive ganze Zahl h
319. ohnsitzes und das Geschlecht enth lt Die Analyse k nnte beispielsweise ergeben dass die Ausbildungsdauer und der Wohnsitz einen h heren Erkl rungswert haben als die brigen Variablen Au erdem k nnten Sie herausfinden dass der Erkl rungswert der Ausbildungsdauer in Jahren in der ersten Dimension am h chsten ist Statistiken und Diagramme H ufigkeiten Zentroide Iterationsprotokoll Objektwerte Kategorienquantifikationen Gewichtungen Komponentenladungen einfache und mehrfache Anpassung Diagramme der Objektwerte Diagramme der Kategorienkoordinaten Diagramme der Komponentenladungen Diagramme der Kategorienzentroide Transformationsdiagramme Daten Verwenden Sie zum Kodieren von kategorialen Variablen ganze Zahlen nominales oder ordinales Skalierungsniveau Um die Ausgabe zu minimieren verwenden Sie zum Kodieren jeder Variablen aufeinander folgende ganze Zahlen mit 1 beginnend Variablen die auf numerischem Niveau skaliert sind d rfen nicht in aufeinander folgende ganze Zahlen umkodiert werden Um die Ausgabe zu minimieren subtrahieren Sie f r jede auf numerischem Niveau skalierte Variable Copyright SPSS Inc 1989 2010 44 45 Nichtlineare kanonische Korrelationsanalyse OVERALS den kleinsten beobachteten Wert von jedem Wert und addieren Sie 1 Gebrochene Werte werden hinter der Dezimalstelle abgeschnitten Annahmen Variablen k nnen in ein oder mehr Sets klassifiziert werden Variablen in der Analyse werd
320. ollen Geben Sie die Nummer eines Zusatzobjekts ein oder geben Sie einen Bereich von F llen an und klicken Sie auf Hinzuf gen Zusatzobjekte k nnen nicht gewichtet werden Gewichtungen werden ignoriert Ausgangskonfiguration Wenn keine Variablen als nominal behandelt werden w hlen Sie die Konfiguration Numerisch Wenn mindestens eine Variable als nominal behandelt wird w hlen Sie die Konfiguration Zuf llig Wenn mindestens eine Variable ein ordinales oder Spline ordinales Messniveau besitzt kann der normale Modellanpassungsalgorithmus zu einer suboptimalen L sung f hren Die Auswahl von Mehrere systematische Starts mit allen m glichen zu testenden Vorzeichenmustern findet 22 Kapitel 2 stets die optimale L sung aber die notwendige Verarbeitunsgzeit steigt rapide an da die Anzahl der ordinalen und Spline ordinalen Variablen im Daten Set zunimmt Sie k nnen die Anzahl der Testmuster reduzieren indem Sie einen Prozensatz an Verlust der Varianzgrenze angeben Je h her die Grenze umso mehr Vorzeichenmuster werden ausgeschlossen Mit dieser Option ist eine optimale L sung nicht garantiert aber die Wahrscheinlichkeit eine suboptimale L sung zu erhalten wird reduziert Auch wenn zudem die optimale L sung nicht gefunden wird ist die Wahrscheinlichkeit dass die suboptimale L sung sich sehr von der optimalen L sung unterscheidet geringer Wenn mehrere systematische Starts angefordert werden werden die Vorzeichen der Regre
321. on Abhangige Variable E Standardized Residual gt ordinal 2 2 Unabh ngige Variable n package Spline ordinal 2 2 brand Spline ordinal 2 2 price Spline ordinal 2 2 seal Spline ordinal 2 2 money Spline ordinal 2 2 W hlen Sie die abh ngige Variable und die unabh ngige n Variable n Klicken Sie auf OK ndern Sie bei Bedarf das Skalierungsniveau f r die einzelnen Variablen Definieren der Skala in der kategorialen Regression Sie k nnen das Messniveau der optimalen Skalierung f r die abh ngigen und unabh ngigen Variablen festlegen In der Standardeinstellung werden sie als monotone Splines zweiten Grades ordinal mit zwei inneren Knoten skaliert Au erdem k nnen Sie die Gewichtung der Analysevariablen bestimmen 18 Kapitel 2 Abbildung 2 2 Dialogfeld Skala definieren fa Kategoriale Regression Skala defin Messniveau der optimalen Skalierung _ Spline ordinal Ordinal Spline nominal Nominal Numerisch rSpline Grad Innere Knoten ie ae me Messniveau der optimalen Skalierung Sie k nnen auch das Messniveau zur Quantifizierung jeder Variablen ausw hlen Spline ordinal Die Reihenfolge der Kategorien bei der beobachteten Variable wird bei der optimal skalierten Variable beibehalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaziert Die resultierende T
322. on H Kategoriale Regression Ausgabe X Neue Stichprobenziehung Keine Kreuzvalidierung Anzahl der Aufteilungen 19 632 Bootstrap 50 Analysevariablen Kategorienquantifikationen Deskriptive Statistik _ Wahlen Sie Korrelationen der Originalvariablen und Korrelationen der transformierten Variablen Deaktivieren Sie die Option ANOVA Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Regression auf Speichern 112 Kapitel 9 Abbildung 9 14 Speichern Vorhergesagte Werte in Arbeitsdatei speichern T Residuen in Arbeitsdatei speichern Diskretisierte Daten rNormalisierte Modelle und Koeffizienten F Diskretisierte Daten erstellen Neues Daten Set erstellen Neues Datenblatt erstellen Date Name DatenSet3 Datenblatt Name Neue Datendatei schreiben Neue Datendatei schreiben Transformierte Yariablen r Vorzeichen der Regressionskoeffizienten 4 Transformierte Variablen in Arbeitsdatei speichern Neues Daten Set e E Transformierte Variablen in neues Daten Set bzw neue Datei speichern Daten Set Name DatenSet4 Neues Datenblatt erstellen Neue Datendatei schreiben Jatenblatt Name Datenblatt Nam Neue Datendatei schreiben W hlen Sie die Option Residuen in Arbeitsdatei speichern aus gt W hlen Sie Im Gruppenfeld Transformierte Variablen die Option Transformierte Variablen in Arbeitsdatei speichern aus
323. on gegen ber dem durchschnittlichen Antwortmuster an Dieses durchschnittliche Antwortmuster entspricht der h ufigsten Kategorie f r jede Variable Objekte bei denen viele Merkmale den h ufigsten Kategorien entsprechen liegen in der N he des Ursprungs Objekte mit einzigartigen Merkmalen befinden sich hingegen weit vom Ursprung entfernt 242 Kapitel 13 Abbildung 13 6 Objektwertediagramm nach Objekt beschriftet 4 Le SCREW1 o NAIL6 Dimension 2 14 NAIL7 BOLT2 NAILB o O SCREWB 07 SCREBGREW2 15 10 05 00 05 10 15 Dimension 1 Bei der Untersuchung des Diagramms stellen wir fest dass die erste Dimension horizontale Achse eine Unterscheidung zwischen Schrauben und Bolzen weisen ein Gewinde auf einerseits und N geln und Rei n geln kein Gewinde andererseits bietet Dies ist im Diagramm ganz einfach zu erkennen da sich die Schrauben und Bolzen an einem Ende der horizontalen Achse befinden und die N gel und Rei zwecken am anderen In geringerer Sch rfe trennt die erste Dimension auch die Bolzen mit flacher Grundform von allen anderen mit spitzer Grundform Die zweite Dimension vertikale Achse scheint SCHRAUBE und NAGEL6 von allen anderen Objekten zu trennen Die Gemeinsamkeit zwischen SCHRAUBEI und NAGEL6 besteht in ihren Werten bei der Variablen l nge sie sind die l ngsten Objekte in der Datenmenge Au erdem liegt SCHRAUBEI wesentlich weiter vom Ursprung entfernt als die ander
324. on jeder Kategorie subtrahiert und zu dem Ergebnis wurde der Wert addiert Die transformierten Codes weisen mindestens den Wert auf und alle Differenzen sind mit denen der urspr nglichen Daten identisch Der maximale Kategoriewert ist nun 8 und die Null Quantifizierungen vor der ersten Nicht Null Quantifizierung werden gel scht Allerdings sind die Nicht Null Quantifizierungen f r die einzelnen Kategorien die sich aus Schema B ergeben mit den Quantifizierungen aus Schema A identisch 7 Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten Welche Prozedur ist f r Ihre Anwendung am besten geeignet Die in vier dieser Prozeduren Korrespondenzanalyse Mehrfachkorrespondenzanalyse kategoriale Hauptkomponentenanalyse und nichtlineare kanonische Korrelationsanalyse enthaltenen Verfahren fallen in den allgemeinen Bereich der multivariaten Datenanalyse die als Dimensionsreduzierung bekannt ist Dies bedeutet dass die Beziehungen zwischen den Variablen so oft wie m glich in wenigen Dimensionen beispielsweise zwei oder drei dargestellt werden Dadurch k nnen Sie Strukturen oder Muster in den Beziehungen beschreiben die in ihrer urspr nglichen Komplexit t schwer zu ergr nden w ren Bei Marktforschungsanwendungen k nnen diese Verfahren eine Art Wahrnehmungszuordnung sein Ein wichtiger Vorteil dieser Prozeduren besteht darin dass sie mit Daten mit verschiedenen Messniveaus der optimalen Skalierung
325. onfigurationen nach dem Zufallsprinzip ausgew hlt Die Konfiguration mit dem niedrigsten normalisierten Roh Stress wird als Ausgangskonfiguration verwendet Benutzerdefiniert W hlen Sie Variablen aus die die Koordinaten Ihrer eigenen Ausgangskonfiguration enthalten Die Anzahl der ausgew hlten Variablen muss der angegebenen H chstanzahl von Dimensionen entsprechen wobei die erste Variable den Koordinaten von Dimension 1 die zweite Variable den Koordinaten von Dimension 2 entspricht usw Die Anzahl der F lle in jeder Variablen muss der Anzahl der Objekte entsprechen Iterationskriterien Geben Sie Werte f r Iterationskriterien an Stress Konvergenz Der Algorithmus f hrt keine weiteren Iterationen durch wenn die Differenz von aufeinander folgenden normalisierten Roh Stress Werten unter dem hier angegebenen Wert liegt der zwischen 0 0 und 1 0 liegen muss 84 Kapitel 7 m Mindest Stress Der Algorithmus wird beendet wenn der normalisierte Roh Stress unter den hier angegebenen Wert f llt der zwischen 0 0 und 1 0 liegen muss m Maximale Anzahl der Iterationen Der Algorithmus f hrt die angegebene Anzahl von Iterationen durch falls nicht vorher eines der oben genannten Kriterien erf llt wird m Gelockerte Aktualisierungen Gelockerte Aktualisierungen beschleunigen den Algorithmus Diese Aktualisierungen k nnen mit keinem anderen Modell als dem Identit tsmodell und nicht zusammen mit Einschr nkungen verwendet werden Mu
326. orenanalyse beispielsweise erstellt zun chst eine erste Hauptkomponente die der ersten Dimension der Mehrfachkorrespondenzanalyse entspricht Die Komponentenwerte in der ersten Dimension sind gleich den Objektwerten und die quadrierten Komponentenladungen sind gleich den Diskriminationsma en Die zweite Dimension der Mehrfachkorrespondenzanalyse jedoch ist nicht gleich der zweiten Dimension der Faktorenanalyse Multidimensionale Skalierung Die multidimensionale Skalierung ist am besten geeignet wenn das Ziel der Analyse darin besteht die Struktur eines Sets von Distanzma en innerhalb einer einzelnen Gruppe von Objekten oder F llen zu ermitteln Dies wird durch das Zuweisen von Beobachtungen zu bestimmten Positionen in einem konzeptuellen Raum mit wenigen Dimensionen erzielt wobei die Abst nde zwischen den Punkten des Raumes mit den vorgegebenen Un hnlichkeiten bzw hnlichkeiten so gut wie m glich bereinstimmen Als Ergebnis werden die Objekte in diesem Raum mit wenigen Dimensionen mithilfe der Methode der kleinsten Quadrate dargestellt was h ufig zu einem besseren Verst ndnis der Daten beitr gt Beziehung zu anderen Prozeduren von Categories Wenn multivariate Daten vorliegen aus denen Sie Distanzen erstellen und anschlie end mit multidimensionaler Skalierung analysieren erhalten Sie ein hnliches Ergebnis wie bei der Analyse der Daten mithilfe der kategorialen Hauptkomponentenanalyse mit Objektprinzipal Normalisierung Diese
327. orialen Hauptkomponentenanalyse f r die Quantifizierung der beobachteten Daten verwendete Kriterium besteht darin dass die Objektwerte Komponentenwerte starke Korrelationen mit jeder der quantifizierten Variablen aufweisen sollten Eine L sung ist gut in dem Grad in dem dieses Kriterium erf llt wird Es werden zwei Beispiele der kategorialen Hauptkomponentenanalyse vorgestellt Beim ersten wird eine eher kleine Datenmenge verwendet anhand derer die Grundkonzepte und Interpretationen in Verbindung mit der Prozedur illustriert werden sollen Im zweiten Beispiel wird eine praktische Anwendung untersucht Beispiel Untersuchung der Interrelationen sozialer Systeme In diesem Beispiel wird die Guttmansche Guttman 1968 Adaptation einer Tabelle von Bell Bell 1961 untersucht Diese Daten werden auch von Lingoes Lingoes 1968 diskutiert Bell legte eine Tabelle zur Illustration m glicher sozialer Gruppen vor Guttman verwendete einen Teil dieser Tabelle bei der f nf Variablen die Aspekte beschreiben wie soziale Interaktion das Gef hl der Gruppenzugeh rigkeit die physische N he der Mitglieder und die Formalit t der Beziehung mit sieben theoretischen sozialen Gruppen gekreuzt wurden crowds Menschenmassen beispielsweise die Zuschauer eines Fu ballspiels audience Zuh rerschaften beispielsweise die Personen im Theater oder bei einer Vorlesung public ffentlichkeit beispielsweise Zeitungsleser oder Fernsehzusc
328. ories zun chst sehr verwirrend sein Bei der Angabe des Niveaus geben Sie nicht das Niveau an auf dem die Variablen gemessen werden sondern das Niveau auf dem sie skaliert werden Der Grund daf r ist dass die zu quantifizierenden Variablen m glicherweise nichtlineare Relationen aufweisen unabh ngig davon wie sie gemessen werden F r Categories gibt es drei grundlegende Messniveaus m Beim nominalen Niveau wird davon ausgegangen dass die Werte einer Variablen f r nicht geordnete Kategorien stehen Beispiele f r m glicherweise nominale Variablen sind Bundesland Postleitzahl Religionszugeh rigkeit und Multiple Choice Kategorien Beim ordinalen Niveau wird davon ausgegangen dass die Werte einer Variablen f r geordnete Kategorien stehen Beispiele sind Einstellungsskalen die f r den Grad der Zufriedenheit oder der Zuversicht stehen sowie Werte f r Pr ferenzen m Beim numerischen Niveau wird davon ausgegangen dass die Werte einer Variablen f r Kategorien mit einer sinnvollen Metrik stehen sodass man sinnvolle Aussagen ber die Abst nde zwischen den Kategorien machen kann Metrische Variablen sind beispielsweise Alter in Jahren oder Einkommen in Geldeinheiten Nehmen wir beispielsweise an die Variablen Region T tigkeit und Alter seien wie in der folgenden Tabelle kodiert Tabelle 1 1 Kodierungsschema f r Region T tigkeit und Alter Region T tigkeit Alter 1 Norden 1 Praktikant 20 zwanzig Jahre
329. orithms New York John Wiley and Sons Hastie T als auch R Tibshirani 1990 Generalized additive models London Chapman and Hall Hastie T R Tibshirani als auch A Buja 1994 Flexible discriminant analysis Journal of the American Statistical Association 89 Hayashi C 1952 On the prediction of phenomena from qualitative data and the quantification of qualitative data from the mathematico statistical point of view Annals of the Institute of Statitical Mathematics 2 Heiser W J 1981 Unfolding analysis of proximity data Leiden Department of Data Theory Universitat Leiden Heiser W J als auch F M T A Busing 2004 Multidimensional scaling and unfolding of symmetric and asymmetric proximity relations In Handbook of Quantitative Methodology for the Social Sciences D Kaplan Hg Thousand Oaks Kalifornien Sage Publications Inc 323 Bibliografie Heiser W J als auch J J Meulman 1994 Homogeneity analysis Exploring the distribution of variables and their nonlinear relationships In Correspondence Analysis in the Social Sciences Recent Developments and Applications M Greenacre als auch J Blasius Hgg New York Academic Press Heiser W J als auch J J Meulman 1995 Nonlinear methods for the analysis of homogeneity and heterogeneity In Recent Advances in Descriptive Multivariate Analysis W J Krzanowski Hg Oxford Oxford University Press Horst P 1961 Generalized c
330. p Itanium and Pentium are trademarks or registered trademarks of Intel Corporation or its subsidiaries in the United States and other countries Linux is a registered trademark of Linus Torvalds in the United States other countries or both Microsoft Windows Windows NT and the Windows logo are trademarks of Microsoft Corporation in the United States other countries or both UNIX is a registered trademark of The Open Group in the United States and other countries Java and all Java based trademarks and logos are trademarks of Sun Microsystems Inc in the United States other countries or both This product uses WinWrap Basic Copyright 1993 2007 Polar Engineering and Consulting http www winwrap com Other product and service names might be trademarks of IBM SPSS or other companies Adobe product screenshot s reprinted with permission from Adobe Systems Incorporated Microsoft product screenshot s reprinted with permission from Microsoft Corporation terae Bibliografie Barlow R E D J Bartholomew D J Bremner als auch H D Brunk 1972 Statistical inference under order restrictions New York John Wiley and Sons Bell E H 1961 Social foundations of human behavior Introduction to the study of sociology New York Harper amp Row Benz cri J P 1969 Statistical analysis as a tool to make patterns emerge from data In Methodologies of Pattern Recognition S Watanabe Hg New York Academic Pres
331. r gheit aus Bei einer dritten Dimension w rden nur weitere 8 6 der Tr gheit ber cksichtigt Sie entscheiden sich daher f r eine zweidimensionale Darstellung 230 Kapitel 12 Abbildung 12 7 Tr gheit pro Dimension Singul rwert f r Anteil der Tr gheit Konfidenz Singul rwer Auswertung Chi Standard Korrelation Dimension t f r Tr gheit Quadrat ig Bedingen Kumuliert abweichung 1 2 3 4 5 Gesamtau swertung a 110 Freiheitsgrade 3746 97 Beitr ge Correspondence Analysis Die bersicht der Zeilenpunkte zeigt die Beitr ge der Zeilenpunkte zur Tr gheit der Dimensionen sowie den Beitrag der Dimensionen zur Tr gheit der Zeilenpunkte Wenn alle Punkte gleichm ig zur Tr gheit beitr gen w re der Beitrag gleich 0 043 Die Attribute gesund und fettarm tragen beide einen betr chtlichen Anteil zur Tr gheit der ersten Dimension bei Die Attribute M nner und stark liefern die gr ten Beitr ge zur Tr gheit der zweiten Dimension Sowohl h sslich als auch frisch bringen nur sehr geringe Beitr ge zu den Dimensionen 231 Abbildung 12 8 Beitr ge der Attribute Wert in Dimension macht dick M nner S d Australien traditionell premium gesund Koffein neu attraktiv schwer popul r Heilmittel fettarm Kinder Arbeit s ss unpopul r h sslich frisch Yuppies n hrstoffreich Frauen gering Aktiver Gesamtwert bersicht ber Tr gheit Korrespo
332. r Unterbefehl INITIAL gibt an dass die Startwerte mithilfe der Spearman Distanzen festgelegt werden sollen m Mit den angegebenen Werten f r den Unterbefehl PENALTY wird im Wesentlichen die Penalisierung deaktiviert und somit das Kruskal Stress I minimiert Dies f hrt zu einer degenerierten L sung Mit dem Unterbefehl PLOT werden Diagramme des gemeinsamen Raums angefordert m F r alle anderen Parameter gelten die Standardwerte Me werte GLM Repeated Measures Abbildung 15 3 Ma e f r degenerierte L sung lterationen 154 Endg ltiger Funktionswert 0000990 Wertteile der Funktion Stressteil 0000990 Penalisierungsteil 1 0000000 Fehlende Anpassung Normalisierter Stress 0000000 Stress Inach Kruskal 0000990 Stress Il nach Kruskal 6129749 Stress nach Young 0001980 5 Stress Il nach Young 7703817 G te der Anpassung Erkl rte Streuung 0000000 Erkl rte Yarianz Ermittelte 6230788 Bevorzungsordnungen 7074830 Spearman Rho 7450748 Kendall Tau b 62186729 Variationskoeffizienten Variation der Ahnlichkeiten 5590170 Variation der transformierten hnlichkeiten 0000824 Variation der Distanzen 1808765 Indizes f r Quadratsumme von Degeneration DeSarbos Indizes f r 117 3115413 Yermischung Shepards Index f r 0000000 Nicht Degeneration Der Algorithmus findet eine L sung nach 154 Iterationen und konvergiert bei einem penalisierten Stress markierten endg ltigen Funktionswert von 0 0000990 Da die Penalisi
333. r Variation in den Einstufungen der Bevorzugung Auch Price und Good Housekeeping seal erkl ren einen Gro teil der Varianz wenn die Auswirkungen der anderen Variablen beseitigt werden Sie k nnen die Auswirkungen anderer Variablen nicht nur aus der Antwort und aus einer Einflussgr e entfernen sondern alternativ auch nur aus der Einflussgr e Die Korrelation zwischen der Antwort und den Residuen aus der Regression einer Einflussgr e auf die anderen Einflussgr en wird als Teilkorrelation bezeichnet Wird dieser Wert quadriert entsteht eine Messzahl f r den Anteil der Varianz der relativ zur Gesamtvarianz der Antwort erkl rt wird Wenn Sie die Auswirkungen von Brand name Good Housekeeping seal Money back guarantee und Price aus Package design entfernen erkl rt der verbleibende Teil von Package design 0 733 2 0 54 54 der Variation bei den Einstufungen der Bevorzugung Wichtigkeit Neben den Regressionskoeffizienten und den Korrelationen hilft das Ma f r die relative Wichtigkeit nach Pratt Pratt 1987 bei der Interpretation des Beitrags der Einflussgr en zur Regression Hohe einzelne Wichtigkeitswerte relativ zu anderen Wichtigkeitswerten bezeichnen Einflussgr en die f r die Regression von entscheidender Bedeutung sind Dar ber hinaus weist eine geringe Wichtigkeit f r eine Variable deren Koeffizient etwa gleich gro ist wie die wichtigen Einflussgr en auf die Pr senz von Suppressorvariablen hin Im
334. r geraden Linie einem Vektor durch den Koordinatenursprung plaziert Die resultierende Transformation ist besser angepa t aber weniger glatt als bei Spline nominal Numerisch Die Kategorien werden als geordnet mit gleichen Abst nden behandelt Intervallniveau Die Reihenfolge der Kategorien und die gleichen Abst nde zwischen den Kategorienummern in der beobachteten Variablenbleiben in der optimal skalierten Variablen erhalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaziert Wenn alle Variablen auf numerischem Niveau skaliert sind entspricht die Analyse der normalen Hauptkomponentenanalyse 19 Kategoriale Regression CATREG Kategoriale Regression Diskretisierung Im Dialogfeld Kategoriale Hauptkomponenten Diskretisierung k nnen Sie eine Methode zum Umkodieren der Variablen festlegen Sofern nicht anders angegeben werden Variablen mit Dezimalwerten in sieben Kategorien gruppiert die nahezu normalverteilt sind Wenn die Variable weniger als sieben unterschiedliche Werte aufweist entspricht die Anzahl der Kategorien der Anzahl der unterschiedlichen Werte Werte von String Variablen werden immer in positive ganze Zahlen umgewandelt indem in aufsteigender alphanumerischer Reihenfolge Kategorienummern zugewiesen werden Die Diskretisierung von String Variablen erfolgt anhand dieser Ganzzahlen Andere Variablen werden in der Standardeinstellung nicht modifiziert
335. r m glich wenn im Dialogfeld Modell eines der Modelle f r individuelle Differenzen angegeben ist 85 Multidimensionale Skalierung PROXSCAL Individuelle Raumgewichtungen Ein Streudiagramm der individuellen Raumgewichtungen wird erstellt Dies ist nur m glich wenn im Dialogfeld Modell eines der Modelle f r individuelle Differenzen angegeben ist F r das Modell Euklidisch gewichtet werden die Gewichtungen in Diagrammen mit einer Dimension pro Achse ausgegeben F r das Modell Euklidisch verallgemeinert wird ein Diagramm pro Dimension erstellt das Rotation und Gewichtung der jeweiligen Dimension anzeigt Das f r das Modell Reduzierter Rang erstellte Diagramm gleicht dem Diagramm f r das Modell Euklidisch verallgemeinert die Anzahl der Dimensionen f r die individuellen R ume ist jedoch reduziert Urspr ngliche ber transformierte hnlichkeiten Es werden Diagramme der urspr nglichen hnlichkeiten im Vergleich zu den transformierten hnlichkeiten erstellt Transformierte hnlichkeiten ber Distanzen Die transformierten hnlichkeiten werden ber die Distanzen abgebildet Transformierte unabh ngige Variablen Es werden Transformationsdiagramme f r die unabh ngigen Variablen erstellt Variablen und Dimensionskorrelationen Es wird ein Diagramm der Korrelationen zwischen den unabh ngigen Variablen und den Dimensionen des gemeinsamen Raums angezeigt Multidimensionale Skalierung
336. r rechts liegen Sie k nnen die Zeitpunkte in diesem Diagramm verbinden indem Sie die Objektwerte speichern und ein Streudiagramm mit den Werten Scores von Dimension 1 auf der x und den Scores von Dimension 2 auf der y Achse erstellen und anschlie end die Markierungen unter Verwendung der Patientennummern festlegen Ein Vergleich des nach Zeitpunkt beschrifteten Objektwertediagramms mit dem nach Diagnose beschrifteten Diagramm kann Aufschluss ber ungew hnliche Objekte gew hren So gibt es in dem nach Zeitpunkt beschrifteten Diagramm einen Patienten dessen Diagnose zum Zeitpunkt 4 links von allen anderen Punkten im Diagramm liegt Dies ist ungew hnlich da der allgemeine Trend der Punkte dahin geht dass die sp teren Zeitpunkte weiter rechts liegen Interessanterweise weist dieser Punkt der zeitlich deplaziert zu sein scheint auch eine ungew hnliche Diagnose auf der Patient ist ein Anorektiker dessen Werte im Bulimie Klumpen liegen Wenn wir die Tabelle der Objektwerte betrachten ergibt sich dass es sich hierbei um Patient 43 handelt bei dem Anorexia nervosa diagnostiziert wurde Die Objektwerte diese Patienten finden Sie in folgender Tabelle Tabelle 10 4 Objektwerte f r Patient 43 Zeit Dimension 1 Dimension 2 1 2 031 1 250 2 2 067 0 131 3 1 575 1 467 4 2 405 1 807 181 Kategoriale Hauptkomponentenanalyse Die Werte des Patienten zum Zeitpunkt 1 sind prototypisch f r Anorektiker mit einem hohen negativ
337. r vielleicht mit einem anderen Niveau f r die Analyse beispielsweise mehrfach nominal Abbildung 10 10 Kategoriepunkte im verbundenen Diagramm O Entfernung O Formalit t 15 4 keine H ufigkeit s Frequenz O Intensit t Zugeh rigkeit schwach schwach ichit f rmlich sehr schwa tel schwach hoch h ufig Dimension 2 O i 4a in L 4 Dimension 1 Das verbundene Diagramm der Kategoriepunkte hnelt dem Diagramm f r die Komponentenladungen zeigt jedoch au erdem wo sich die Endpunkte befinden die den niedrigsten Quantifizierungen entsprechen z B sehr schwach f r Intensit t der Interaktion und keine f r Zugeh rigkeit Die beiden Variablen die die Interaktion messen Intensit t und H ufigkeit Frequenz erscheinen sehr eng beieinander und erkl ren einen Gro teil der Varianz in Dimension 1 Formalit t erscheint ebenfalls nah bei Entfernung Wenn Sie sich auf die Kategoriepunkte konzentrieren k nnen Sie die Beziehungen noch deutlicher sehen Intensit t und H ufigkeit Frequenz liegen nicht nur eng beieinander sondern die Richtungen ihrer Skalen sind hnlich d h sehr schwache Intensit t liegt eng bei schwacher 157 Kategoriale Hauptkomponentenanalyse H ufigkeit und h ufige Interaktion liegt nahe bei hoher Intensit t der Interaktion Au erdem ist ersichtlich dass eine enge N he mit einem nicht f rmlichen Beziehungstyp Hand in Hand zu gehen schein
338. ransformation ist ein glatter st ckweiser monotoner Polynom mit dem gew hlten Grad Die St cke werden durch die vom Benutzer festgelegte Anzahl und die durch die Prozedur bestimmte Lage der inneren Knoten definiert Spline nominal Die einzige Information aus der beobachteten Variable die in der optimal skalierten Variable beibehalten wird ist die Gruppierung der Objekte in Kategorien Die Reihenfolge der Kategorien bei der beobachteten Variablenwird nicht beibehalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaziert Die resultierende Transformation ist ein glatter st ckweiser m glicherweise nichtmonotoner Polynom mit dem gew hlten Grad Die St cke werden durch die vom Benutzer festgelegte Anzahl und die durch die Prozedur bestimmte Lage der inneren Knoten definiert Ordinal Die Reihenfolge der Kategorien bei der beobachteten Variable wird bei der optimal skalierten Variable beibehalten Die Kategorienpunkte werden auf einer geraden Linie einem Vektor durch den Koordinatenursprung plaziert Die resultierende Transformation ist besser angepa t aber weniger glatt als bei Spline ordinal Nominal Die einzige Information aus der beobachteten Variable die in der optimal skalierten Variable beibehalten wird ist die Gruppierung der Objekte in Kategorien Die Reihenfolge der Kategorien bei der beobachteten Variablenwird nicht beibehalten Die Kategorienpunkte werden auf eine
339. rden Falls das nominale Transformationsdiagramm einen linearen Trend zeigt ist ggf eine numerische Transformation angebrachter Die nachstehende Abbildung zeigt das Transformationsdiagramm f r die Variable Price die als numerisch behandelt wurde Beachten Sie dass die Reihenfolge der Kategorien entlang der geraden Linie mit der Reihenfolge der urspr nglichen Kategorien bereinstimmt Dar ber hinaus ist die Differenz zwischen den Quantifikationen f r 81 19 und 1 39 1 173 und 0 mit der Differenz zwischen den Quantifikationen f r 1 39 und 1 59 0 und 1 173 identisch Die Tatsache dass die Kategorien 1 und 3 dieselbe Distanz zur Kategorie 2 besitzen bleibt in den Quantifikationen erhalten Abbildung 9 21 Transformationsdiagramm f r Preise numerisch 004 Quantifizierungen 1 19 1 39 1 59 Kategorien Die nominale Transformation von Package design f hrt zum nachstehenden Transformationsdiagramm Beachten Sie die deutliche nichtlineare Form in der die gr te Quantifikation der zweiten Kategorie liegt Im Hinblick auf die Regression senkt die zweite Kategorie die vorhergesagte Einstufung der Bevorzugung die erste und dritte Kategorie zeigen dagegen den umgekehrten Effekt 119 Kategoriale Regression Abbildung 9 22 Transformationsdiagramm f r Package design nominal o in 0 0 Quantifizierungen A Bt c Kategorien Analyse der Residuen Mit den transformierten Daten und Residuen
340. rer jeweiligen Diagnosekategorie beschriftet sind Abbildung 10 37 Objektwertediagramm nach Diagnose beschriftet Dimension 2 2 1 0 1 N Dimension 1 Dieses Diagramm erleichtert nicht die Interpretation der ersten Dimension weil darin die Patienten nicht nach Diagnose getrennt werden Es gibt jedoch Informationen ber die zweite Dimension Patienten mit Anorexie 1 und Patienten die an einer atypischen E st rung leiden 4 bilden eine Gruppe die sich oberhalb der Personen befindet die eine Art von Bulimie aufweisen 2 und 3 Die zweite Dimension trennt also bulimische Patienten von den anderen wie auch im vorherigen Abschnitt deutlich wurde die Variablen im Bulimie B ndel weisen gro e positive Komponentenladungen in der zweiten Dimension auf Dies ergibt einen Sinn wenn man bedenkt dass die Komponentenladungen der Symptome die traditionell mit Bulimie assoziiert werden gro e Werte in der zweiten Dimension aufweisen 180 Kapitel 10 Die folgende Abbildung zeigt ein Diagramm der Objektwerte bei denen die Subjekte mit dem jeweiligen Diagnosezeitpunkt beschriftet sind Abbildung 10 38 Objektwerte nach Time of interview Zeitpunkt der Befragung beschriftet Dimension 2 rs Dimension 1 Wenn die Objektwerte nach Zeitpunkt beschriftet werden zeigt sich dass die erste Dimension eine Relation zur Zeit aufweist da die Diagnosezeitpunkte f r 1 gr tenteils links und die anderen eher weite
341. respondenzanalyse Modell X Dimensionen in der L sung Fr Chi Quadrat Euklidisch rStandardisierungsmethode Zeilen und Spattenmittel werden entfernt Zeilenmittel sA Spaltenmittel n entfernt Zeilensummen werden angeglichen und Mittelwerte entfernt Os paltensummen werden angeglichen und Mittelwerte entfernt pNormalisierungsmethode Symmetrisch Zeilenprinzipal Anpassen 0 Prinzipal Spaltenprinzipal E con in W hlen Sie Prinzipal als Normalisierungsmethode Klicken Sie auf Weiter Klicken Sie im Dialogfeld Korrespondenzanalyse auf Diagramme 229 Korrespondenzanalyse Abbildung 12 6 Dialogfeld Diagramme F Korrespondenzanalyse Diagra r Streudiagramme Bipot Zeilenpunkte Fi Spaltenpunkte Breite f r Beschriftungen rLiniendiagramme Transformierte Zeilenkategorien E Transformierte Spattenkategorien nger r Diagrammdimensionen Alle Dimensionen in der L sung anzeigen Anzahl der Dimensionen beschr nken ie Ausrcnen L rie W hlen Sie in der Gruppe Streudiagramme die Optionen Zeilenpunkte und Spaltenpunkte Klicken Sie auf Weiter Klicken Sie im Dialogfeld Korrespondenzanalyse auf OK Dimensionalit t Die Tr gheit pro Dimension zeigt die Zerlegung der Gesamttr gheit auf die einzelnen Dimensionen Zwei Dimensionen machen 83 der Gesamtt
342. richt der Gesamtzahl aktiver Zeilenkategorien minus 1 Zum Definieren anderer Gleichheitsbeschr nkungen f r Kategoriegruppen k nnen Sie die Syntax verwenden Beispielsweise k nnen Sie mithilfe der Syntax festlegen dass die Kategorien 1 und 2 sowie die Kategorien 3 und 4 gleich sein m ssen m Erg nzende Kategorie Erg nzende Kategorien haben keine Auswirkungen auf die Analyse werden jedoch in dem durch die aktiven Kategorien definierten Raum dargestellt Erg nzende Kategorien spielen keine Rolle bei der Definition von Dimensionen Die maximale Anzahl der erg nzenden Zeilenkategorien entspricht der Gesamtanzahl der Zeilenkategorien minus 2 Definieren des Spaltenbereichs in der Korrespondenzanalyse Sie m ssen einen Bereich f r die Spaltenvariable angeben Die angegebenen Minimal und Maximalwerte m ssen ganzzahlig sein Gebrochene Datenwerte werden in der Analyse abgeschnitten Ein Kategoriewert der au erhalb des angegebenen Bereiches liegt wird in der Analyse ignoriert 54 Kapitel 5 Abbildung 5 3 Dialogfeld Spaltenbereich definieren E Korrespondenzanalyse Spaltenbereich definieren rKategorienbereich f r Spaltenvariable smoke Minimalwert lature Maximalwert rNebenbedingungen f r Kategorien 2 3 Keine 4 Kategorien m ssen gleich sein Erg nzende Kategorie Ce ern im _ Alle Kategorien sind zun chst aktiv und nicht durch Nebenbedingungen eingesch
343. rizen hnlichkeiten stammen aus Spalten eine Quelle pro Spalte hnlichkeiten sind in einer Spalte gestapelt Gti an e _ W hlen Sie in der Gruppe Anzahl der Quellen die Option Mehrere Matrixquellen Klicken Sie auf Definieren 255 Abbildung 14 2 Dialogfeld Multidimensionale Skalierung Gewichtungen Quellen gt W hlen Sie Tante bis Onkel als Ahnlichkeitsvariablen aus W hlen Sie sourceid als Variable f r die Bezeichnung der Quelle aus Klicken Sie auf Modell Abbildung 14 3 Dialogfeld Modell Skalierungsmodell Identit t Euklidisch gewichtet Euklidisch verallgemeinert Reduzierter Rang Rang Form Untere Dreiecksmatrix Obere Dreiecksmatrix Gesamte Matrix hnlichkeiten Un hnlichkeiten hnlichkeiten hnlichkeitstransformationen Yerh ltnisskala intervall Ordinal ja Gebundene Beobachtungen l sen Spline Grad Knoten innen Transformationen zuweisen Getrennt in jeder Quelle Alle Quellen gleichzeitig r Dimensionen Minimum Maximum gt Geben Sie 10 als maximal zul ssige Anzahl der Dimensionen ein Klicken Sie auf Weiter Multidimensionale Skalierung 256 Kapitel 14 Klicken Sie im Dialogfeld Multidimensionale Skalierung auf Einschr nkungen Abbildung 14 4 Dialogfeld Einschr nkungen E Multidimensionale Skalieru
344. rmalisierungsoption nicht geeignet und stehen daher auch nicht zur Verf gung wenn Sie die Prinzipal Normalisierungsmethode ausw hlen 225 Beispiel Wahrnehmung von Kaffeemarken Korrespondenzanalyse Das vorangegangene Beispiel umfasste eine kleine Tabelle mit hypothetischen Daten Im wirklichen Leben fallen h ufig deutlich gr ere Tabellen an In diesem Beispiel verwenden Sie Daten zum wahrgenommenen Image von sechs Eiskaffeemarken Kennedy Riquier als auch Sharp 1996 Dieses Daten Set finden Sie in coffee sav F r weitere Informationen siehe Thema Beispieldateien in Anhang A in IBM SPSS Categories 19 Bei den 23 Attributen des Eiskaffee Image sollten die Teilnehmer jeweils alle Marken ausw hlen die durch dieses Attribut beschrieben werden Die sechs Marken werden als AA BB CC DD EE und FF bezeichnet um Vertraulichkeit zu gew hrleisten Tabelle 12 1 Eiskaffeeattribute Image Attribut Beschriftung Image Attribut Beschriftung Gutes Heilmittel gegen Heilmittel Dick machende Marke macht dick Kater Fettarme kalorienarme fettarm Ansprechend f r M nner M nner Marke Marke f r Kinder Kinder S daustralische Marke S d Australien Marke f r die Arbeit Traditionelle alteingesessene traditionell Arbeiterklasse Marke Reichhaltige s e Marke S SS Marke mit Premium Qualit t premium Unpopul re Marke unpopul r Gesunde Marke gesund Marke f r dicke h liche h ssli
345. rn beschriftet werden Wenn Variable ausgew hlt ist wird pro Variable ein Diagramm erstellt 41 Kategoriale Hauptkomponentenanalyse CATPCA Kategoriale Hauptkomponenten Kategoriendiagramme Im Dialogfeld Kategoriale Hauptkomponenten Kategoriendiagramme k nnen Sie festlegen welche Diagramme und f r welche Variablen die Diagramme erstellt werden sollen Abbildung 3 10 Kategoriendiagramme Ei Kategoriale Hauptkomponenten Kategoriendiagramme Kategoriendiagramme a Verbundene Kategoriendiagramme OO r Transformationsdiagramme weight gt mens 1 fast Dimensionen f r mehrfach nominal Residuen Diagramme einschlie en r Zertroide projizieren von gt E Auf Bg Kategoriendiagramme F r jede ausgew hlte Variable wird ein Diagramm mit Zentroid und Vektorkoordinaten erstellt Bei Variablen mit mehrfach nominalem Skalierungsniveau befinden sich die Kategorien in den Zentroiden der Objekte in der jeweiligen Kategorie Bei allen anderen Skalierungsniveaus befinden sich die Kategorien auf einem Vektor der durch den Koordinatenursprung verl uft Verbundene Kategoriendiagramme Hierbei handelt es sich um ein einzelnes Diagramm mit Zentroid und Vektorkoordinaten jeder ausgew hlten Variablen Transformationsdiagramme Hierbei wird ein Diagramm der optimalen Kategorienquantifikationen gegen die Kategorienummern erstellt Bei Variablen mit mehrfach nominalem
346. rrespondenzanalyse auf Variable 240 Kapitel 13 Abbildung 13 4 Dialogfeld Variablendiagramme FA aca Variablendiagramme Kategoriendiagramme verbundene Kategoriendiagramme en 4 r Transformationsdiagramme e mDiskriminationsma e I Diagramm anzeigen Alle Variablen verwenden Ausgew hlte Variablen verwenden Lweter_ anerecnen _tite W hlen Sie aus da ein verbundenes Kategoriendiagramm fiir gewinde bis l nge erstellt werden soll Klicken Sie auf Weiter Klicken Sie im Dialogfeld Mehrfachkorrespondenzanalyse auf OK Modell bersicht Mit der Homogenit tsanalyse kann eine L sung f r mehrere Dimensionen berechnet werden Die maximale Anzahl an Dimensionen ist entweder die Anzahl der Kategorien abz glich der Anzahl der Variablen ohne fehlende Daten oder die Anzahl der Beobachtungen minus 1 je nachdem welche Zahl kleiner ist Die maximale Anzahl an Dimensionen sollte jedoch nur selten verwendet werden Eine kleinere Anzahl an Dimensionen l t sich leichter interpretieren Au erdem wird nach einer gewissen Anzahl an Dimensionen der Grad an Zusammenhang der zus tzlich erkl rt wird vernachl ssigbar Eine ein zwei oder dreidimensionale L sung bei der Homogenit tsanalyse ist sehr h ufig 241 Mehrfachkorrespondenzanalyse Abbildung 13 5 Modellzusammenfassung Varianz ber cksichtigt Cronbachs Gesamt Dimension Alpha
347. s 125 Kategoriale Regression Geben Sie 10 als L nge f r das Intervall ein Klicken Sie auf ndern W hlen Sie temp aus Geben Sie 1 8 als L nge f r das Intervall ein Klicken Sie auf ndern Klicken Sie auf Weiter vy vy vy Vy Vy vy y Klicken Sie im Dialogfeld Kategoriale Regression auf Diagramme Abbildung 9 29 Dialogfeld Diagramme i Kategoriale Regression Diagramme Transformationsdiagramme Residuen Diagramme W hlen Sie Transformationsdiagramme f r Inversion base height bis Day of the year aus Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Regression auf OK 126 Kapitel 9 Abbildung 9 30 Modellzusammenfassung Offensichtlich er Korrigiertes Yorhersagefe Multiples R R Quadrat R Quadrat hler Abh ngige Yariable Daily ozone level Einflu variablen Inversion base height Pressure gradient mm Hg Visibility miles Temperature degrees F Day of the year Werden alle Einflussgr en als nominal behandelt ergibt sich ein Wert von 0 880 f r R2 Ein so gro er Wert f r die ber cksichtigte Varianz ist nicht weiter berraschend weil bei der nominalen Behandlung keine Einschr nkungen fiir die Quantifikationen auftreten Die Interpretation der Ergebnisse kann sich allerdings recht schwierig gestalten Abbildung 9 31 Regressionskoeffizienten alle Einflussgr en nominal Standardisierte Koeffizienten Bootstrap 1000 Schatzung d
348. s Benz cri J P 1992 Correspondence analysis handbook New York Marcel Dekker Bishop Y M S E Feinberg als auch P W Holland 1975 Discrete multivariate analysis Theory and practice Cambridge Massachusetts MIT Press Blake C L als auch C J Merz 1998 UCI Repository of machine learning databases Available at http www ics uci edu mlearn MLRepository html Breiman L als auch J H Friedman 1985 Estimating optimal transformations for multiple regression and correlation Journal of the American Statistical Association 80 Buja A 1990 Remarks on functional canonical variates alternating least squares methods and ACE Annals of Statistics 18 Busing F M T A P J F Groenen als auch W J Heiser 2005 Avoiding degeneracy in multidimensional unfolding by penalizing on the coefficient of variation Psychometrika 70 Carroll J D 1968 Generalization of canonical correlation analysis to three or more sets of variables In Proceedings of the 76th Annual Convention of the American Psychological Association 3 Washington D C American Psychological Association Collett D 2003 Modelling survival data in medical research 2 Hg Boca Raton Chapman amp Hall CRC Commandeur J J F als auch W J Heiser 1993 Mathematical derivations in the proximity scaling PROXSCAL of symmetric data matrices Leiden Department of Data Theory Universitat Leiden De Haas M J A Algera H
349. s of ordinal data in psychology Voorschoten VAM Shepard R N 1966 Metric structures in ordinal data Journal of Mathematical Psychology 3 Wolter K M 1985 Introduction to variance estimation Berlin Springer Verlag Young F W 1981 Quantitative analysis of qualitative data Psychometrika 46 Kapitel Kategoriale Regression CATREG Durch die Kategoriale Regression werden kategoriale Daten quantifiziert indem den Kategorien numerische Werte zugewiesen werden Dadurch ergibt sich f r die transformierten Variablen eine optimale lineare Regressionsgleichung Die kategoriale Regression wird auch mit dem Akronym CATREG Categorical Regression bezeichnet Das Standardverfahren der linearen Regressionsanalyse beinhaltet die Minimierung der Summe von quadrierten Differenzen zwischen einer Antwortvariablen abh ngig und einer gewichteten Kombination von Einflu variablen unabh ngig Variablen sind in der Regel quantitativ wobei nominale kategoriale Daten in Bin r oder Kontrastvariablen umkodiert werden Infolgedessen dienen kategoriale Variablen einer Aufteilung in verschiedene Gruppen von F llen sodass jeweils separate Parameters tze f r jede Gruppe gesch tzt werden Die gesch tzten Koeffizienten geben die Auswirkung einer nderung in den Einflu variablen auf die Antwortvariable wieder Die Antwort kann f r jede beliebige Kombination von Einflu werten vorhergesagt werden Eine andere Methode besteht darin dass d
350. s zur angegebenen Zahl eine Permutationstabelle erzeugt Konfidenzstatistiken f r Zeilenpunkte Bezieht die Standardabweichung und Korrelationen f r alle nicht erg nzenden Zeilenpunkte mit ein Konfidenzstatistiken f r Spaltenpunkte Bezieht die Standardabweichung und Korrelationen f r alle nicht erg nzenden Spaltenpunkte mit ein Korrespondenzanalyse Diagramme Im Dialogfeld Diagramme k nnen Sie festlegen welche Diagramme erzeugt werden sollen 58 Kapitel 5 Abbildung 5 6 Dialogfeld Diagramme Zii Korrespondenzanalyse Diagra rStreudiagramme M Bipiot Zeilenpunkte Spaltenpunkte Breite f r Beschriftungen rLiniendiagramme E Transformierte Zeilenkategorien Transformierte Spaltenkategorien rDiagrammdimensionen Alle Dimensionen in der L sung anzeigen Anzahl der Dimensionen beschranken Cee meen e Streudiagramme Erzeugt eine Matrix mit allen paarweisen Diagrammen der Dimensionen Folgende Streudiagramme sind verf gbar m Biplot Erzeugt eine Matrix mit verbundenen Diagrammen der Zeilen und Spaltenpunkte Bei Wahl der Normalisierungsmethode Prinzipal ist die Option Biplot nicht verf gbar Zeilenpunkte Erzeugt eine Matrix mit Diagrammen der Zeilenpunkte Spaltenpunkte Erzeugt eine Matrix mit Diagrammen der Spaltenpunkte Optional k nnen Sie angeben wie viele Zeichen in Wertelabels zur Beschriftung der Punkte
351. samer RaM ses ooh ceva sean deeidac an a naar 292 Individueller RAUM esaou aT aei ee eee eee e tenet eens 293 Beispiel Untersuchen der Angemessenheit von Verhaltensweisen in bestimmten Situationen 295 Durchf hren der Analyse 00 000 c ccc ttt ee 295 Me werte GLM Repeated Measures 00 0 00 ccc cee ee eee eens 300 Gemeinsamer Raum 0 0c ee teen eee eens 301 hnlichkeitstransformationen ccc cece cece eee eeueeeeeevnunnees 302 ndern der Ahnlichkeitstransformation Ordinal cc cc 302 Me werte GLM Repeated Measures 0 00 00 ccc cee eee eee eens 304 Gemeinsamer Raum nsise cenador daaa ee eee n tenet eas 305 hnlichkeitstransformationen 0 0 c cece cece cece even eeeeevnnnees 306 Empfohlene Literatur 0 0 0 0 c cette teens 306 Anh nge A Beispieldateien B Notices Bibliografie Index xi 307 319 321 327 Teil I Benutzerhandbuch Kapitel L Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten Bei den Prozeduren in Categories wird die optimale Skalierung f r die Analyse von Daten verwendet die mit statistischen Standardprozeduren nur schwer oder gar nicht analysiert werden k nnen In diesem Kapitel werden die einzelnen Prozeduren die Situationen in denen die einzelnen Prozeduren am besten geeignet sind die Beziehungen zwischen den Prozeduren und die Beziehungen der Prozeduren zu ihrem jewe
352. sav definiert catalog sav Diese Datendatei enth lt hypothetische monatliche Verkaufszahlen f r drei Produkte die von einem Versandhaus verkauft werden Daten f r f nf m gliche Einflussvariablen wurden ebenfalls aufgenommen catalog_seasfac sav Diese Datendatei ist mit catalog sav identisch au er dass ein Set von saisonalen Faktoren die mithilfe der Prozedur Saisonale Zerlegung berechnet wurden sowie die zugeh rigen Datumsvariablen hinzugef gt wurden cellular sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Mobiltelefonunternehmens geht die Kundenabwanderung zu verringern Scores f r die Abwanderungsneigung von 0 bis 100 werden auf die Kunden angewendet Kunden mit einem Score von 50 oder h her streben vermutlich einen Anbieterwechsel an 310 Anhang A ceramics sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Herstellers geht der ermitteln m chte ob ein neue hochwertige Keramiklegierung eine gr ere Hitzebest ndigkeit aufweist als eine Standardlegierung Jeder Fall entspricht einem Test einer der Legierungen die Temperatur bei der das Keramikw lzlager versagte wurde erfasst cereal sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um eine Umfrage geht bei der 880 Personen nach ihren Fr hst ckgewohnheiten befragt wurden Au erdem wurden Alter Geschlecht Familienstand und Vorli
353. setzt bis ein Stopp Kriterium erreicht wird Warum sollte optimale Skalierung verwendet werden Kategoriale Daten finden sich oft bei der Marktforschung der Auswertung von Umfragen und in der Sozial und Verhaltensforschung Zahlreiche Forscher haben fast ausschlie lich mit kategorialen Daten zu tun Copyright SPSS Inc 1989 2010 1 2 Kapitel 1 Es gibt zwar von den meisten Standardmodellen Anpassungen f r die Analyse kategorialer Daten doch diese funktionieren h ufig nicht gut f r Daten Sets mit folgenden Eigenschaften m Zu wenige Beobachtungen m Zu viele Variablen m Zu viele Werte pro Variable Bei der Quantifizierung von Kategorien k nnen Verfahren zur optimalen Skalierung die Probleme in diesen F llen vermeiden Au erdem sind sie selbst dann n tzlich wenn spezialisierte Verfahren angebracht sind Anstatt auf der Interpretation von Parametersch tzern beruht die Interpretation der Ausgabe bei der optimalen Skalierung h ufig auf grafischen Darstellungen Verfahren zur optimalen Skalierung bieten hervorragende explorative Analysen die eine gute Erg nzung zu anderen IBM SPSS Statistics Modellen darstellen Durch Einengung des Fokus der Untersuchung kann die Visualisierung der Daten durch optimale Skalierung die Grundlage einer Analyse bilden die sich auf die Interpretation von Modellparametern konzentriert Messniveau der optimalen Skalierung Dieses Konzept kann bei der Verwendung der Prozeduren von Categ
354. sformationsdiagramm f r die Variable Neighborhood preference Alter nominal 1 0 0 0 1 0 1 5 Kategorienquantifikationen von Neighborhood preference Town Village Country Neighborhood preference 220 Kapitel 11 Beim Transformationsdiagramm f r Newspaper read most often hat sich eine nderung ergeben Bislang bestand ein ansteigender Trend in den Quantifikationen der unter Umst nden eine ordinale Behandlung dieser Variablen nahelegt Durch die nominale Behandlung von Age in years wurde dieser Trend jedoch aus den Quantifikationen f r news entfernt Abbildung 11 30 Transformationsdiagramm f r Newspaper read most often Alter nominal i 1 0 a n 3 v z 5 5 05 gt g cer vo cy ou zo 00 Se es 0 co 5 i 5 gt 25 E T D 2 1 0 so x None Telegraaf Volkskrant NRC Other Newspaper read most often Dies ist das Diagramm der Zentroide f r Age in years Beachten Sie dass die Kategorien entlang der Linie die die projizierten Zentroide verbindet nicht in chronologischer Reihenfolge vorliegen Die Gruppe 20 25 befindet sich nicht am Ende sondern in der Mitte Die Streuung der Kategorien ist im Vergleich zur bisherigen ordinalen Behandlung deutlich besser Abbildung 11 31 Zentroide und projizierte Zentroide f r Age in years nominal 104 ___ _ Zentroide 66 70 Projektiert fae Tats chli on bs ats chlich an 5 61
355. sgrade und eine Tabelle mit Korrelationen nullter Ordnung Teilkorrellationen und partiellen Korrelationen Pratts Ma f r die relative Bedeutung der transformierten Einflu variablen und der Toleranz vor und nach der Transformation Iterationsprotokoll F r jede Iteration einschlie lich der Anfangswerte des Algorithmus werden das multiple R und der Regressionsfehler angezeigt Die Erh hung des multiplen R wird beginnend mit der ersten Iteration aufgef hrt Korrelationen der Originalvariablen Eine Matrix mit den Korrelationen zwischen den nicht transformierten Variablen wird angezeigt Korrelationen der transformierten Variablen Eine Matrix mit den Korrelationen zwischen den transformierten Variablen wird angezeigt Geregelte Modelle und Koeffizienten Zeigt Penalisierungswerte R Quadrat und Regressionskoeffizienten f r jedes geregelte Modell an Wenn eine Resampling Methode oder zus tzliche Objekte Testf lle angegeben sind wird auch der Vorhersagefehler bzw der mittlere quadratische Testfehler angezeigt Resampling Mit Resampling Methoden erhalten Sie eine Sch tzung des Vorhersagefehlers des Modells Kreuzvalidierung Bei der Kreuzvalidierung wird die Stichprobe in mehrere Teilstichproben oder Aufteilungen gegliedert Anschlie end werden Modelle kategorialer Regression erzeugt dabei werden nacheinander die Daten der einzelnen Stichproben ausgeschlossen Das erste Modell beruht auf allen F llen mit Ausnahme der F lle in
356. sich die Analyse auf die Beziehung zwischen Daily ozone level und Day of the year konzentrieren betrachten Sie zun chst ein Streudiagramm W hlen Sie die folgenden Befehle aus den Men s aus Grafiken gt Diagrammerstellung 138 Kapitel 9 Abbildung 9 47 Dialogfeld Diagrammerstellung Variablen Diagrammvorschay verwendet Beispieldaten CA o Daily ozone level ozon E Inversion base height i 8 Pressure gradient mm 8 Visibility miles vis 8E Temperature degrees Day of the year doy Daily ozone level Keine Kategorien metische Vanabie Wahlen Sie die GalerieStreu Punktdiagramm aus und w hlen Sie die Option Einfaches Streudiagramm gt W hlen Sie Daily ozone level als y Achsen Variable aus und Day of the year als x Achsen Variable gt Klicken Sie auf OK 139 Kategoriale Regression Abbildung 9 48 Streudiagramm von Daily ozone level und Day of the year 40 00 30 00 20 00 Daily ozone level 10 00 0 00 100 00 200 00 300 00 400 00 Day ofthe year Diese Abbildung zeigt das Verh ltnis zwischen Daily ozone level und Day of the year Wenn Day ofthe year auf etwa 200 ansteigt steigt auch Daily ozone level Bei Werten gr er 200 f r Day of the year sinkt Daily ozone level jedoch ab Diese invertierte U Form weist auf eine quadratische Beziehung zwischen den beiden Variablen hin Eine lineare Beziehung kann diese Beziehu
357. sinken weiter bis zur Kategorie 6 in der Pressure gradient den gr ten absenkenden Effekt auf den vorhergesagten Ozonwert hat Die Linie f llt auch nach dieser Kategorie noch weiter ab ein ordinales Messniveau f r die Skalierung von Pressure gradient d rfte die Anpassungsg te nicht merklich verringern vereinfacht jedoch die Interpretation der Auswirkungen Das Ma 0 4 f r die Wichtigkeit und der Regressionskoeffizient f r Pressure gradient weisen allerdings darauf hin dass diese Variable bei der Regression nicht sonderlich n tzlich ist 129 Kategoriale Regression Abbildung 9 34 Transformationsdiagramm von Visibility nominal Transformation Visibility miles c w c 2 B E a S wr in Go a Se a B aaa N 2 28 8 8 oO Kategorien Das Transformationsdiagramm von Visibility zeigt wie das Transformationsdiagramm f r Inversion base height kein erkennbares Muster Wenn Sie ordinale oder lineare Einschr nkungen f r die Quantifikationen dieser Variablen festlegen geht die Anpassungsg te unter Umst nden deutlich zur ck 130 Kapitel 9 Abbildung 9 35 Transformationsdiagramm von Temperature nominal Transformation Temperature degrees F Quantifikationen w S G o SS ob 5 O w NH O gt n AN DB B A SG o oO oO Q o Q oO oO 2920906 29090 PF FP FP wo gt gt gt on on a a N km co oo y kO nO N o J O Q Q Q Q o Q Q Q Q Q Q
358. sion 2 Eine visuelle Best tigung f r die Degeneration der L sung kann dem verbundenen Diagramm des gemeinsamen Raums von Zeilen und Spaltenobjekten entnommen werden Die Zeilenobjekte Personen befinden sich im Umfang eines Kreises mit den Spaltenobjekten Fr hst cksartikeln als Mittelpunkt deren Koordinaten in einem einzigen Punkt zusammenfallen 39 19 29 i R 4 o English muffin and margarine o 615 Buttered toast Jelly donut 25 14 99 poani ne ng o lige ce 31 13 098 18269 10 16 re 005 oO Dimension 1 277 Multidimensionale Entfaltung Durchf hren einer nicht degenerierten Analyse Abbildung 15 5 Dialogfeld Optionen FFA Multidimensionale Entfaltung Optionen rAusgangskonfiguration ___ r lterationskriterien Klassisch Stress Konvergenz 000001 Berechnung nach X Mindest Stress 0001 et Maximalzahl der tterationen 5000 Korrespondenz Zentroide rPenalisierungsterm st rke Zufallsstarts tart Bereich Anpassen rAngepasste Konfiguration gt Um eine nicht degenerierte L sung zu erstellen klicken Sie auf die Schaltfl che Zuletzt verwendete Dialogfelder und w hlen Sie Multidimensionale Entfaltung aus gt Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf Optionen gt Geben Sie im Gruppenfeld Penalisierungsterm 0 5 f r St rke und 1 0 f r Bereich ein
359. sionen in der L sung rDistanzma Chi Quadrat Euklidisch Standardisierungsmethode Zeilen und Spaltenmittel werden entfernt rNormalisierungsmethode Symmetrisch Zeilenprinzipal Anpassen Prinzipal Spaltenprinzipal Ci econo Dimensionen in der L sung Legen Sie die Anzahl der Dimensionen fest Im allgemeinen sollten Sie nur so viele Dimensionen ausw hlen wie zum Erkl ren des gr ten Teils der Variation notwendig ist Die maximal zul ssige Dimensionszahl h ngt von der Anzahl der in der Analyse und in den Gleichheitsbeschr nkungen verwendeten aktiven Kategorien ab Die maximale Anzahl an Dimensionen ist jeweils der kleinere von folgenden Werten m Die Anzahl der aktiven Zeilenkategorien minus der Anzahl der Zeilenkategorien die gleich sein m ssen plus der Anzahl der eingeschr nkten Zeilenkategoriengruppen m Die Anzahl der aktiven Spaltenkategorien minus der Anzahl der Spaltenkategorien die gleich sein m ssen plus der Anzahl der eingeschr nkten Spaltenkategoriengruppen Distanzma Sie k nnen das Distanzma f r Zeilen und Spalten der Korrespondenztabelle ausw hlen W hlen Sie eine der folgenden Optionen m Chi Quadrat Verwendet eine gewichtete Profildistanz wobei die Gewichtung der Masse der Zeilen oder Spalten entspricht Dieses Ma ist f r die Standard Korrespondenzanalyse erforderlich m Euklidisch Verwendet die Quadratwurzel der Summe
360. sische Standardtherapie die zweite erhielt eine zus tzliche Emotionaltherapie Drei Monate nach den Behandlungen wurden die F higkeiten der einzelnen Patienten bliche Alltagsaktivit ten auszuf hren als ordinale Variablen bewertet m advert sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Einzelh ndlers geht die Beziehungen zwischen den in Werbung investierten Betr gen und den daraus resultierenden Ums tzen zu untersuchen Zu diesem Zweck hat er die Ums tze vergangener Jahre und die zugeh rigen Werbeausgaben zusammengestellt m aflatoxin sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um Tests von Maisernten auf Aflatoxin geht ein Gift dessen Konzentration stark zwischen und innerhalb von Ernteertr gen schwankt Ein Kornverarbeitungsbetrieb hat aus 8 Ernteertr gen je 16 Proben erhalten und das Aflatoxinniveau in Teilen pro Milliarde parts per billion PPB gemessen m aflatoxin20 sav Diese Datendatei enth lt die Aflatoxinmessungen aus jeder der 16 Stichproben aus den Ertr gen 4 und 8 der Datendatei aflatoxin sav Copyright SPSS Inc 1989 2010 307 308 Anhang A anorectic sav Bei der Ausarbeitung einer standardisierten Symptomatologie anorektischen bulimischen Verhaltens f hrten Forscher Van der Ham Meulman Van Strien als auch Van Engeland 1997 eine Studie mit 55 Jugendlichen mit bekannten Ess St rungen durch Jeder Patient wurde
361. spaper read most often ist als einzeln nominal angegeben Die projizierten Zentroide zeigen dass Volkskrant und NRC im Gegensatz zu Telegraaf stehen Abbildung 11 24 Zentroide und projizierte Zentroide f r Age in years 1 0 Zentroide eT 66 70 O Projektiert o O Tats chlich 66 70 05 a Ehag P 3 q a 26 30 36 50 31 35 nr S 00 7 56 60 36 58 E 26 30 20 25 w E 054 a 54 60 o 10 1 45 15 1 0 0 5 0 0 05 10 15 20 Dimension 1 Das Problem bei Age in years zeigt sich deutlich in den projizierten Zentroiden Wird Age in years als ordinal behandelt impliziert dies dass die Reihenfolge der Altersgruppen beibehalten werden muss Um diese Einschr nkung zu erf llen werden alle Altersgruppen bis 45 Jahre auf denselben 216 Kapitel 11 Punkt projiziert Entlang der Richtung die durch Age in years Newspaper read most often und Neighborhood preference definiert ist findet keine Trennung der niedrigeren Altersgruppen statt Diese Erkenntnis legt nahe dass die Variable als nominal behandelt werden sollte Abbildung 11 25 Zentroide und projizierte Zentroide f r Neighborhood preference 15 Zentroide O Projektiert O Tats chlich m o 10 Village Village N c 054 K 2 Town 00 A 0 5 1 0 1 0 0 5 0 0 0 5 1 0 1 5 Dimension 1 Um die Beziehungen zwischen den Variablen zu erkennen ermitteln Sie welche Kategorien Werte f r Cluster von Kategorien in den Diagrammen mit Zentroi
362. sprotokoll des Hauptalgorithmus an Anpassungsma e Zeigt verschiedene Ma e an Die Tabelle enth lt mehrere Ma e f r die G te bzw mangelhafte G te der Anpassung Korrelation Variation und Nichtdegenerierung Stress Zerlegung Zeigt die Zerlegung des penalisierten Stress von Objekten Zeilen und Quellen an einschlie lich der Mittelwerte und Standardabweichungen von Zeilen Spalten und Quellen Transformierte hnlichkeiten Zeigt die transformierten hnlichkeiten an Endg ltiger gemeinsamer Raum Zeigt die Koordinaten des gemeinsamen Raums an Raumgewichtungen Zeigt die individuellen Raumgewichtungen an Diese Option ist nur verf gbar wenn eines der Modelle f r individuelle Differenzen angegeben wird Je nach Modell werden die Raumgewichtungen in Rotations und Dimensionsgewichtungen zerlegt die ebenfalls angezeigt werden Individueller Raum Zeigt die Koordinaten der individuellen R ume an Diese Option ist nur verf gbar wenn eines der Modelle f r individuelle Differenzen angegeben wird Angepasste Distanzen Zeigt die Distanzen zwischen den Objekten in der Konfiguration an In neuer Datei speichern Sie k nnen die Koordinaten des gemeinsamen Raums die individuellen Raumgewichtungen die Distanzen und die transformierten hnlichkeiten in eigenen IBM SPSS Statistics Datendateien speichern 99 Multidimensionale Entfaltung PREFSCAL Zus tzliche Funktionen beim Befehl PREFSCAL Sie k nnen die multidimens
363. ssionskoeffizienten f r jeden Start in eine externe IBM SPSS Statistics Datendatei oder ein Daten Set in der aktuellen Sitzung geschrieben F r weitere Informationen siehe Thema Kategoriale Regression Speichern auf S 26 Die Ergebnisse eines fr heren Laufs mit mehreren systematischen Starts erm glichen Ihnen feste Vorzeichen f r die Regressionskoeffizienten zu verwenden Die Vorzeichen angegeben durch 1 und 1 m ssen sich in einer Zeile des angegebenen Daten Sets bzw der angegebenen Datei befinden Die ganzzahlige Startzahl ist die Fallnummer der Zeile in dieser Datei die die zu verwendenden Vorzeichen enth lt Kriterien Sie k nnen die H chstzahl an Iterationen festlegen die bei den Regressionsberechnungen durchlaufen werden sollen Au erdem k nnen Sie einen Wert f r das Konvergenzkriterium ausw hlen Die Regression wird abgebrochen wenn die Differenz der Gesamtanpassung zwischen den letzten zwei Iterationen kleiner als der Konvergenzwert ist oder die Maximalzahl von Iterationen erreicht wurde Diagramme beschriften mit Hiermit k nnen Sie festlegen ob in den Diagrammen Variablen und Wertlabels oder Variablennamen und Werte verwendet werden sollen Sie k nnen auch eine H chstl nge f r die Beschriftungen festlegen 23 Kategoriale Regression CATREG Kategorische Regressionsregelung Abbildung 2 6 Regelung Dialogfeld E Kategoriale Regression Regularisierung rMethode Keine Ridge Regressio
364. stanzen E Transformierte unabh ngige Variablen M Variablen und Dimensionskorrelationen Quellen Multidimensionale Skalierung 260 Kapitel 14 Abbildung 14 8 Screeplot 0144 0104 0 08 4 0 06 0 044 Normalisierter unbearbeiteter Stress 002 2 3 4 5 6 7 8 9 10 Dimensionalit t Die Prozedur beginnt mit einer zehndimensionalen L sung und wird dann auf eine zweidimensionale L sung reduziert Der Screeplot zeigt den normalisierten Roh Stress f r die L sung in jeder Dimension Aus dem Diagramm geht hervor dass ein Anstieg der Dimensionen von 2 auf 3 sowie von 3 auf 4 eine gro e Verbesserung beim Stress nach sich zieht Ab 4 werden nur noch geringf gige Verbesserungen erzielt Sie entscheiden sich die Daten mithilfe einer dreidimensionalen L sung zu interpretieren weil die Ergebnisse hier einfacher zu interpretieren sind Eine dreidimensionale L sung Die unabh ngigen Variablen gender gener generation und degree der Trennung wurden speziell f r die Interpretation der Dimensionen in der L sung erstellt Die unabh ngigen Variablen wurden wie folgt gebildet gender 1 male 2 female 9 missing f r Cousin gener Anzahl der Generationen von Ihnen aus gerechnet wenn diese Bezeichnung f r Ihre Verwandtschaft verwendet wurde Niedrigere Zahlen bedeuten dabei ltere Generationen Gro eltern erhalten den Wert 2 Enkel den Wert 2 und Geschwist
365. stellen einer dreidimensionalen L sung ffnen Sie erneut das Dialogfeld Multidimensionale Skalierung und klicken Sie auf Modell gt Geben Sie 3 als minimal und maximal zul ssige Anzahl der Dimensionen ein gt Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Multidimensionale Skalierung auf Optionen 262 Kapitel 14 Abbildung 14 10 Dialogfeld Optionen fF Multidimensionale Skalierung Optionen X rAusgangskonfiguration kterationskriterien Simplex Stress Konvergenz Torgerson Mindest Stress 0001 Einzelner Zufallsstart Maximalzahl der tterationen Mehrere Zufallsstarts n Gelockerte Aktualisierungen Anzahl Starts 2 Anpassen rAngepasste Konfiguration Variablen einlesen aus Datei C Program Files SPSSInc P kinship_ini sav Die Anzahl muss der maximalen Dimensionalitat des Modells entsprechen Aktuell 2 Verf gbar Ausgew hlt gt Wahlen Sie Benutzerdefiniert als Anfangskonfiguration W hlen Sie die Datei kinship_ini sav als Datei aus der die Variablen ausgelesen werden sollen gt W hlen Sie dim01 dim02 und dimO3 als Variablen aus Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Multidimensionale Skalierung auf Diagramme 263 Abbildung 14 11 Dialogfeld Diagramme Diagramme i Stress Y Gemeinsamer Raum A Individueller Raum Multidimensionale Skalierung Diagramme Ti Urspr ngliche ber tra
366. summe von Degeneration DeSarbos Indizes f r 1590979 Vermischung Shepards Index f r Nicht Degeneration 7895692 Die bei den Ma en f r die degenerierte L sung beobachteten Probleme wurden hier behoben m Der normalisierte Stress betr gt nicht mehr 0 m Der Variationskoeffizient f r die transformierten hnlichkeiten weist nun einen hnlichen Wert wie der Variationskoeffizient f r die urspr nglichen hnlichkeiten auf m Die Vermischungsindizes nach DeSarbo liegen wesentlich n her bei 0 und deuten somit auf eine erheblich bessere Vermischung hin m Shepards Index f r Nicht Degeneration ein Prozentwert verschiedener Distanzen liegt jetzt bei nahezu 80 Die Distanzen sind ausreichend und die L sung ist wahrscheinlich nicht degeneriert 279 Multidimensionale Entfaltung Gemeinsamer Raum Abbildung 15 7 Verbundenes Diagramm des gemeinsamen Raums f r eine nicht degenerierte L sung Toast pop up 0 39 o 19 Toast and margarine o o 37 _ Toast and marmalade yeke N 0 9 Cinnamon bun 4 0 5 o Buttered toast and jelP 17 O Glazed donut T 32 38 0 2 e 35 1 30 25014896 v Hard rolls u i 208 9022 Eo Buttered toast Danish pastry O o20 a az U 24 1830 0 67 110 0 0 0 9 ae 15 Coffee cake 272 23000 0 10 13 41 o 33 28 oO Blue RPARIN MAE AutgaAKRATNE Cinnamon toast Corn muffin and butter Dimension 1 Das verbundene Diagramm des gemeinsamen Raums erm glicht eine Interpretation der Dim
367. t und dass eine weite Entfernung mit Keine Beziehung in Verbindung steht Objektwerte Au erdem k nnen Sie eine Auflistung und ein Diagramm der Objektwerte anfordern Das Diagramm der Objektwerte kann f r die Erkennung von Ausrei ern typischen Objektgruppen oder speziellen Mustern hilfreich sein Die Objektwertetabelle zeigt die Auflistung der Objektwerte f r die Guttman Bell Daten nach sozialer Gruppe beschriftet Durch die Untersuchung der Werte f r die Objektpunkte k nnen Sie spezielle Objekte im Diagramm identifizieren Abbildung 10 11 Objektwerte Dimension Cluster Normalisierung mit Yariablen Prinzipal Die erste Dimension scheint CROWDS und PUBLIC die relativ gro e negative Werte aufweisen von MOBS und PRIMARY GROUPS zu trennen die relativ gro e positive Werte aufweisen In der zweiten Dimension finden sich drei Klumpen PUBLIC und SECONDARY GROUPS mit gro en negativen Werten CROWDS mit gro en positiven Werten und die anderen sozialen Gruppen dazwischen Dies ist leichter zu sehen wenn man das Diagramm der Objektwerte untersucht Abbildung 10 12 Objektwertediagramm o CR 14 AU N c oN pe o T mc e 0 o w a 17 Pu o SG o Dimension 1 158 Kapitel 10 Im Diagramm sehen Sie PUBLIC und SECONDARY GROUPS unten CROWDS oben und die anderen sozialen Gruppen in der Mitte Die Untersuchung der Muster zwischen einzelnen Objekten h ngt von den zus tzlichen Informationen ab
368. tandardwerte 300 Kapitel 15 Me werte GLM Repeated Measures Abbildung 15 28 Me werte GLM Repeated Measures lterationen Endg ltiger Funktionswert Wertteile der Funktion Fehlende Anpassung G te der Anpassung Yariationskoeffizienten Indizes f r Degeneration Stressteil Penalisierungsteil Normalisierter Stress Stress Inach Kruskal Stress Il nach Kruskal S Stress nach Young 5 Stress Il nach Young Erklarte Streuung Erklarte Varianz Ermittelte Bevorzungsordnungen Spearman Rho Kendall Tau b Variation der hnlichkeiten Variation der transformierten Ahnlichkeiten Variation der Distanzen Quadratsumme von DeSarbos Indizes f r Vermischung Shepards Index f r Nicht Degeneration 169 6427725 1900001 2 1745069 0361000 1900001 5224663 2760971 4525933 9639000 8082862 6608333 6981120 7202452 5138436 4751934 13912592 4957969 173810 Der Algorithmus konvergiert nach 169 Iterationen bei einem endgiiltigen penalisierten Stress von 0 6427725 Die Variationskoeffizienten und Shepards Index sind ausreichend gro und die Indizes nach DeSarbo ausreichend klein um den Schluss zuzulassen dass keine Degenerationsprobleme vorliegen 301 Multidimensionale Entfaltung Gemeinsamer Raum Abbildung 15 29 Verbundenes Diagramm des gemeinsamen Raums Dimension 2 4 o Date Movies Eat oe o 2 Kiss o Game Dinner Shout Park Bar Sidewalk oo Run
369. te tJ ce un Kategoriale Hauptkomponenten Objekt und Variablendiagramme Im Dialogfeld Kategoriale Hauptkomponenten Objekt und Variablendiagramme k nnen Sie festlegen welche Diagramme und f r welche Variablen die Diagramme erstellt werden sollen 40 Kapitel 3 Abbildung 3 9 Objekt und Variablendiagramme E amp Kategoriale Hauptkomponenten Objekt und Variablendiagramme Diagramme Y Objektpunkte C Objekte und variablen Biplot Yariablenkoordinaten rBiplot und Triplotvariablen r Objekte beschriften Verf gbar Ausgew hlt Beschriften anhand Fallnummer Variable Objektpunkte Es wird ein Diagramm der Objektpunkte angezeigt Objekte und Variablen Biplot Es werden Objektpunkte und Variablenkoordinaten ausgegeben Hierbei bestehen die folgenden M glichkeiten Komponentenladungen oder Zentroide der Variablen Objekte Ladungen und Zentroide Triplot Es werden die Objektpunkte die Zentroide von Variablen mit mehrfach nominalem Skalierungsniveau und die Komonentenladungen von anderen Variablen ausgegeben Biplot und Triplotvariablen Die Biplots und Triplots k nnen auf allen Variablen oder einer Teilmenge der Variablen basieren Objekte beschriften Objekte k nnen mit den Kategorien ausgew hlter Variablen im Dialogfeld Kategoriale Hauptkomponenten Optionen k nnen Sie Kategorienummern oder Wertelabels w hlen oder den Fallnumme
370. te Messniveau f r die optimale Skalierung funktioniert Wenn mehrere Kategorien hnliche Quantifizierungen erhalten kann die Zusammenfassung dieser Kategorien zu einer einzigen Kategorie gerechtfertigt sein Wenn umgekehrt eine als nominal behandelte Variable Quantifizierungen erh lt die einen steigenden Trend anzeigen kann eine ordinale Transformation zu einer hnlichen Anpassung f hren Wenn dieser Trend linear ist ist m glicherweise eine numerische Behandlung geeignet Wenn jedoch die Zusammenfassung von Kategorien oder die nderung der Messniveaus f r die Skalierung angebracht ist ndert sich die Analyse nicht in signifikanter Weise Abbildung 1 1 Transformationsdiagramm f r Preise numerisch 104 004 Quantifizierungen e e a E 1 19 1 39 1 59 Kategorien Kategoriecodes Bei der Kodierung kategorialer Variablen sollte mit Vorsicht vorgegangen werden da einige Kodierungsschemata zu einer unerw nschten Datenausgabe oder zu unvollst ndigen Analysen f hren k nnen M gliche Kodierungsschemata f r T tigkeit werden in der folgenden Tabelle angezeigt 5 Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten Tabelle 1 2 Alternative Kodierungsschemata f r die T tigkeit Schema Kategorie D K R P Praktikant 1 1 5 1 Vertreter 2 2 6 5 Manager 3 7 7 3 F r einige Prozeduren von Categories muss der Bereich jeder verwendeten Variablen definiert
371. tegorialen Hauptkomponentenanalyse 154 160 177 in Nichtlineare kanonische Korrelationsanalyse 207 Einschr nkungen in Multidimensionale Skalierung 81 Einschr nkungen im gemeinsamen Raum in Multidimensionale Entfaltung 92 Elastic Net in Kategoriale Regression 23 Endg ltige Diagramme des gemeinsamen Raums in Multidimensionale Entfaltung 95 Fehlende Werte bei der Mehrfachkorrespondenzanalyse 64 in der Kategorialen Hauptkomponentenanalyse 33 in Kategoriale Regression 20 Gelockerte Aktualisierungen in Multidimensionale Skalierung 82 Gemeinsame Raumkoordinaten in Multidimensionale Entfaltung 97 in Multidimensionale Skalierung 86 Gemeinsamer Raum in Multidimensionale Entfaltung 276 279 285 292 301 305 327 328 Index in Multidimensionale Skalierung 265 269 Gewichte in Nichtlineare kanonische Korrelationsanalyse 48 208 Gewichtetes euklidisches Modell in Multidimensionale Entfaltung 90 Grafik in der Korrespondenzanalyse 57 in Kategoriale Regression 27 in Multidimensionale Skalierung 84 85 in Nichtlineare kanonische Korrelationsanalyse 48 Identit tsmodell in Multidimensionale Entfaltung 90 Individuelle Raumgewichtungen in Multidimensionale Entfaltung 97 in Multidimensionale Skalierung 86 Individuelle Raumkoordinaten in Multidimensionale Entfaltung 97 Individueller Raum in Multidimensionale Entfaltung 286 293 Interkorre
372. ten Objekt hnlichkeiten und den zugeh rigen Euklidischen Distanzen im flachdimensionierten Raum minimiert Der flachdimensionierte Raum hat die Aufgabe die Beziehungen zwischen den Objekten offenzulegen Wenn Sie die L sung so einschr nken dass nur eine lineare Kombination unabh ngiger Variablen zul ssig ist k nnen Sie die Dimensionen der L sungen im Hinblick auf diese Variablen interpretieren Im nachfolgenden Beispiel sehen Sie wie 15 verschiedene Bezeichnungen des Verwandtschaftsgrades in drei Dimensionen dargestellt werden k nnen und wie dieser Raum im Hinblick auf das Geschlecht die Generation und den Trennungsgrad dieser Bezeichnungen interpretiert werden kann Beispiel Untersuchung von Bezeichnungen des Verwandtschaftsgrades Rosenberg und Kim Rosenberg als auch Kim 1975 haben 15 Bezeichnungen f r den Verwandtschaftsgrad untersucht Tante Bruder Cousin Tochter Vater Enkelin Gro vater Gro mutter Enkel Mutter Neffe Nichte Schwester Sohn Onkel Die beiden Analytiker baten vier Gruppen von College Studenten zwei weibliche und zwei m nnliche Gruppen diese Bezeichnungen auf der Grundlage der hnlichkeiten zu sortieren Zwei Gruppen eine weibliche und eine m nnliche Gruppe wurden gebeten die Bezeichnungen zweimal zu sortieren die zweite Sortierung sollte dabei nach anderen Kriterien erfolgen als die erste So wurden insgesamt sechs Quellen erzielt die in der nachstehenden Tabelle dargestellt werden
373. ten Sie eine Vielzahl von M glichkeiten zur Analyse der Daten Korrespondenzanalyse Ziel der Korrespondenzanalyse ist die Erstellung von Biplots f r Korrespondenztafeln In einer Korrespondenztafel wird davon ausgegangen dass die Zeilen und Spaltenvariablen ungeordnete Kategorien darstellen daher wird hier immer das nominale Messniveau der optimalen Skalierung verwendet Beide Variablen werden hinsichtlich ihrer nominalen Informationen untersucht Es wird also nur die Tatsache ber cksichtigt dass sich einige Objekte in derselben Kategorie befinden andere jedoch nicht ber die Distanz oder die Reihenfolge der verschiedenen Kategorien derselben Variablen werden keine Annahmen gemacht Eine spezielle Verwendung der Korrespondenzanalyse besteht in der Analyse von zweidimensionalen Kontingenztafeln Wenn eine Tabelle r aktive Zeilen und c aktive Spalten aufweist betr gt die Anzahl der Dimensionen in der Korrespondenzanalyse mindestens d r minus 1 bzw c minus 1 der kleinere der beiden Werte wird verwendet Anders 11 Einf hrung in die Prozeduren f r die optimale Skalierung von kategorialen Daten ausgedr ckt Die Zeilen oder Spaltenkategorien einer Kontingenztafel k nnten perfekt in einem mehrdimensionalen Raum dargestellt werden In der Praxis w rde man jedoch die Zeilen und Spaltenkategorien einer zweidimensionalen Tabelle in einem Raum mit wenigen beispielsweise zwei Dimensionen darstellen wollen da zweidimensionale Diagra
374. terationen gt ata der ann ae r Diagramme beschriften mit Yariablen oder WVertelabels Variablennamen oder Verte r Diagrammdimensionen Alle Dimensionen in der L sung anzeigen Anzahl der Dimensionen beschr nken Konfiguration 36 Kapitel 3 Zusatzobjekte Geben Sie die Fallnummer des Objekts bzw die erste und letzte Fallnummer einer Reihe von Objekten an die als Zusatzobjekte deklariert werden sollen und klicken Sie dann auf Hinzuf gen Wiederholen Sie diesen Vorgang bis Sie alle Zusatzobjekte festgelegt haben Wenn ein Objekt als Zusatzobjekt deklariert ist werden Fallgewichtungen f r das Objekt ignoriert Normalisierungsmethode Sie k nnen eine von f nf Optionen f r die Normalisierung der Objektwerte und Variablen ausw hlen In einer Analyse kann nur eine Normalisierungsmethode gleichzeitig verwendet werden m Variablenprinzipal Bei dieser Option wird die Assoziation zwischen Variablen optimiert Die Komponentenladungen Korrelationen mit Hauptkomponenten wie Dimensionen und Objektwerten stellen die Koordinaten der Variablen im Objektraum dar Dies ist n tzlich wenn Sie haupts chlich an der Korrelation zwischen den Variablen interessiert sind Objektprinzipal Bei dieser Option werden die Distanzen zwischen den Objekten optimiert Dies ist n tzlich wenn Sie haupts chlich an den Unterschieden oder bereinstimmungen zwischen den Objekten interessiert sind m Symmetrisch
375. tifikation einer zus tzlichen Kategorie ersetzt Dies 21 Kategoriale Regression CATREG bedeutet aber auch dass Objekte mit einem fehlenden Wert f r diese Variable als zur gleichen Kategorie der zus tzlichen zugeh rig betrachtet werden Kategoriale Regression Optionen Im Dialogfeld Optionen werden festgelegt die Anfangskonfiguration Iterations und Konvergenzkriterien die Auswahl von zus tzlichen F llen und die Beschriftung der Diagramme Abbildung 2 5 Dialogfeld Optionen E Kategoriale Regression Optionen rZusatzobjekte r Ausgangskonfiguration Bereich von F llen Numerisch Erster Karen Zuf llig Letzter Mehrere systematische Starts Zu testende Muster Einzelner Fall amp Als Zusatz zu behandelnde F lle Das reduzierte Set besteht aus Mustern bei denen negative Vorzeichen nur f r Variablen mit einem Prozentverlust der Yarianz ber dem Schwellenwert zul ssig sind Feste Vorzeichen f r Regressionskoeffizienten verwenden r Vorzeichen der Regressionskoeffizienten rKriterien Konvergenz 00001 el Name ii Maximalzahl der Iterationen r Diagramme beschriften mit variablen oder Wertelabels Langenbegrenzung f r Beschriftungen Variablennamen oder Werte _weter_ avereenen tite Zusatzobjekte Mit dieser Option k nnen Sie die Objekte angeben die als Zusatzobjekte behandelt werden s
376. tion SPSS Inc may make improvements and or changes in the product s and or the program s described in this publication at any time without notice Any references in this information to non SPSS and non IBM Web sites are provided for convenience only and do not in any manner serve as an endorsement of those Web sites The materials at those Web sites are not part of the materials for this SPSS Inc product and use of those Web sites is at your own risk When you send information to IBM or SPSS you grant IBM and SPSS a nonexclusive right to use or distribute the information in any way it believes appropriate without incurring any obligation to you Information concerning non SPSS products was obtained from the suppliers of those products their published announcements or other publicly available sources SPSS has not tested those products and cannot confirm the accuracy of performance compatibility or any other claims related to non SPSS products Questions on the capabilities of non SPSS products should be addressed to the suppliers of those products This information contains examples of data and reports used in daily business operations To illustrate them as completely as possible the examples include the names of individuals companies brands and products All ofthese names are fictitious and any similarity to the names and addresses used by an actual business enterprise is entirely coincidental COPYRIGHT LICENSE This information
377. tionen Deskriptive Statistik a r Optionen f r Objektwerte Diese Kategorien ber cksichtigen Objektwerte bechriften mit Kategoriale Hauptkomponentenanalyse Wahlen Sie im Gruppenfeld Tabelle die Option Objektwerte Fordern Sie die Kategoriequantifikationen fiir tidi an W hlen Sie aus dass die Kategorien time diag und number ber cksichtigt werden sollen Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Hauptkomponenten auf Speichern 172 Kapitel 10 Abbildung 10 28 Speichern Diskretisierte Daten E Diskretisierte Daten erstellen Datenblatt erstellen neue Datendatei schreiben Datei Transformierte Yariablen N In Arbeitsdatei speichern _ Variablen erstellen Neues Datenblatt erstellen Datenblatt Name Neue Datendatei schreiben Objektwerte In Arbeitsdatei speichern E Objektwerte erstellen Neues Datenblatt erstellen Datenblatt Name Neue Datendatei schreiben Datei Mehrfach nominale Dimensionen Alle Erste Approximationen In Arbeitsdatei speichern Approximationen erstellen Neues Datenblatt erstellen Datenblatt Name Neue Datendatei schreiben gt W hlen Sie im Gruppenfeld Transformierte Variablen die Option In Arbeitsdatei speichern aus Klicken Sie auf Weiter Klicken Sie im Dialogfeld Kategoriale Hauptkomponenten au
378. tistical Society Series B 27 147 Kategoriale Regression Meulman J J 2003 Prediction and classification in nonlinear data analysis Something old something new something borrowed something blue Psychometrika 4 Ramsay J O 1989 Monotone regression splines in action Statistical Science 4 Van der Kooi A J als auch J J Meulman 1997 MURALS Multiple regression and optimal scaling using alternating least squares In Softstat 97 F Faulbaum als auch W Bandilla Hgg Stuttgart Gustav Fischer Winsberg S als auch J O Ramsay 1980 Monotonic transformations to additivity using splines Biometrika 67 Winsberg S als auch J O Ramsay 1983 Monotone spline transformations for dimension reduction Psychometrika 48 Young F W J De Leeuw als auch Y Takane 1976 Regression with qualitative and quantitative variables An alternating least squares method with optimal scaling features Psychometrika 41 Kapitel Kategoriale Hauptkomponentenanalyse Die kategoriale Hauptkomponentenanalyse kann als Methode der Dimensionsreduktion betrachtet werden Ein Variablen Set wird analysiert um gr ere Variationsdimensionen aufzudecken Die urspr ngliche Datenmenge kann danach unter minimalem Informationsverlust durch eine neue kleinere Datenmenge ersetzt werden Die Methode zeigt Beziehungen zwischen Variablen zwischen F llen und zwischen Variablen und F llen auf Das von der kateg
379. tungen Dimension Age in years Marital status Newspaper read most often Music preferred Neighborhood preference Abbildung 11 15 Komponentenladungen Be ze ge Age in yearsa b Marital status b Pets owned4 e Dimension 1 2 Newspaper read most oftens b Music preferred e b Neighborhood preferences b a Optimales Skalierungsniveau Ordinal b Projektionen der einfach quantifizierten Variablen im Objektraum Optimales Skalierungsniveau Einfach nominal d Optimales Skalierungsniveau mehrfach nominal e Projektionen der mehrfach quantifizierten Variablen im Objektraum 209 Nichtlineare kanonische Korrelationsanalyse Diese Zahlen geben die Gewichtungen und die Komponentenladungen f r die Variablen in diesem Beispiel an Die Mehrfachkorrelation R f r die erste gewichtete Summe optimal skalierter Variablen Age in years und Marital status in der ersten Dimension der Objekte lautet R 4 0 701 x 0 841 0 273 x 0 631 0 5895 0 1723 0 873 F r jede Dimension gilt 1 Verlust R2 Beispiel Aus der Tabelle mit der Zusammenfassung der Analyse ergibt sich 1 0 238 0 762 also 0 873 im Quadrat plus Rundungsfehler Kleine Verlustwerte weisen somit auf umfangreiche Mehrfachkorrelationen zwischen den gewichteten Summen optimal skalierter Variablen und Dimensionen hin Die Gewichtungen sind bei mehrfach nominalen Variablen nicht eindeutig Bei mehrfach nominalen Variablen gilt
380. ubtype_ da Label_ a da vart amp Centroids Projected on i amp Centroids Projected on jf 0200000000000000 amp Centroids Projected on ff time Qo GaD0KO amp diagnosis E Category 1 E Category 2 Ausw hlen aus Um schlieBlich die auf die Binge eating Fressattacken projizierten Zentroide des Diagnosezeitpunkts im Verlauf der Zeit zu betrachten m ssen Sie die Diagrammerstellung erneut ffnen und durch Klicken auf Zur cksetzen die vorherige Auswahl l schen W hlen Sie die GalerieStreu Punktdiagramm aus und w hlen Sie die Option Gruppiertes Streudiagramm W hlen Sie Centroids Projected on Binge eating Zentroide auf Fre attacken projiziert als y Achsen Variable und time Zeit als x Achsen Variable aus Wahlen Sie aus dass die Farben anhand von diagnosis Diagnose festgelegt werden sollen Klicken Sie auf OK 192 Kapitel 10 Abbildung 10 50 Auf Binge eating Fre attacken projizierte Zentroide des Diagnosezeitpunkts im Verlauf der Zeit Datei Bearbeiten Ansicht Optionen Elemente Hilfe se XY ABS A Ji E lie Zee We o in o o o Centroids Projected on Binge eating H 376 5 B 470 25 Pun Doppelklicken Sie dann zur Verbindung der Punkte auf das Diagramm und klicken Sie im Diagramm Editor auf das Tool zum Hinzuf gen von Interpolationslinien gt Schlie en Sie den
381. uellen Sitzung verf gbar In nachfolgenden Sitzungen stehen Daten Sets nur zur Verf gung wenn Sie sie ausdr cklich als Datendateien speichern Die Namen von Daten Sets m ssen den Regeln zum Benennen von Variablen entsprechen m Die Namen f r die Dateien und Daten Sets m ssen sich bei allen Arten von gespeicherten Daten unterscheiden Abbildung 2 8 Speichern EH Kategoriale Regression Speichern E Yorhergesagte Werte in Arbeitsdatei speichern Z Residuen in Arbeitsdatei speichern rDiskretisierte Daten rNormalisierte Modelle und Koeffizienten E Diskretisierte Daten erstellen rTransformierte Yariablen rYorzeichen der Regressionskoeffizienten Transformierte Variablen in Arbeitsdatei speichern E Transformierte Variablen in neues Daten Set bzw neue Datei speichern fe Ca eeen e Geregelte Modelle und Koeffizienten werden immer dann gespeichert wenn eine Regelungsmethode im Dialogfeld Regelung ausgew hlt ist Standardm ig erstellt das Verfahren ein neues Daten Set mit einem eindeutigen Namen aber Sie k nnen nat rlich einen Namen eigener Wahl angeben oder eine externe Datei schreiben Die Vorzeichen der Regressionskoeffizienten werden immer dann gespeichert wenn mehrere systematische Starts als anf ngliche Konfiguration im Dialogfeld Optionen verwendet werden Standardm ig erstellt das Verfahren ein neues Daten Set mit einem eindeutigen Namen aber
382. ung Alle Variablen sind mehrfach nominal Einige Variablen sind nicht mehrfach nominal rAnzahl der Yariablen Sets Ein Set Mehrere Sets rAusgew hlte Analyse __ Mehrfachkorrespondenzanalyse Ce er un gt Vergewissern Sie sich dass Alle Variablen sind mehrfach nominal und Ein Set ausgew hlt sind und klicken Sie auf Definieren 238 Kapitel 13 Abbildung 13 2 Dialogfeld Mehrfachkorrespondenzanalyse Analysevariablen Zusatzvariablen Beschriftungsvariablen _ n Dimensionen in der L sung W hlen Sie Gewinde bis L nge in cm als Analysevariablen aus W hlen Sie object als Beschriftungsvariable Klicken Sie im Gruppenfeld Diagramme auf Objekt 239 Mehrfachkorrespondenzanalyse Abbildung 13 3 Dialogfeld Objektdiagramme FE Mca Objektdiagramme X Diagramme M Objektpunkte Objekte und Zentroide Biplot Biplot Yariablen Verf gbar Ausgew hlt Einschlie en thread head Alle Variablen z indhead Ausgew hlte Variablen bottom brass gt length Objekte beschriften Verf gbar Ausgew hlt Beschriften anhand Fallnummer Variable Wahlen Sie aus dass Objekte nach Variable beschriftet werden sollen W hlen Sie gewinde bis object als Beschriftungsvariablen aus Klicken Sie auf Weiter und dann im Gruppenfeld Diagramme des Dialogfelds Mehrfachko
383. ung 253 Beispiel Untersuchung von Bezeichnungen des Verwandtschaftsgrades 253 Festlegen der Anzahl der Dimensionen 000 0c cece eee 254 Eine dreidimensionale Lasung 00000 e eee eet eee eee 260 Dreidimensionale L sung mit nicht standardm igen Transformationen 266 Diskussion une ae ae ee ne i E 270 Empfohlene Literatur 2 0 0 2 teen nennen 270 15 Multidimensionale Entfaltung 272 Beispiel Bevorzugte Friihstiicksartikel 0 0 ce eee eens 272 Erstellen einer degenerierten Ldsung 0 ccc cece eee eee e teens 272 Me werte GLM Repeated Measures nonna 0 00 00 ccc cence een enna 275 Gemeinsamer Raum sch 0450680 risereu bereen daearen ai dap eteeni ti 276 Durchf hren einer nicht degenerierten Analyse nunnana nannan 277 Me werte GLM Repeated Measures 2 annann 278 Gemeinsamer Raum n on anuanua anneanne 279 Beispiel Drei Weg Entfaltung von bevorzugten Fr hst cksartikeln 2222222 279 Durchf hren der Analyse 222 22neneneneeeenenseeeerener een 280 Me werte GLM Repeated Measures 0 00 00 ccc cece eee een eens 284 Gemeinsamer Raum 0 ce eee ene eens 285 Individueller Raum nonan nananana eee een tent ee eee nee 286 Verwenden einer anderen Ausgangskonfiguration 0000 0e cere eee eee 289 Me werte GLM Repeated Measures 00 00 ccc cece eee eens 291 Gemein
384. ung verwendet werden 0 02 eee eee eens 1 Messniveau der optimalen Skalierung 00000 e eee cette eee 2 Auswahl des Messniveaus der optimalen Skalierung 200000 eee eee 3 Transformationsdiagramme 0 00 e cece ccna 3 Kategoriecodes zur 000 a ed ee ayes A i 4 Welche Prozedur ist f r Ihre Anwendung am besten geeignet 0 cc eee eee 7 Kategoriale Regression n nunnana 0c cece cette eee 8 Kategoriale Hauptkomponentenanalyse 000 cece cece tee eee ee 9 Nichtlineare kanonische Korrelationsanalyse 000 000 cece ee eee eaee 9 Korrespondenzanalyse 00 0 cece cette eee eee eee 10 Mehrfachkorrespondenzanalyse 0 cc ee ene tent n ene 12 Multidimensionale Skalierung 2 2 00 0c cece ee 13 Multidimensionale Entfaltung 000 cect eens 13 Seitenverh ltnis in Diagrammen mit optimaler Skalierung 2 000 0c ee eee 14 Empfohlene Literatur 2 Kategoriale Regression CATREG 16 Definieren der Skala in der kategorialen Regression 000 ccc cece cece eeaee 17 Kategoriale Regression Diskretisierung 0 0 e cece cette eee eee 19 Fehlende Werte in kategorialer Regression 000 cece cece eee eens 20 Kategoriale Regression Optionen 00000 c cece eee 21 Kategorische Regressionsregelung 00000 c eee eee eee eee eee 23 Kategoriale Regression Ausgabe 0
385. ur Anzahl der Dimensionen in der L sung liegen und gibt die h chste Dimension an die beim Plotten der Dimensionspaare verwendet wird Diese Spezifikation gilt f r alle angeforderten multidimensionalen Plots Zus tzliche Funktionen beim Befehl CORRESPONDENCE Sie k nnen die Korrespondenzanalyse an Ihre Bed rfnisse anpassen wenn Sie Ihre Auswahl in ein Syntax Fenster einf gen und die resultierende Befehlssyntax f r den Befehl CORRESPONDENCE bearbeiten Mit der Befehlssyntax Sprache verf gen Sie au erdem ber folgende M glichkeiten m Angeben der Tabellendaten als Eingabedaten anstelle der Verwendung fallweise gebundener Daten Unterbefehl TABLE ALL m Angeben der Anzahl von Zeichen f r Wertelabels zur Beschriftung von Punkten f r jeden Typ der Streudiagramm oder Biplot Matrix mit dem Unterbefehl PLOT m Angeben der Anzahl von Zeichen f r Wertelabels zur Beschriftung von Punkten f r jeden Typ von Liniendiagramm mit dem Unterbefehl PLOT m Schreiben einer Matrix mit Zeilen und Spaltenscores in eine Matrixdatendatei mit dem Unterbefehl OUTFILE m Schreiben einer Matrix der Konfidenzstatistiken Varianzen und Kovarianzen f r die Singul rwerte und die Scores in eine Matrixdatendatei mit dem Unterbefehl OUTFILE m Festlegen der Gleichheit f r mehrere Kategoriegruppen mit dem Unterbefehl EQUAL Vollst ndige Informationen zur Syntax finden Sie in der Command Syntax Reference Kapitel Mehrfachkorrespondenz
386. utet dass die Variable nicht ohne weiteres aus den anderen Einflussgr en vorhergesagt werden kann Eine Variable mit sehr geringer Toleranz tr gt dagegen wenig zum Informationsgehalt eines Modells bei und kann zu Problemen bei der Berechnung f hren Gro e negative Werte beim Ma f r die Wichtigkeit nach Pratt weisen zudem auf Multi Kollinearit t hin Alle Toleranzmesswerte sind sehr hoch Keine der Einflussgr en kann ohne weiteres aus den anderen Einflussgr en vorhergesagt werden und es besteht keine Multi Kollinearit t Transformationsdiagramme Das Diagramm mit den urspr nglichen Werten und den zugeh rigen Quantifikationen kann Trends aufdecken die in einer Quantifikationsliste nicht ohne weiteres ersichtlich sind Diese Diagramme werden in der Regel als Transformationsdiagramme bezeichnet Kategorien mit hnlichen Quantifikationen sollten besonders beachtet werden Diese Kategorien wirken sich auf dieselbe Weise auf die vorhergesagte Antwort aus Das grundlegende Erscheinungsbild des Diagramms wird allerdings durch den Transformationstyp bestimmt Variablen die als numerisch behandelt werden f hren zu einer linearen Beziehung zwischen den Quantifikationen und den urspr nglichen Kategorien Im Transformationsdiagramm wird dies als gerade Linie dargestellt Die Reihenfolge der urspr nglichen Kategorien und die Differenzen zwischen diesen Kategorien werden in den Quantifikationen beibehalten Die Reihenfolge der Quantifikation
387. utter als hnlichkeitsvariablen aus Klicken Sie auf Optionen 274 Kapitel 15 Abbildung 15 2 Dialogfeld Optionen E Multidimensionale Entfaltung Optionen rAusgangskonfiguration Klassisch Berechnung nach Ross Cliff Korrespondenz Zentroide Zufallsstarts Starts Anpassen riterationskriterien Stress Konvergenz 000001 Mindest Stress 0001 Maximalzahl der tterationen 5000 rPenalisierungsterm St rke Bereich r ngepasste Konfiguration Klicken Sie auf Weiter PREFSCAL VARIABLES TP INITIAL CLASSICAL TRANSFORMATION NONE PROXIMITIES DISSIMILARITIES CRITERIA DIMENSIONS 2 2 MAXITER 5000 DIFFSTRESS 000001 PENALTY LAMBDA 1 0 OMEGA 0 0 PRINT MEASURES COMMON PLOT COMMON butter angegeben W hlen Sie Spearman als Annahmemethode f r die Ausgangskonfiguration Klassisch aus Geben Sie im Gruppenfeld Penalisierungsterm 1 0 f r St rke und 0 0 f r Bereich ein Dadurch wird der Penalisierungsterm deaktiviert Klicken Sie im Dialogfeld Multidimensionale Entfaltung auf OK Im Folgenden finden Sie die durch diese Optionen generierte Befehlssyntax BT EMM JD CT BMM HRB TMd BTJ TMn CB DP GD CC CMB SPEARMAN MINSTRESS 0001 m Mit dieser Syntax wird eine Analyse der Variablen tp Toast pop up bis cmb Corn muffin and 275 Multidimensionale Entfaltung m De
388. veau angegeben Tabelle 10 1 Variablen im Guttman Bell Daten Set Variablenname Variablenlabel Wertelabel intensit Intensit t Sehr schwach schwach mittel hoch frequenz H ufigkeit Frequenz Schwach nicht wiederkehrend selten h ufig zugeh r Zugeh rigkeit Keine schwach variable hoch entfern Entfernung Weit nah formal Formalit t Keine Beziehung f rmlich nicht f rmlich cluster CR Crowds AU audiences PU public MB mobs PG primary groups SG secondary groups MC modern community Durchf hren der Analyse gt Um aus diesem Daten Set Ausgaben f r die kategoriale Hauptkomponentenanalyse zu erstellen w hlen Sie folgende Befehle aus den Men s aus Analysieren gt Dimensionsreduzierung gt Optimale Skalierung 150 Kapitel 10 Abbildung 10 1 Dialogfeld Optimale Skalierung rMessniveau der optimalen Skalierung Alle Variablen sind mehrfach nominal Einige Variablen sind nicht mehrfach nominal rAnzahl der Variablen Sets Ein Set Mehrere Sets pAusgew hlte Analyse Mehrfachkorrespondenzanalyse Kategoriale Hauptkomponenten Nichtlineare kanonische Korrelation i W hlen Sie im Gruppenfeld Messniveau der optimalen Skalierung die Option Einige Variablen sind nicht mehrfach nominal Klicken Sie auf Definieren Abbildung 10 2 Dialogfeld Kategoriale Hauptkomponentenanalyse Analysevariablen
389. version base height i 2 Pressure gradient mm E Visibility miles vis rBlock 1 von 1 9 Temperature degrees Unabhangige m Ras Methode inschluss Auswahlvariable Fallbeschriftungen WLS Gewichtung W hlen Sie Daily ozone level Quantification als abh ngige Variable aus gt W hlen Sie Inversion base height Quantification Pressure gradient mm Hg Quantification und Temperature degrees F Quantification als unabh ngige Variablen aus Klicken Sie auf OK 136 Kapitel 9 Abbildung 9 44 Modellzusammenfassung f r die Regression mit einer Untergruppe von Einflussgr en mit optimaler Skalierung Modellzusammenfassung Standardfehle Korrigiertes rdes Sch tzer R Quadrat R Quadrat s a Einflu variablen Konstante Temperature degrees F Quantifikation Pressure gradient mm Hg Quantifikation Inversion base height Quantifikation Unter Verwendung der Quantifikationen f r die Antwort f hren Temperature Pressure gradient und Inversion base height in einer linearen Regression nach dem Standardverfahren zu einer Anpassungsg te von 0 732 Soll dieser Wert mit der Anpassungsg te einer kategorialen Regression verglichen werden die sich ebenfalls nur auf diese drei Einflussgr en erstreckt ffnen Sie erneut das Dialogfeld Kategoriale Regression Abbildung 9 45 Dialogfeld Kategoriale Regression Kategoriale Regression l 5 Abhangige Variable
390. verwendet werden sollen Dieser Wert muss eine nichtnegative Ganzzahl sein die kleiner oder gleich 20 ist Liniendiagramme Erzeugt ein Diagramm f r jede Dimension der gew hlten Variable Folgende Liniendiagramme sind verf gbar m Transformierte Zeilenkategorien Erzeugt ein Diagramm unter Verwendung der urspr nglichen Zeilenkategoriewerte und der entsprechenden Zeilenwerte Transformierte Spaltenkategorien Erzeugt ein Diagramm unter Verwendung der urspr nglichen Spaltenkategoriewerte und der entsprechenden Spaltenwerte Optional k nnen Sie angeben wie viele Zeichen in Wertelabels zur Beschriftung der Kategorienachse verwendet werden sollen Dieser Wert muss eine nichtnegative Ganzzahl sein die kleiner oder gleich 20 ist 59 Korrespondenzanalyse Diagrammdimensionen Hiermit legen Sie fest wie die Statistiken in der Ausgabe angezeigt werden Alle Dimensionen in der L sung anzeigen Alle Dimensionen in der L sung werden in einer Streudiagramm Matrix angezeigt m Anzahl der Dimensionen beschr nken Die angezeigten Dimensionen werden auf geplottete Paare beschr nkt Wenn Sie die Dimensionen beschr nken m ssen Sie die niedrigste und die h chste Dimension ausw hlen die jeweils geplottet werden soll Die niedrigste Dimension muss im Bereich von 1 bis zur Anzahl der Dimensionen in der L sung minus 1 liegen und wird gegen h here Dimensionen geplottet Der Wert f r die h chste Dimension muss im Bereich von 2 bis z
391. vier Mal ber einen Zeitraum von vier Jahren untersucht es fanden also insgesamt 220 Beobachtungen statt Bei jeder Beobachtung erhielten die Patienten Scores f r jedes von 16 Symptomen Die Symptomwerte fehlen f r Patient 71 zum Zeitpunkt 2 Patient 76 zum Zeitpunkt 2 und Patient 47 zum Zeitpunkt 3 wodurch 217 g ltige Beobachtungen verbleiben autoaccidents sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen eines Versicherungsanalysten geht ein Modell zur Anzahl der Autounf lle pro Fahrer unter Ber cksichtigung von Alter und Geschlecht zu erstellen Jeder Fall stellt einen Fahrer dar und erfasst das Geschlecht des Fahrers sein Alter in Jahren und die Anzahl der Autounf lle in den letzten f nf Jahren band sav Diese Datendatei enth lt die hypothetischen w chentlichen Verkaufszahlen von CDs f r eine Musikgruppe Daten f r drei m gliche Einflussvariablen wurden ebenfalls aufgenommen bankloan sav Hierbei handelt es sich um eine hypothetische Datendatei bei der es um die Bem hungen einer Bank geht den Anteil der nicht zur ckgezahlten Kredite zu reduzieren Die Datei enth lt Informationen zum Finanzstatus und demografischen Hintergrund von 850 fr heren und potenziellen Kunden Bei den ersten 700 F llen handelt es sich um Kunden denen bereits ein Kredit gew hrt wurde Bei den letzten 150 F llen handelt es sich um potenzielle Kunden deren Kreditrisiko die Bank als gering oder hoch einstu
392. von Age in years sowohl in der ersten als auch in der zweiten Dimension statt die Streuung der Kategorien ist daher in beiden Dimensionen gleich Komponentenladungen Die nachstehende Abbildung zeigt das Diagramm der Komponentenladungen f r die Untersuchungsdaten Wenn keine Daten fehlen sind die Komponentenladungen identisch mit den Pearson Korrelationen zwischen den quantifizierten Variablen und den Objektwerten Die Distanz vom Ursprung zu den einzelnen Variablenpunkten ist etwa gleich der Wichtigkeit dieser Variable Die kanonischen Variablen werden nicht in das Diagramm aufgenommen k nnen jedoch mit horizontalen und vertikalen Linien durch den Ursprung dargestellt werden Abbildung 11 17 Komponentenladungen 0 75 Pets owned 0 50 0 25 N Age in years c 2 2 0 00 wo E a 0 25 Newspaper read most often o Music preferred 0 50 gree preference Pets owned o Marital status 0 75 0 5 0 0 0 5 1 0 Dimension 1 Die Beziehungen zwischen den Variablen sind offensichtlich Zwei Richtungen fallen nicht mit der horizontalen oder vertikalen Achse zusammen Eine Richtung wird durch Age in years Newspaper read most often und Neighborhood preference bestimmt Die andere Richtung ist 211 Nichtlineare kanonische Korrelationsanalyse durch die Variablen Marital status Music preferred und Pets owned definiert Die Variable Pers owned ist eine mehrfach nominale Variable hierf r werden also zwei Punkte aufgetragen Di
393. von Variablen Wenn eine Variable so viele Kategorien enth lt dass eine Interpretation nicht mehr praktikabel w re bearbeiten Sie die Kategorien im Dialogfeld Discretization F r die Variable Day ofthe year gilt ein Mindestwert von 3 und ein H chstwert von 365 Wird diese Variable in einer kategorialen Regression eingesetzt entspricht dies einer Variablen mit 365 Kategorien Bei Visibility miles gilt ein Bereich von 0 bis 350 Um die Interpretation der Analysen zu erleichtern diskretisieren Sie diese Variablen in gleiche Intervalle mit der L nge 10 Die Variable Inversion base height erstreckt sich ber einen Bereich von 111 bis 5000 Eine Variable mit so vielen Kategorien resultiert in u erst komplexen Beziehungen Wenn Sie diese Variable jedoch in gleiche Intervalle mit der L nge 100 diskretisieren erhalten Sie etwa 50 Kategorien Eine Variable mit nur 50 Kategorien vereinfacht die Interpretation gegen ber einer Variablen mit 5000 Kategorien ganz erheblich F r Pressure gradient mm Hg gilt ein Bereich von 69 bis 107 Bei der Prozedur werden alle Kategorien aus der Analyse ausgeschlossen die mit einem negativen Wert kodiert sind Wenn Sie diese Variable jedoch in gleiche Intervalle mit der L nge 10 diskretisieren ergeben sich etwa 19 Kategorien Temperature degrees F erstreckt sich von 25 bis 93 auf der Fahrenheit Temperaturskala Sollen diese Daten wie Daten auf der Celsius Temperaturskala analysiert werden dis
394. weils unterschiedlich bei Sekretariatsmitarbeitern im Vergleich zu Angestellten im gehobenen Management jedoch identisch sind Als Ergebnis k nnte sich ebenfalls die Erkenntnis herausstellen dass starkes Rauchen mit Angestellten des mittleren Managements und gelegentliches Rauchen mit Sekret rinnen in Verbindung gebracht werden kann Statistiken und Diagramme Korrespondenzma e Zeilen und Spaltenprofile Singul rwerte Zeilen und Spaltenwerte Tr gheit Masse Konfidenzstatistik f r Zeilen und Spaltenwerte Konfidenzstatistik f r Singul rwerte Transformationsdiagramme Zeilenpunktdiagramme Spaltenpunktdiagramme und Biplots Daten Die kategorialen Variablen die analysiert werden sollen werden nominal skaliert Verwenden Sie f r aggregierte Daten oder f r ein Korrespondenzma au er H ufigkeiten eine Gewichtungsvariable mit positiven hnlichkeitswerten Sie k nnen f r Tabellendaten auch die Syntax zum Lesen der Tabelle verwenden Copyright SPSS Inc 1989 2010 51 52 Kapitel 5 Annahmen Die maximale Anzahl der in der Prozedur verwendeten Dimensionen ist von der Zahl der aktiven Zeilen und Spaltenkategorien und der Anzahl der Gleichheitsbedingungen abh ngig Wenn keine Gleichheitsbedingungen verwendet werden und alle Kategorien aktiv sind ist die maximale Dimensionalit t um eins kleiner als die Anzahl der Kategorien in der Variablen mit den wenigsten Kategorien Wenn beispielsweise eine Variable ber f nf und
395. wer ausschlie en Keine Datei B ume Diagramme Neues Datenblatt Klicken Sie auf Hinzuf gen Klicken Sie auf OK und dann noch einmal auf OK um die OMS Sitzung zu best tigen Das Ausgabeverwaltungssystem OMS ist nun so eingerichtet dass es die Ergebnisse der Tabelle der projizierten Zentroide in die Datei projected_centroids sav schreibt gt Um aus diesem Daten Set Ausgaben f r die kategoriale Hauptkomponentenanalyse zu erstellen w hlen Sie folgende Befehle aus den Men s aus Analysieren gt Dimensionsreduzierung gt Optimale Skalierung 167 Kategoriale Hauptkomponentenanalyse Abbildung 10 21 Dialogfeld Optimale Skalierung rMessniveau der optimalen Skalierung Alle Variablen sind mehrfach nominal Einige Variablen sind nicht mehrfach nominal rAnzahl der Variablen Sets Ein Set Mehrere Sets rAusgew hlte Analyse Mehrfachkorrespondenzanalyse Kategoriale Hauptkomponenten Nichtlineare kanonische Korrelation W hlen Sie im Gruppenfeld Messniveau der optimalen Skalierung die Option Einige Variablen sind nicht mehrfach nominal Klicken Sie auf Definieren Abbildung 10 22 Dialogfeld Kategoriale Hauptkomponentenanalyse Analysevariablen E Zeit des Interviews ti E Diagnose diag Zeit Diagnose Wechse E Patienten Nummer nu E Diagnose diag2 Ft sh novi det Zusatzvariablen D Skala d
396. werte f r die Beispieluntersuchung Abbildung 11 13 Zusammenfassung der Analyse ae een Summe Yerlustfunktion Set1 Set2 Set 3 Mittelwert Eigenwert Anpassung Der Verlust wird auf die Dimensionen und Sets aufgeteilt Bei jeder Dimension und jedem Set bezeichnet der Verlust den Anteil an der Variation in den Objektwerten der nicht durch die gewichtete Kombination der Variablen im Set abgedeckt ist Der durchschnittliche Verlust wird als Mittelwert gekennzeichnet In diesem Beispiel liegt der durchschnittliche Verlust tiber die S tze bei 0 464 Beachten Sie dass in der zweiten Dimension h here Verluste auftreten als in der ersten Dimension Der Eigenwert f r jede Dimension ist gleich 1 minus dem durchschnittlichen Verlust f r die Dimension Dieser Wert gibt den Teil der Beziehung an der durch die einzelnen Dimensionen dargestellt wird Die Eigenwerte ergeben zusammengerechnet die Gesamtanpassung Bei den Daten nach Verdegaal werden 0 801 1 536 52 der tats chlichen Anpassung durch die erste Dimension erzielt Der maximale Anpassungswert ist gleich der Anzahl der Dimensionen Wird dieser Maximalwert erreicht bedeutet dies dass die Beziehung perfekt ist Der durchschnittliche Verlustwert ber die S tze und Dimensionen zeigt die Differenz zwischen der maximalen Anpassung und der tats chlichen Anpassung Die Summe aus Anpassung und durchschnittlichem Verlust ist gleich der Anzahl der Dimensionen Eine perfekte hnlichkeit li
397. wie Daten zum Kaufpreis von Fahrzeugen enth lt tree_credit sav Hierbei handelt es sich um eine hypothetische Datendatei die demografische Daten sowie Daten zu fr heren Bankkrediten enth lt tree_missing_data sav Hierbei handelt es sich um eine hypothetische Datendatei die demografische Daten sowie Daten zu fr heren Bankkrediten enth lt und eine gro e Anzahl fehlender Werte aufweist tree_score_car sav Hierbei handelt es sich um eine hypothetische Datendatei die demografische Daten sowie Daten zum Kaufpreis von Fahrzeugen enth lt tree_textdata sav Eine einfache Datendatei mit nur zwei Variablen die vor allem den Standardzustand von Variablen vor der Zuweisung von Messniveau und Wertelabels zeigen soll tv survey sav Hierbei handelt es sich um eine hypothetische Datendatei zu einer Studie die von einem Fernsehstudio durchgef hrt wurde das berlegt ob die Laufzeit eines erfolgreichen Programms verl ngert werden soll 906 Personen wurden gefragt ob sie das Programm unter verschiedenen Bedingungen ansehen w rden Jede Zeile entspricht einem Befragten jede Spalte entspricht einer Bedingung ulcer_recurrence sav Diese Datei enth lt Teilinformationen aus einer Studie zum Vergleich der Wirksamkeit zweier Therapien zur Vermeidung des Wiederauftretens von Geschw ren Es stellt ein gutes Beispiel f r intervallzensierte Daten dar und wurde an anderer Stelle Collett 2003 vorgestellt und analysiert ulcer_recurrence_recode
398. y y Klicken Sie im Dialogfeld Kategoriale Regression auf Diagramme 143 Kategoriale Regression Abbildung 9 53 Dialogfeld Diagramme EH Kategoriale Regression Diagramme Transformationsdiagramme e Residuen Diagramme eter _ aerecnen ture W hlen Sie doy f r die Transformationsdiagramme aus gt Klicken Sie auf Weiter gt Klicken Sie im Dialogfeld Kategoriale Regression auf OK Abbildung 9 54 Modellzusammenfassung f r die kategoriale Zusammenfassung von Daily ozone level ber Day of the year Offensichtlich er Korrigiertes vorhersagefe Multiples R R Quadrat R Quadrat hler Abh ngige Variable Daily ozone level Einflussvariable Day of the year Bei der Regression mit optimaler Skalierung wird Daily ozone level als numerisch behandelt und Day of the year als nominal Dies f hrt zu einem Wert von 0 549 f r R Obwohl nur 55 der Variation bei Daily ozone level in der kategorialen Regression beriicksichtigt sind ist dies eine deutliche Verbesserung gegen ber der urspr nglichen Regression Wenn Sie Day of the year transformieren kann Daily ozone level vorhergesagt werden 144 Kapitel 9 Abbildung 9 55 Transformationsdiagramm von Day of the year nominal Transformation Day ofthe year Quantifikationen oO w Q O o N 00 72 1 00 00 ZE 00 E 00 75 00 Er 00 72 00 E9 00 76 00 E8 Q 00 ZLL 00 EO 00 ZEL OD EZ 00 ZSL
399. year Quantification TRA2_3 als x Achsen Variable Klicken Sie auf OK 146 Kapitel 9 Abbildung 9 57 Streudiagramm der transformierten Variablen Daily ozone level Quantifikation 2 00 1 00 0 00 1 00 2 00 Day ofthe year Quantifikation Diese Abbildung zeigt die Beziehungen zwischen den transformierten Variablen Die umgekehrte U Form wird durch einen steigenden Trend ersetzt Die Regressionslinie besitzt eine positive Steigung dies weist darauf hin dass der vorhergesagte Wert f r Daily ozone level steigt wenn die transformierte Variable Day ofthe year ansteigt Die Beziehung wird mithilfe der optimalen Skalierung linearisiert sodass Interpretationen m glich sind die ansonsten unbemerkt geblieben w ren Empfohlene Literatur In folgenden Texten finden Sie weitere Informationen zur kategorialen Regression Buja A 1990 Remarks on functional canonical variates alternating least squares methods and ACE Annals of Statistics 18 Hastie T R Tibshirani als auch A Buja 1994 Flexible discriminant analysis Journal of the American Statistical Association 89 Hayashi C 1952 On the prediction of phenomena from qualitative data and the quantification of qualitative data from the mathematico statistical point of view Annals of the Institute of Statitical Mathematics 2 Kruskal J B 1965 Analysis of factorial experiments by estimating monotone transformations of the data Journal of the Royal Sta
400. yse individuell anpassen indem Sie die Auswahl in ein Syntax Fenster einf gen und die daraus resultierende Befehlssyntax f r PROXSCAL bearbeiten Mit der Befehlssyntax Sprache verf gen Sie au erdem ber folgende M glichkeiten Geben Sie eigene Variablenlisten f r Transformationen und Residuen Diagramme an mit dem Unterbefehl PLOT Geben Sie eigene Quelllisten f r individuelle Raumgewichtungen Transformationen und Residuen Diagramme an mit dem Unterbefehl PLOT Geben Sie eine Untergruppe der Transformationsdiagramme f r unabh ngige Variablen an die angezeigt werden sollen mit dem Unterbefehl PLOT Vollst ndige Informationen zur Syntax finden Sie in der Command Syntax Reference Kapitel Multidimensionale Entfaltung PREFSCAL In der Prozedur Multidimensionale Entfaltung wird versucht eine gemeinsame quantitative Skala zu finden mit der Sie die Beziehung zwischen zwei Gruppen von Objekten visuell untersuchen k nnen Beispiele Sie haben 21 Personen geben 15 Fr hst cksartikel in der Vorzugsreihenfolge von 1 bis 15 zu ordnen Mit der Prozedur Multidimensionale Entfaltung k nnen Sie ermitteln dass die Personen die Fr hst cksartikel in erster Linie auf zwei Arten unterscheiden zwischen Wei und Vollkornbrot und zwischen kalorienhaltigen und armen Artikeln In einer anderen Umfrage haben Sie eine Gruppe von Fahrern gebeten 26 Fahrzeugmodelle anhand von 10 Attributen auf einer 6 Punkte Skala von
401. zanalyse 57 Cronbachs Alpha in der Kategorialen Hauptkomponentenanalyse 154 DeSarbos Indizes f r Vermischung in Multidimensionale Entfaltung 275 278 284 291 300 Deskriptive Statistik in Kategoriale Regression 24 Diagramme des gemeinsamen Raums in Multidimensionale Entfaltung 95 in Multidimensionale Skalierung 84 Diagramme des individuellen Raums in Multidimensionale Entfaltung 95 in Multidimensionale Skalierung 84 Diagramme f r mehrere Starts in Multidimensionale Entfaltung 95 Diagramme f r Raumgewichtungen in Multidimensionale Entfaltung 95 Diagramme mit individuellen Raumgewichtungen in Multidimensionale Entfaltung 95 Index in Multidimensionale Skalierung 84 Diagramme mit projizierten Zentroiden in der Kategorialen Hauptkomponentenanalyse 41 Dimensionen in der Korrespondenzanalyse 54 229 Dimensionsgewichtungen in Multidimensionale Entfaltung 286 293 Diskretisierung bei der Mehrfachkorrespondenzanalyse 63 in der Kategorialen Hauptkomponentenanalyse 32 in Kategoriale Regression 19 Diskriminationsma Diagramme bei der Mehrfachkorrespondenzanalyse 70 Diskriminationsma e bei der Mehrfachkorrespondenzanalyse 67 242 Distanzen in Multidimensionale Entfaltung 97 in Multidimensionale Skalierung 86 Distanzma e in der Korrespondenzanalyse 54 Drei Weg Entfaltung in Multidimensionale Entfaltung 279 Eigenwerte in der Ka
402. zten Beispiel wird eine Distanztabelle in einer mehrdimensionalen Skalierung verwendet Normalisierung Bei der Normalisierung wird die Tr gheit ber die Zeilen und Spaltenwerte gestreut Einige Aspekte der Korrespondenzanalysenl sung z B die Singul rwerte die Tr gheit pro Dimension und die Beitr ge bleiben bei den verschiedenen Normalisierungsmethoden unver ndert Die Zeilen und Spaltenwerte und die zugeh rigen Varianzen werden von der nderung erfa t Die Tr gheit wird bei der Korrespondenzanalyse auf verschiedene Weise gestreut Die drei h ufigsten Verfahren streuen die Tr gheit nur ber die Zeilenwerte nur ber die Spaltenwerte oder symmetrisch ber Zeilen und Spaltenwerte Zeilenprinzipal Bei der Zeilenprinzipal Normalisierung n hern sich die Euklidischen Distanzen zwischen den Zeilenpunkten den Chi Quadrat Distanzen zwischen den Zeilen der Korrespondenztabelle Die Zeilenwerte entsprechen dem gewichteten Durchschnitt der Spaltenwerte Die Spaltenwerte werden so standardisiert dass eine gewichtete Summe der quadrierten Distanzen zum Zentroid 1 entsteht Bei dieser Methode werden die Distanzen zwischen den Zeilenkategorien maximiert Wenn Sie haupts chlich ermitteln m chten wie sich die Kategorien der Zeilenvariable voneinander unterscheiden sollten Sie daher die Zeilenprinzipal Normalisierung verwenden Spaltenprinzipal Unter Umst nden sollen die Chi Quadrat Distanzen zwischen den Spalten der Korrespondenztabel
Download Pdf Manuals
Related Search
Related Contents
Leia este manual antes de funcionar o motor. • Siga as instruções 1 - Canon ドリームインキュベータ(4310) MULTISOL EXTRA PLUS Mode d`emploi simplifié du système d`acquisition Synchronie Copyright © All rights reserved.
Failed to retrieve file