|
MARC |
Compute-Fenster |
ScreenShot eines Compute-Fensters
Nach Auswahl der Daten-Datei im
Marc-Fenster
wird diese gelesen und die Transaktionen analysiert.
Die Datei wird zweimal gelesen: im ersten Durchgang werden die Kategorien
der Variablen und die Anzahl der Transaktionen bestimmt, im zweiten werden
die Transaktionen kodiert.
Mit diesen Informationen wird die Variablen-Tabelle
erstellt, wie Sie sie oben als ScreenShot sehen.
Wie alle MARC-Tabellen können Sie auch
diese durch einen Maus-Klick in den Tabellen-Header sortieren
(Modifier SHIFT: aufsteigend; CTRL: nach Selektion) oder
Sammel-Selektieren (Modifier ALT oder META). Die letztere Funktion
ist für die beiden edierbaren Spalten missing und as Y
abgewandelt worden (siehe unten).
ScreenShot eines Compute-Fensters mit sortierter
Variablen-Tabelle
Elemente des Compute-Fensters
- Index
- Diese Spalte dient der eindeutigen Identifizierung in allen
Variablen-Tabellen des gleichen Datensatzes.
- Variable
- Kategorie
- Diese Felder sind Textfelder.
Im Beispiel-Datensatz sas.dat (der Name steht im Header des Fensters)
gibt es nur die Kategorien "0" und "1", was numerisch
aussieht, aber dennoch als Text behandelt wird.
- Missing
- In der Variablen-Tabelle können Sie durch Klick in das entsprechende Feld
dieser Spalte markieren, welche Variablen/Kategorien
als Missing Value gelten sollen.
Kategorien, die bereits im
Marc-Fenster als missing
deklariert sind, werden zu Beginn nicht angezeigt; durch Anhaken des
show Missings-Flags können Sie auch diese Werte sehen.
ScreenShot eines Compute-Fensters mit
Variablen-Tabelle incl. Missings
Anmerkung: das Missing-Markieren können Sie nur, wenn das
show Missings-Flag aktiviert ist; andernfalls würde jede angeklickte
Kategorie sofort aus der Tabelle verschwinden, was recht verblüffend wirkt.
In dieser Spalte verhält sich die Sammel-Selektion (ALT-Klick in den
Spalten-Header) anders, nämlich als Wert-Änderung für die selektierten Zeilen.
Mit zusätzlichem SHIFT-Modifier werden die Flags der selektierten Zeilen
gesetzt, mit zusätzlichem CTRL-Modifier werden sie gelöscht, und ohne
zusätzlichen Modifier (oder mit beiden) werden diese Flags umgeschaltet. Die
Selektion der Zeilen sollte zuvor in einer anderen (nicht-edierbaren) Spalte
vorgenommen werden.
Da -wie erwähnt- ein Editing nur bei aktiviertem show Missings-Flag
möglich ist, ist dieses Sammel-Editing auch nur dann aktiv; andernfalls ist das
Standard-Verhalten Sammel-Selektion eingeschaltet.
- as Y
- Bei der Regel-Berechnung werden nur jene Variablen/Kategorien im
Folgerungs-Teil zugelassen, deren as Y-Flag gesetzt ist. Dadurch
können auch bei geringen Werten für minimum Support oder
minimum Confidence in endlicher (Rechen-)Zeit Ergebnisse
(wenn auch nur für eine einzelne Variable) gewonnen werden. Diese
Spalte ist ebenso wie Missing edierbar, und zwar in gleicher Weise, also
auch mit Sammel-Editing (siehe oben). Die Selektion sollte dann zuvor in einer
anderen (nicht-edierbaren) Spalte vorgenommen werden.
- max rule level
- Hier tragen Sie ein, welchen Level die berechneten Regeln maximal haben
sollen (0=ohne Limit; absolute Obergrenze ist die Anzahl der Variablen).
- max rule count
- Hier tragen Sie ein, wieviele Regeln Sie maximal berechnen wollen
(0=ohne Limit).
Anmerkung: Regeln werden stets Level-weise berechnet. Wenn zu
Beginn der Level-Rechnung weniger Regeln als maximal erwünscht berechnet
sind, wird das gesamte nächste Level berechnet - sofern das maximale
Regel-Level dies zuläßt.
- minimum Support[%]
- Die Regeln müssen mindestens diesen Support haben.
Warnung: der Wert sollte strikt positiv sein und maximal 100.0
betragen. Beim Wert 0.0 werden alle Kategorien mit allen Kategorien aller
anderen Variablen zu Regeln verbunden, was i.a. sehr viele Regeln
ergeben wird und entsprechend lange dauert. Werte über 100.0 sind nicht
sinnvoll, da es sich um eine Prozent-Zahl handelt.
- minimum Confidence[%]
- Die Regeln müssen mindestens diese Konfidenz haben.
Die obige Warnung gilt hier analog.
- compute
- Dieser Knopf startet das Berechnen der Assoziationsregeln zu den
angegebenen Daten und Parametern und erzeugt ein
TwoKey-Fenster.
|