|
MARC |
Datei-Selektion |
ScreenShot des Marc-Fensters zur Datei-Selektion
Nach dem Starten des Programms erscheint das Marc-Fenster zur Auswahl der
Daten-Datei (siehe oben). Zunächst wird hier das Daten-Format behandelt, da es
die Eingabe-Felder erklärt.
Daten-Format
Die Daten werden als Matrix erwartet. Jede Zeile besteht aus gleich vielen
<TAB>ulator-getrennten Zellen und wird mit einem Zeilenende-Zeichen
(System-abhängig, z.B. <CR>) abgeschlossen.
Die erste Zeile darf eine Beschreibung der Variablen enthalten; dies muss
durch das Flag variable line im Marc-Fenster deklariert werden.
Die erste Spalte jeder Zeile darf eine Transaktions-ID enthalten; dies muss
durch das Flag ID column im Marc-Fenster deklariert werden. Falls eine Variablen-Zeile vorhanden ist, muss auch diese eine ID-Zelle beinhalten!
Numerische Daten
gibt es nicht in MARC!
Alle Daten werden als Text behandelt, auch wenn sie numerisch aussehen.
Fliesskomma-Zahlen sind zwar möglich, werden aber ebenfalls als Text behandelt;
die Werte 1, 1.0 und 1.00 sind daher drei verschiedene
Kategorien. Wenn eine Variable 'echte' numerische Werte enthält (nicht nur die
anonymisierte Darstellung von Text-Kategorien), sollte der Datensatz zuvor
bearbeitet werden; die Liste zur Auswahl der Variablen und Kategorien wird
sonst etwa genauso lang wie der Datensatz Transaktionen (=Zeilen) hat.
Eingabe-Felder
- data file
- Hier geben Sie den Namen der Datei an, die ihre zu analysierenden Daten
enthält. Ein Datei-Selektions-Fenster gibt es vorläufig nicht: zuviel Aufwand
für zuwenig Nutzen.
- variable line
- Wenn Ihre Daten in der ersten Zeile eine kurze Beschreibung (z.B. Namen)
der Variablen tragen, so ist dieses Flag zu aktivieren.
- field delimiter
- Ihre Daten werden als Character Separated Values erwartet, d.h.
die einzelnen Zellen einer Zeile werden durch ein Spezial-Zeichen voneinander
getrennt. Oft ist dies der Tabulator, aber auch das Semikolon ist dafür
üblich. In diesem Feld können Sie das Trennzeichen definieren; vorgegeben
ist der Tabulator.
Anmerkung: Manche Systeme machen es schwer, diesen vordefinierten
Tabulator zu sehen oder selbst einen einzutragen; in diesem Fall bleibt es
Ihrer Geduld oder Systemerfahrung überlassen, einen Ausweg zu finden.
Spätere MARC-Versionen können vielleicht '\t' verstehen; diese kann es nicht.
- pre-defined missings: global
- Wenn eine Kategorie in allen Variablen als Missing Value
interpretiert werden soll, so können Sie diese Kategorie hier eintragen.
Sie können auch mehrere Kategorien eintragen, die dann durch das o.g.
Trennzeichen getrennt sein müssen.
Achtung: Für MARC ist jedes Leerzeichen oder sonstiger
WhiteSpace signifikant!
- pre-defined missings: binary
- Wenn eine Kategorie in allen binären (=zweiwertigen) Variablen
als Missing Value interpretiert werden soll, so können Sie diese
Kategorie hier eintragen. Weiteres wie oben.
- pre-defined missings: var cat
- Hier können Sie beliebig viele Variablen-Kategorien-Paare
(wie oben getrennt) angeben, die ebenfalls als Missings interpretiert werden.
- read
- Dieser Knopf löst das Einlesen Ihrer Daten aus. Die vorhandenen Variablen,
ihre Kategorien und die Anzahl der Transaktionen werden bestimmt und ein
Compute-Fenster erzeugt.
|