Seriennummern

Motivation

Seriennummern sind herkömmlicherweise lĂ€ngere Zeichenketten, ursprĂŒnglich reine Ziffernketten, zuweilen aber auch alphanumerische Zeichenketten. Eine strikte Folge sukzessiv um 1 inkrementierter Nummern ist dabei meistens gar nicht erforderlich (und oft auch nicht in aller Strenge durchgehalten).

Sie kommen an verschiedenen Stellen vor, an denen einzelne Exemplare einer Fertigungsserie eindeutig gekennzeichnet werden mĂŒssen, da sie identifizierbar und unterscheidbar sein sollen.

Dies betrifft zunĂ€chst physische Produkte. Bei nicht-physischen Produkten wie Software handelt es sich bei der umgangssprachlich zuweilen auch als „Seriennummer“ bezeichneten Zeichenketten meistens um einen Lizenzkey, der anderen Zwcken dient (auf die diese Prinzipien aber weitgehend ebenso anwendbar wĂ€ren).

Wo die Seriennummern lediglich automatisiert ausgelesen und verwaltet werden, ist das Zahlenformat natĂŒrlich gĂŒnstig.

FĂŒr den menschlichen Benutzer sind solche Seriennummern jedoch ausgesprochen unhandlich zu verwenden. Sie sind schwer zu merken und auch ein Vertippen oder falsches Erinnern kann der Mensch in der Regel nicht direkt selbst erkennen (sondern erst eine nachgeschaltete rechnergestĂŒtzte Plausibilisierung deckt Fehler auf, sofern redundante Information wie eine PrĂŒfziffer enthalten sein sollte). Seriennummern sind auch schwer einem Kollegen mĂŒndlich zu ĂŒbermitteln oder zu reproduzieren (schriftlich oder anderweitig).

Seriennummern könnten jedoch auch so gestaltet werden, daß sie diese Nachteile vermeiden oder zumindest stark verringern. Dazu kann auf natĂŒrliche Sprache zurĂŒckgegriffen werden.

Grundidee

Anstelle einer Seriennummer „736273932“ wird eine Wortfolge der Art „rot Hemd Biene“ als Seriennummer verwendet. Die Wörter der Wortfolge entstammen dabei einem festen und eindeutig festgelegten Wörterbuch.

Der Anwender des GerĂ€ts kann sich die Wortfolge bedeutend leichter merken und diese leichter reproduzieren als er dies bei einer Ziffernfolge könnte. Zudem entdeckt er geringfĂŒgige Fehler leicht („Wetteer“) und korrigiert diese selbstĂ€ndig.

Dabei ist ein großes Wörterbuch vorteilhaft, weil die Anzahl der Wörter als Basis der Potenzierung die Anzahl der möglichen Wortfolgen einer beschrĂ€nkten LĂ€nge bestimmt.

AusfĂŒhrungsvarianten

WortlÀngen

Dabei ist es natĂŒrlich sinnvoll, die Wörter im Wörterbuch so zu wĂ€hlen, daß sie möglichst kurz sind. Das beschleunigt das manuelle Eintippen durch den Benutzer und spart Platz beim eventuellen GehĂ€useaufdruck.

Unterscheidbarkeit

Die Wörter können so gewĂ€hlt werden, daß sie sich möglichst deutlich unterscheiden. So sollten „rot“ und „tot“ eher nicht beide im Wörterbuch aufgefĂŒhrt sein.

Eine mögliche unerwĂŒnschte Ähnlichkeit kann sowohl in der Aussprache auftreten („malen“/„mahlen“), als auch in der Schreibweise („rot“/„tot“) oder der Grammatik („bin“/„ist“).

Bedeutungstragende Wörter

Vorteilhaft sollte auch sein, anstelle von abstrakten Konzepten („Frieden“, „eßbar“) konkrete, bedeutungstragende Wörter zu verwenden, die GegenstĂ€nde der physischen Umwelt bezeichnen.

So könnten „Vogel“ oder „Baum“ geeignet sein.

Bilder

Wenn man solche Beschreibungen konkreter GegenstÀnde gewÀhlt hat, dann können diese nicht nur textuell als Wort, sondern auch als (gegebenenfalls vereinfachte) Abbildung des jeweiligen Gegenstands dargestellt werden (sowohl in Konfigurationsprogrammen als auch beim im GehÀusedruck).

Die Eingabe durch den Benutzer muß dann natĂŒrlich sinnvollerweise als beschreibendes Wort erfolgen.

Ein weiterer Vorteil könnte darin liegen, daß der Benutzer die Seriennummer nicht stumpf abschreibt, sondern von bildlicher Form in textuelle Form ĂŒbertragen muß, wodurch ein Mindestmaß an intellektueller Anwesenheit und Beteiligung notwendig ist. Durch gesteigerte Aufmerksamkeit könnte er bei wichtigen Dingen (Safety) möglicherweise leichter Fehler vermeiden.

SprachabhÀngigkeit und Lokalisierung

Eine sprachliche Darstellung einer Seriennumer ist natĂŒrlich zwangslĂ€ufig sprachgebunden.

Wenn der Benutzer aufgefordert ist, eine Seriennummer vom GerĂ€t selbst zu reproduzieren, beispielsweise, indem er sie in ein Konfigurationsprogramm eintippt, um sicherzustellen, daß er das richtige GerĂ€t konfiguriert, dann kann sich eine bildliche Darstellung wie oben beschrieben anbieten.

Denn wenn die Darstellung anhand solcher Bilder und Zeichnungen erfolgt, dann kann beispielsweise das Bild eines Baums angezeigt werden, das Konfigurationsprogramm kann jedoch „tree“, „Baum“ und „trĂ€d“ allesamt als gĂŒltige Benutzereingabe akzeptieren, oder je nach Spracheinstellung auch nur das passende Wort.

SelbstverstĂ€ndlich kann auch fĂŒr sonstige Zwecke eine „Übersetzung“ der Wortfolge in andere Sprachen nicht nur die Benutzerfreundlichkeit verbessern, sondern auch deshalb vorteilhaft sein, weil die Muttersprache stets zuverlĂ€ssiger beherrscht wird als Fremdsprachen.

Klassenbildung

Auch kann eine Kategorisierung oder Klassenbildung der GerĂ€te ausgedrĂŒckt werden, indem eigene TeilwörterbĂŒcher pro Klasse verwendet werden. So könnten Safety-GerĂ€te beispielsweise stets mit einem Tier anfangen, Nicht-Safety-GerĂ€te jedoch mit einer Pflanze.

Positionale EinschrÀnkung

Die Wörter des Wörterbuchs können mit EinschrĂ€nkungen bezĂŒglich ihres Auftretens in der Wortfolge annotiert sein. So könnte festgelegt werden, daß die Wortfolgen stets von der Form „Adjektiv Substantiv“ sind. Oder daß bestimmte Teile des Wörterbuchs nur am Anfang, andere nur am Ende stehen.

GrammatikalitÀt

Neben den hier aufgefĂŒhrten Beispielen sind auch weitere denkbar. Entscheidend ist, möglichst nahe an einen grammatischen Satz heranzukommen.

Satzstruktur

Das Merken solcher Wortfolgen wird bedeutend erleichtert, wenn die Wortfolge einen Satz bildet und sich an die allgemeinen syntaktischen Regeln der Sprache hĂ€lt. So könnten im Deutschen „Subjekt Verb“ oder „Subjekt Verb Objekt“ als Regeln beachtet werden.

Statt „rot Hemd Biene“ im Beispiel weiter oben wĂ€re also „Biene trĂ€gt rotes Hemd“ oder Ă€hnliches besser.

Kasuskongruenz

Auch weitere grammatikalische Regeln können beachtet werden. „rot Hemd“ ist aufgrund fehlender Kasuskongruenz bei weitem ungĂŒnstiger als „rotes Hemd“. Grammatische SĂ€tze sind besser zu merken als ungrammatische. Denn letztere laufen stets Gefahr, vom Menschen unbewußt korrigiert zu werden.

Dabei können „rote“ und „rotes“ als zwei unterschiedliche Wörter betrachtet werden, die sich sinnvollerweise (der Unterscheidung Ă€hnlicher Wörter wegen) jedoch in zueinander disjunkten TeilwörterbĂŒchern befinden (nĂ€mlich jeweils mit ihren zugehörigen Substantiven).

Oder man betrachtet beide Wörter als morphologische Varianten des Wortstamms „rot“, der zur Ein- und Ausgabe passend dekliniert wird, aber logisch nur einen einzigen Eintrag im Wörterbuch belegt.

Kodierung fĂŒr Benutzerzwecke

Die Seriennummer muß nicht zwingend umgestellt werden, man kann auch eine konventionelle Seriennummer durch eine bijektive Abbildung auf eine Wortfolge abbilden. Der Anwender sieht in seinen Konfigurationstools und Protokollen dann stets die Wortfolge, intern maßgeblich bleibt jedoch die konventionelle Seriennummer.

Die Abbildung muß nicht zwingend bijektiv sein. InjektivitĂ€t reicht aus und kann vorteilhaft sein: so beispielsweise im Beispiel der SprachunabhĂ€ngigkeit bildlicher Darstellungen.

KompatibilitÀt mit bestehendem Umfeld

Bestehende DV-Systeme oder organisatorische Prozesse, die Ziffernfolgen als Seriennummern erwarten, können befriedigt werden, indem eine solche Abbildung von Wortfolgen auf Ziffernfolgen (oder umgekehrt) angewendet wird.

Am einfachsten wÀre wohl, Zifferngruppen auf jeweils ein Wort abzubilden, aber auch andere Schemata sind denkbar.

Welche ReprĂ€sentation „die echte“ ist, muß zumindest solange nicht diskutiert werden, wie die genutzte Abbildung bijektiv ist, weil dann kein Unterschied feststellbar ist.

Linguistischer Hintergrund

Auch wenn Chomskys Vorstellung einer Universalgrammatik und eines ‘language acquisition device’ ausgesprochen strittig sind, so dĂŒrfte doch offensichtlich sein, daß der Mensch sich darauf spezialisiert hat, SprachĂ€ußerungen zu verarbeiten, sich zu merken und zu reproduzieren. Wesentliche Teile der „Ausbildung“ in den ersten Lebensjahren sind darauf ausgerichtet.

Auch daß der Umgang mit der eigenen Muttersprache leichter fĂ€llt als mit einer Fremdsprache dĂŒrfte klar sein.

Interessanterweise gibt es auch physiologische Evidenz fĂŒr diese groben Regeln.

So kann das Gehirn auf Sprachlaute (beliebiger Sprachen) schneller reagieren als auf andere Schallquellen und GerÀusche.

Auch die Muttersprache wird favorisiert: Sprachlaute aus der eigenen Muttersprache werden in anderen Hirnarealen verarbeitet als Sprachlaute anderer Sprachen.

BezĂŒglich der Unterscheidbarkeit von Wörtern muß besonders auf Homonyme geachtet werden. Homophone („Wende“/„WĂ€nde“) sind dabei ziemlich problematisch, besonders bei verbaler Übermittlung (beispielsweise beim Zurufen der Seriennummer an einen Kollegen). Homographe („modern“, â€žĂŒbersetzen“) sind dagegen eher unschĂ€dlich.

Prior art

Das Grundprinzip, Zeichenketten in leichter merkbare Darstellungen zu ĂŒberfĂŒhren, ist natĂŒrlich schon alt. Einige Beispiele fallen mir dazu ein, sind jedoch jeweils anders gelagert.

Paßwortgeneratoren

Paßwortgeneratoren wie apg bieten oft eine Option, aussprechbare Paßwörter zu erzeugen. Dabei werden jedoch keine echten Wörter generiert, sondern lediglich Silben, die den phonotaktischen Regeln westlicher Sprachen (primĂ€r natĂŒrlich Englisch) in großen und ganzen entsprechen.

Diceware

Diceware ist eine Wortliste (ursprĂŒnglich Englisch, aber auch auf andere Sprachen „portiert“), durch die sichere Paßphrasen ausgewĂ€hlt werden können. Der Benutzer wĂŒrfelt mit fĂŒnf WĂŒrfeln und liest die zum gewĂŒrfelten Ergebnis passende Paßphrase ab, indem jedes WĂŒrfelergebnis (also eine Ziffernfolge mit fĂŒnf Ziffer von 1 bis 6) auf ein kurzes Wort abgebildet wird.

Das Diceware-Wörterbuch ist recht umfangreich (7776 Wörter), allerdings sind diese Wörter oftmals eher ungebrĂ€uchlich, AbkĂŒrzungen oder gar sinnlose Zeichenketten (die aber einigermaßen gut zu merken sind).

S/Key

S/Key oder „Lamport’s Scheme“ ist ein Verfahren, sich mittels Einmalpaßwörtern an einem Rechner zu authentisieren. Der Benutzer muß dabei eine 64-Bit-Zahl eingeben. Aus GrĂŒnden der Benutzerfreundlichkeit wird ihm jedoch stattdessen eine Paßphrase abverlangt, die mittels eines Wörterbuchs mit 2048 kurzen Wörtern aus dieser Zahl gebildet wurde.

Linguistische BeweggrĂŒnde zur Auswahl der Wörter sind dabei zumindest nicht öffentlich dokumentiert, auch sind solche nicht direkt ersichtlich.

PGPfone

PGPfone war ein kommerzielles Programm zum verschlĂŒsselten Telefonieren. Dabei mußten die GesprĂ€chspartner den jeweiligen Fingerabdruck ihrer öffentlichen SchlĂŒssel austauschen.

Da dies eben ĂŒber ein Telefonat funktionieren können sollte, wurde der Fingerabdruck auf eine Phrase abgebildet, die dann gesprochen werden konnte.

Dabei wurden recht ausfĂŒhrliche Betrachtungen phonetischer und phonologischer Natur angestellt, die im Benutzerhandbuch kurz, in zwei weiteren Papers jedoch ausfĂŒhrlicher beschrieben sind.