Die Funktion „Autovervollständigung“ wurde in der chinesischen Informatik geboren

-


Dies ist ein Auszug aus Der chinesische Computer: Eine globale Geschichte des Informationszeitalters von Thomas S. Mullaney, veröffentlicht am 28. Mai bei The MIT Press. Es wurde leicht bearbeitet.

ymiw2

klt4

pwyy1

wdy6

o1

dfb2

wdv2

fypw3

uet5

dm2

dlu1…

Ein junger Chinese saß an seiner QWERTZ-Tastatur und gab eine rätselhafte Folge von Buchstaben und Zahlen ein.

War es ein Code? Ein Kinderspiel? Eine Verwirrung? Er war Chinese.

Zumindest der Beginn des Chinesischen. Diese 44 Schläge markierten die ersten Schritte von ein Prozess, der als „Eingabe“ oder bekannt ist Shuru: der Vorgang, bei dem chinesische Schriftzeichen mithilfe einer QWERTZ-Tastatur oder eines Touchpads auf dem Monitor eines Computers oder eines anderen digitalen Geräts angezeigt werden.


Bilder aus einem Screencast des chinesischen Input-Wettbewerbs 2013. MIT FREUNDLICHER GENEHMIGUNG VON MIT PRESS

In allen Computer- und digitalen Medien ist die Eingabe chinesischer Texte auf Programmierprogramme angewiesen. Software bekannt als „Eingabemethoden-Editoren“, besser bekannt als „IME“ oder einfach „Eingabemethoden“ (Shurufa). IMEs sind eine Form von „Middleware“, so genannt, weil sie zwischen den operieren Hardware des Geräts des Benutzers und der Software Ihres Programms oder Ihrer Anwendung. Ob es darum geht, ein chinesisches Dokument in Microsoft Word zu verfassen, im Internet zu suchen, Textnachrichten zu senden oder irgendetwas anderes, ein IME ist immer am Werk, fängt alle Tastenanschläge des Benutzers ab und versucht herauszufinden, welche chinesischen Zeichen er erzeugen möchte. Der Eintrag ist, einfach ausgedrückt, das Wie ymiw2klt4pwyy …wird in eine Zeichenfolge chinesischer Schriftzeichen umgewandelt.

IMEs sind ruhelose Wesen. Sobald Sie eine Taste drücken oder einen Strich verschieben, einen dynamischen und iterativen Prozess initiieren, sammelt die vom Benutzer eingegebenen Daten und durchsucht den Speicher des Computers nach möglichen Übereinstimmungen mit chinesischen Schriftzeichen. Die beliebtesten IMEs basieren heute auf der chinesischen Phonetik, das heißt, sie verwenden die Buchstaben des lateinischen Alphabets, um den Klang chinesischer Schriftzeichen zu beschreiben, während Betreiber auf dem chinesischen Festland das offizielle Umschriftsystem des Landes, Hanyu Pinyin, verwenden.

Eine Reihe von Screenshots des Popup-Menüs des chinesischen Eingabemethoden-Editors, die den Schreibvorgang zeigen (抄袭 / „Plagiat“).
Beispiel für ein Popup-Menü des Eingabemethoden-Editors auf Chinesisch (抄袭 / „Plagiat“). Mit freundlicher Genehmigung von MIT PRESS

Dieser junge Mann war Huang Zhenyu (auch bekannt unter seinem Pseudonym Yu Shi). Er war einer von etwa 60 Teilnehmern an diesem Tag, jeder mit einer leuchtend roten Schärpe auf der Schulter, wie bei einer Tickerparade aus alten Zeiten oder einem Schönheitswettbewerb. Auf einem Schild an der Vorderseite des Raumes stand in Goldgelb „Love Chinese Characters“.Ai Hanzi). Die Aufgabe der Teilnehmer bestand darin, eine Rede des scheidenden chinesischen Präsidenten Hu Jintao so schnell und genau wie möglich zu transkribieren. „Lasst uns die große Flagge des Sozialismus chinesischer Prägung hochhalten“, begann es, oder im Original: 高举中国特色社会主义伟大旗帜为夺取全面建设小康社会新胜利而奋斗. Allerdings erlaubte Huangs QWERTY-Tastatur nicht, diese Zeichen direkt einzugeben, sodass er die Buchstaben- und Zahlenfolge stattdessen fast wie Kauderwelsch eingab: ymiw2klt4pwyy1wdy6

Mit diesen vier Dutzend Tastenanschlägen war Huang auf dem besten Weg, den Nationalen Wettbewerb zum Schreiben chinesischer Schriftzeichen 2013 nicht nur zu gewinnen, sondern auch zu erreichen eine der schnellsten Schreibgeschwindigkeiten, die jemals gemessen wurdenüberall auf der Welt.

ymiw2klt4pwyy1wdy6 …nicht dasselbe wie 高举中国特色社会主义… Die Tasten, die Huang tatsächlich auf seiner QWERTZ-Tastatur drückte – seine „primäre Transkription“, wie wir sie nennen könnten – unterschieden sich völlig von den Symbolen, die schließlich auf dem Bildschirm erschienen. seinem Computer, also dem „sekundären Transkript“ von Hu Jintaos Rede. Dies gilt für jeden einzelnen der weltweit über eine Milliarde chinesischsprachigen Computernutzer. Beim chinesischen Rechnen ist das, was man eintippt, nie das, was man bekommt.

Für Leser, die mit der Textverarbeitung und dem Rechnen auf Englisch vertraut sind, dürfte dies eine Überraschung sein. Wenn ich zum Beispiel den Absatz, den Sie gerade lesen, mit einem Keylogger vergleichen würde, der genau anzeigt, welche Tasten ich gedrückt habe, um ihn einzugeben, wäre die Übung (gelinde ausgedrückt) nicht aufschlussreich. „Für -_- die -_- gewohnten -_- Leser …“, würde ich sagen (ich verzeihe etwaige Tipp- oder Bearbeitungsfehler). Beim Tippen in der englischen Sprache und bei der Computereinführung, Die Primär- und Sekundärtranskriptionen einer Schreibkraft sind im Prinzip identisch. Die Symbole auf den Tasten und auf dem Bildschirm sind identisch.

Das Gleiche gilt nicht für die chinesische Informatik. Bei der Eingabe von Chinesisch unterscheiden sich die Symbole, die eine Person auf einer QWERTZ-Tastatur sieht, immer von den Symbolen, die letztendlich auf dem Monitor oder auf dem Papier erscheinen. Jeder einzelne Benutzer von Computern und neuen Medien in der sinophonen Welt – egal ob extrem schnell oder extrem langsam – nutzt seine Geräte genauso wie Huang Zhenyu, ständig in diesen iterativen Prozess vertieft Kriterien-Kandidatur-Bestätigung, mit dem einen oder anderen IME. Nicht einige chinesischsprachige Benutzer, aber alle. Dies ist das erste und grundlegendste Merkmal der chinesischen Informatik: die chinesische Mensch-Computer-Interaktion (HCI). erfordert, dass Benutzer jederzeit vollständig im Code arbeiten.

Wenn Huang Zhenyus Beherrschung eines komplexen alphanumerischen Codes nicht beeindruckend genug wäre, bedenken Sie die erstaunliche Geschwindigkeit seiner Leistung. Er transkribierte die ersten 31 chinesischen Schriftzeichen von Hu Jintaos Rede in etwa fünf Sekunden, mit einer hochgerechneten Geschwindigkeit von 372 chinesischen Schriftzeichen pro Minute. Am Ende des anstrengenden 20-minütigen Wettbewerbs, der Tausende von Zeichen umfasste, überquerte er die Ziellinie mit einer schier unglaublichen Geschwindigkeit von 221,9 Zeichen pro Minute.

Das sind 3,7 chinesische Schriftzeichen pro Sekunde.

Im englischen Kontext hätten Huangs erste fünf Sekunden etwa 375 englischen Wörtern pro Minute entsprochen, und seine Gesamtgeschwindigkeit im Wettbewerb überstieg leicht 200 Wörter pro Minute, ein halsbrecherisches Tempo, das von niemandem im englischsprachigen Raum erreicht wurde (zumindest nicht mit QWERTY). Im Jahr 1985 erreichte Barbara Blackburn einen vom Guinness-Buch der Rekorde von 170 englischen Wörtern pro Minute (auf einer Schreibmaschine nicht weniger). Später übertraf der Geschwindigkeitsdämon Sean Wrona Blackburns Marke mit einer Leistung von 174 Wörtern pro Minute (auf einer Computertastatur, das sollte beachtet werden). So beeindruckend diese Meilensteine ​​auch sind, die Wahrheit ist, dass, wenn Huangs Auftritt im englischsprachigen Raum stattgefunden hätte, sein Name darin verankert wäre Guinness-Buch der Rekorde als die neue Marke, die es zu schlagen gilt.

Huangs Geschwindigkeit hatte auch eine besondere historische Bedeutung.

Für eine Person, die zwischen 1850 und 1950 lebte – dem Zeitraum, der im Buch analysiert wird Die Schreibmaschine China– wäre die Idee, Chinesisch auf maschinellem Wege mit einer Geschwindigkeit von mehr als 200 Zeichen pro Minute zu produzieren, nahezu unvorstellbar gewesen. In der gesamten Geschichte der chinesischen Telegrafie, die bis in die 1870er Jahre zurückreicht, erreichten die Telegrafen maximal ein paar Dutzend Zeichen pro Minute. In der Blütezeit des chinesischen Tippens, in den 1920er bis 1970er Jahren, betrugen die höchsten aufgezeichneten Geschwindigkeiten nur 80 Zeichen pro Minute (die meisten Schreibkräfte arbeiteten mit viel langsameren Geschwindigkeiten). Im Hinblick auf moderne Informationstechnologien, d.h. Chinesisch war durchweg eines der langsamsten Schriftsysteme der Welt.

Was hat sich geändert? Wie kommt es, dass das Schreiben, das so lange als umständlich und wirkungslos komplex abgetan wurde, plötzlich mit der Schreibgeschwindigkeit von Computern in anderen Teilen der Welt konkurrierte oder diese sogar übertraf? Selbst wenn wir akzeptieren, dass chinesische Computerbenutzer irgendwie in der Lage sind, in „Echtzeit“ zu programmieren, sollten chinesische IMEs nicht zu einer niedrigeren Gesamt-„Obergrenze“ für die chinesische Textverarbeitung im Vergleich zu Englisch führen? Schließlich müssen chinesische Benutzer in einem umständlichen, mehrstufigen Prozess noch viel mehr Hürden überwinden: Der IME muss die Tastatureingaben des Benutzers abfangen, den Speicher nach einer Übereinstimmung durchsuchen, mögliche Kandidaten präsentieren und auf die Bestätigung des Benutzers warten. Mittlerweile drücken englischsprachige Computerbenutzer einfach die Taste, die sie auf dem Bildschirm gedruckt sehen möchten. Was könnte einfacher sein als die „Unmittelbarkeit“ von „Q ist gleich Q“, „W ist gleich W“ usw.?

Tom Mullaney
Mit freundlicher Genehmigung von TOM MULLANEY

Um dieses scheinbare Paradox zu entschlüsseln, werden wir den ersten chinesischen Computer untersuchen, der jemals entwickelt wurde: den Sinotype, auch bekannt als Ideographic Composition Machine. Diese Maschine wurde 1959 von MIT-Professor Samuel Hawks Caldwell und der Graphic Arts Research Foundation vorgestellt und verfügte über eine QWERTZ-Tastatur, mit der der Bediener nicht die phonetischen Werte der chinesischen Schriftzeichen eingab, sondern die Striche, aus denen sie zusammengesetzt waren. Chinesische Charaktere. Das Ziel von Sinotype bestand nicht darin, chinesische Zeichen auf der Seite zu „aufbauen“, so wie ein Benutzer englische Wörter durch sukzessives Hinzufügen von Buchstaben bildet. Stattdessen, Jeder „buchstabierte“ Strich diente als elektronische Adresse, die die Sinotype-Logikschaltung nutzte, um ein chinesisches Zeichen aus dem Gedächtnis abzurufen.. Mit anderen Worten: Der allererste chinesische Computer stützte sich auf die gleichen „zusätzlichen Schritte“, die in Huang Zhenyus preisgekrönter Leistung aus dem Jahr 2013 zu sehen waren.

Während Caldwells Forschungen entdeckte er unerwartete Vorteile all dieser zusätzlichen Schritte, Vorteile, die im damaligen Kontext der anglophonen Mensch-Maschine-Interaktion völlig unbekannt waren. Der Sinotyp, entdeckt, Ich brauchte dafür viel weniger Tastenanschläge finden ein chinesisches Schriftzeichen im Gedächtnis, das stehen bleibt komponieren eine über herkömmliche Registrierungswege. Analog dazu dauerte das „Buchstabieren“ eines neunbuchstabigen Wortes wie „Krokodil“ viel länger als das Abrufen desselben Wortes aus dem Gedächtnis („Kokod“), damit ein Computer schließlich eine eindeutige Übereinstimmung herstellen konnte, da keine anderen Wörter vorhanden waren mit ähnlicher oder identischer Schreibweise). Caldwell nannte seine Entdeckung „minimale Rechtschreibung“ und machte sie zu einem wesentlichen Bestandteil des ersten chinesischen Computers, der gebaut wurde.

Heute kennen wir diese Technik unter einem anderen Namen: „Autovervollständigung“, eine Mensch-Computer-Interaktionsstrategie, bei der zusätzliche Vermittlungsebenen entstehen eine schnellere Texteinführung als der „unvermittelte“ Akt des Tippens. Jahrzehnte vor ihrer Wiederentdeckung im englischsprachigen Raum wurde die Autovervollständigung im chinesischen Computerwesen erfunden.

-