Was ist Unicode?
In Computersystemen werden Zeichen umgewandelt und als Zahlen gespeichert, die vom Prozessor verarbeitet werden können. Eine Codepage ist ein Schema, das eine bestimmte Bitfolge auf ihre Zeichendarstellung abbildet. In der Vor-Unicode-Welt gab es Hunderte von verschiedenen Codierungsschemata, die jedem Buchstaben oder Zeichen eine Zahl zuwiesen. Viele dieser Schemata enthielten Codepages, die nur 256 Zeichen enthielten – jedes Zeichen benötigte 8 Bit Speicherplatz. Dies war zwar relativ kompakt, reichte jedoch nicht aus, um ideografische Zeichensätze mit Tausenden von Zeichen aufzunehmen, und erlaubte auch nicht die Koexistenz der Zeichensätze vieler Sprachen.
Unicode ist ein Versuch, all die verschiedenen Schemata in einem universellen Standard zusammenzufassen.
Die Bedeutung von Unicode
Unicode stellt einen Mechanismus zur Unterstützung verbreiteter Kodierungssysteme dar – wie z.B. die ISO-8859-Varianten in Europa, Shift-JIS in Japan oder BIG-5 in China.
Aus der Sicht der Übersetzung/Lokalisierung ist Unicode ein wichtiger Schritt in Richtung Standardisierung, zumindest aus Sicht des Dateiformats.
Der Unicode-Standard
Der Unicode-Standard ist der universelle Zeichenkodierungsstandard, der für die Darstellung von Text für die Computerverarbeitung verwendet wird.
Versionen des Unicode-Standards sind vollständig kompatibel und synchronisiert mit den entsprechenden Versionen des internationalen Standards ISO/IEC 10646, der die Zeichenkodierung definiert.
Unicode ist jedoch ein Standardschema zur Darstellung von einfachem Text – es ist kein Schema zur Darstellung von Rich-Text.