EN FR DE ES PT
Encoder Toolbox Logo Encoder Toolbox

Unicode-Escape-Konverter

Text in Unicode-Escape-Sequenzen (\uXXXX) umwandeln oder Unicode-Escapes zurueck in lesbare Zeichen dekodieren. Unterstuetzt JavaScript \uXXXX, erweitertes \UXXXXXXXX und U+XXXX Notationsformate. Die gesamte Verarbeitung erfolgt lokal in Ihrem Browser.

Text zu Unicode-Escapes

Beliebigen Text in \uXXXX Unicode-Escape-Sequenzen umwandeln (JavaScript-Stil).

Unicode-Escapes zu Text

\uXXXX-, \UXXXXXXXX- oder U+XXXX-Escape-Sequenzen zurueck in lesbare Zeichen dekodieren.

So funktioniert es

Unicode-Escape-Sequenzen stellen Zeichen durch ihren numerischen Codepunkt in Hexadezimal dar. In JavaScript verwendet das \uXXXX-Format vier Hex-Ziffern, um Zeichen in der Basic Multilingual Plane (U+0000 bis U+FFFF) zu kodieren. Zum Beispiel repraesentiert \u0041 den Buchstaben "A" und \u00E9 repraesentiert "e" mit Akzent.

Zeichen ausserhalb der BMP (wie Emoji) erfordern Surrogatpaare -- zwei \uXXXX-Sequenzen, die zusammen ein einzelnes Zeichen identifizieren. Das \UXXXXXXXX-Format verwendet acht Hex-Ziffern und kann jeden Unicode-Codepunkt direkt darstellen. Die U+XXXX-Notation ist die Standardmethode, um auf Codepunkte in der Unicode-Dokumentation zu verweisen.

Dieses Tool verarbeitet automatisch alle drei Formate und konvertiert zwischen lesbarem Text und ihren Escape-Sequenz-Darstellungen vollstaendig in Ihrem Browser, ohne Daten an einen Server zu senden.

Haeufige Anwendungsfaelle

  • JavaScript-Quellcode: Nicht-ASCII-Zeichen in JS-Dateien einbetten, die rein ASCII-sicher bleiben muessen.
  • JSON-Zeichenketten: Sonderzeichen in JSON-Payloads fuer plattformuebergreifende Kompatibilitaet escapen.
  • Kodierungsprobleme debuggen: Die genauen Codepunkte von Zeichen untersuchen, um verzerrten Text oder Mojibake zu diagnostizieren.
  • Internationalisierung (i18n): Mit mehrsprachigen Zeichenketten arbeiten und die korrekte Zeichendarstellung verifizieren.
  • Dokumentation: Bestimmte Unicode-Codepunkte mit der Standard-U+XXXX-Notation referenzieren.

Haeufig gestellte Fragen

Was sind Unicode-Escape-Sequenzen?

Unicode-Escape-Sequenzen sind eine Moeglichkeit, Unicode-Zeichen mit ASCII-Text darzustellen. In JavaScript verwendet das Format \uXXXX vier hexadezimale Ziffern, um den Codepunkt eines Zeichens darzustellen. Zum Beispiel repraesentiert \u0041 den Buchstaben "A" und \u00E9 repraesentiert "e" mit Akzent.

Welche Unicode-Escape-Formate werden unterstuetzt?

Dieses Tool unterstuetzt drei gaengige Formate: \uXXXX (JavaScript-Stil mit 4 Hex-Ziffern), \UXXXXXXXX (erweitertes Format mit 8 Hex-Ziffern fuer ergaenzende Zeichen) und U+XXXX (Unicode-Notation fuer Dokumentation und Spezifikationen).

Warum muesste ich Text in Unicode-Escapes umwandeln?

Unicode-Escapes sind nuetzlich, wenn Sie Sonderzeichen in Quellcode einfuegen muessen, der nur ASCII unterstuetzt, beim Debuggen von Kodierungsproblemen, bei der Arbeit mit internationalisierten Zeichenketten in JavaScript oder JSON, oder beim Dokumentieren bestimmter Unicode-Codepunkte.

Wie werden Zeichen ausserhalb der Basic Multilingual Plane behandelt?

Zeichen ausserhalb der BMP (Codepunkte ueber U+FFFF), wie z.B. Emoji, werden als Surrogatpaare mit zwei \uXXXX-Sequenzen im JavaScript-Format kodiert. Das Tool behandelt diese Umwandlung automatisch in beide Richtungen.

Verwandte Tools