EN FR DE ES PT
Encoder Toolbox Logo Encoder Toolbox

Convertisseur Unicode

Convertissez du texte en séquences d'échappement Unicode (\uXXXX) ou décodez des séquences Unicode en caractères lisibles. Supporte les formats JavaScript \uXXXX, étendu \UXXXXXXXX et la notation U+XXXX. Tout le traitement s'effectue localement dans votre navigateur.

Texte vers échappements Unicode

Convertissez n'importe quel texte en séquences d'échappement Unicode \uXXXX (style JavaScript).

Échappements Unicode vers texte

Décodez les séquences d'échappement \uXXXX, \UXXXXXXXX ou U+XXXX en caractères lisibles.

Comment ça fonctionne

Les séquences d'échappement Unicode représentent les caractères par leur point de code numérique en hexadécimal. En JavaScript, le format \uXXXX utilise quatre chiffres hexadécimaux pour encoder les caractères du Plan Multilingue de Base (U+0000 à U+FFFF). Par exemple, \u0041 représente la lettre "A" et \u00E9 représente le "e" avec accent aigu.

Les caractères en dehors du BMP (comme les emoji) nécessitent des paires de substitution -- deux séquences \uXXXX qui identifient ensemble un seul caractère. Le format \UXXXXXXXX utilise huit chiffres hexadécimaux et peut représenter directement n'importe quel point de code Unicode. La notation U+XXXX est la manière standard de référencer les points de code dans la documentation Unicode.

Cet outil gère automatiquement les trois formats, convertissant entre le texte lisible et leurs représentations en séquences d'échappement entièrement dans votre navigateur, sans aucune donnée envoyée à un serveur.

Cas d'utilisation courants

  • Code source JavaScript : Intégrez des caractères non-ASCII dans des fichiers JS qui doivent rester compatibles ASCII.
  • Chaînes JSON : Échappez les caractères spéciaux dans les charges utiles JSON pour la compatibilité multiplateforme.
  • Débogage des problèmes d'encodage : Inspectez les points de code exacts des caractères pour diagnostiquer le texte altéré ou le mojibake.
  • Internationalisation (i18n) : Travaillez avec des chaînes multilingues et vérifiez la représentation correcte des caractères.
  • Documentation : Référencez des points de code Unicode spécifiques en utilisant la notation standard U+XXXX.

Questions fréquemment posées

Que sont les séquences d'échappement Unicode ?

Les séquences d'échappement Unicode sont un moyen de représenter des caractères Unicode en utilisant du texte ASCII. En JavaScript, le format \uXXXX utilise quatre chiffres hexadécimaux pour représenter le point de code d'un caractère. Par exemple, \u0041 représente la lettre "A" et \u00E9 représente le "e" avec accent aigu.

Quels formats d'échappement Unicode sont supportés ?

Cet outil supporte trois formats courants : \uXXXX (style JavaScript avec 4 chiffres hexadécimaux), \UXXXXXXXX (format étendu avec 8 chiffres hexadécimaux pour les caractères supplémentaires), et U+XXXX (notation Unicode utilisée dans la documentation et les spécifications).

Pourquoi aurais-je besoin de convertir du texte en échappements Unicode ?

Les échappements Unicode sont utiles lorsque vous devez inclure des caractères spéciaux dans du code source qui ne supporte que l'ASCII, lors du débogage de problèmes d'encodage, lorsque vous travaillez avec des chaînes internationalisées en JavaScript ou JSON, ou pour documenter des points de code Unicode spécifiques.

Comment sont gérés les caractères en dehors du Plan Multilingue de Base ?

Les caractères en dehors du BMP (points de code au-dessus de U+FFFF), comme les emoji, sont encodés sous forme de paires de substitution en utilisant deux séquences \uXXXX au format JavaScript. L'outil gère automatiquement cette conversion dans les deux sens.

Outils connexes