EN FR DE ES PT
Encoder Toolbox Logo Encoder Toolbox

Conversor de Escape Unicode

Converta texto para sequências de escape Unicode (\uXXXX) ou decodifique escapes Unicode de volta para caracteres legíveis. Suporta formatos JavaScript \uXXXX, estendido \UXXXXXXXX e notação U+XXXX. Todo o processamento acontece localmente no seu navegador.

Texto para Escapes Unicode

Converta qualquer texto em sequências de escape Unicode \uXXXX (estilo JavaScript).

Escapes Unicode para Texto

Decodifique sequências de escape \uXXXX, \UXXXXXXXX ou U+XXXX de volta para caracteres legíveis.

Como Funciona

Sequências de escape Unicode representam caracteres pelo seu code point numérico em hexadecimal. No JavaScript, o formato \uXXXX usa quatro dígitos hex para codificar caracteres no Plano Multilíngue Básico (U+0000 a U+FFFF). Por exemplo, \u0041 representa a letra "A" e \u00E9 representa "e" com acento agudo.

Caracteres fora do BMP (como emojis) requerem pares substitutos -- duas sequências \uXXXX que juntas identificam um único caractere. O formato \UXXXXXXXX usa oito dígitos hex e pode representar qualquer code point Unicode diretamente. A notação U+XXXX é a forma padrão de se referir a code points na documentação Unicode.

Esta ferramenta lida com todos os três formatos automaticamente, convertendo entre texto legível e suas representações em sequências de escape inteiramente no seu navegador, sem nenhum dado enviado para qualquer servidor.

Casos de Uso Comuns

  • Código-fonte JavaScript: Incorpore caracteres não-ASCII em arquivos JS que devem permanecer seguros para ASCII.
  • Strings JSON: Escape de caracteres especiais em payloads JSON para compatibilidade multiplataforma.
  • Depuração de problemas de codificação: Inspecione os code points exatos dos caracteres para diagnosticar texto ilegível ou mojibake.
  • Internacionalização (i18n): Trabalhe com strings multilíngues e verifique a representação correta dos caracteres.
  • Documentação: Referencie code points Unicode específicos usando a notação padrão U+XXXX.

Perguntas Frequentes

O que são sequências de escape Unicode?

Sequências de escape Unicode são uma forma de representar caracteres Unicode usando texto ASCII. No JavaScript, o formato \uXXXX usa quatro dígitos hexadecimais para representar o code point de um caractere. Por exemplo, \u0041 representa a letra "A" e \u00E9 representa "e" com acento agudo.

Quais formatos de escape Unicode são suportados?

Esta ferramenta suporta três formatos comuns: \uXXXX (estilo JavaScript com 4 dígitos hex), \UXXXXXXXX (formato estendido com 8 dígitos hex para caracteres suplementares) e U+XXXX (notação Unicode usada em documentação e especificações).

Por que eu precisaria converter texto para escapes Unicode?

Escapes Unicode são úteis quando você precisa incluir caracteres especiais em código-fonte que suporta apenas ASCII, ao depurar problemas de codificação, ao trabalhar com strings internacionalizadas em JavaScript ou JSON, ou ao documentar code points Unicode específicos.

Como os caracteres fora do Plano Multilíngue Básico são tratados?

Caracteres fora do BMP (code points acima de U+FFFF), como emojis, são codificados como pares substitutos usando duas sequências \uXXXX no formato JavaScript. A ferramenta lida automaticamente com essa conversão em ambas as direções.

Ferramentas Relacionadas