>> Elettronica Tecnologia >  >> Casa intelligente >> Vita intelligente

UTF 7 contro UTF 8

UTF-7 e UTF-8 sono entrambi tipi di Unicode Transformation Format, lo standard utilizzato per codificare caratteri Unicode a 16 bit come lettere internazionali e simboli speciali in un formato che può essere trasmesso attraverso sistemi a 7 o 8 bit. UTF-8 è il formato di codifica più comunemente usato, diffuso nelle pagine Web e in molti programmi di posta elettronica. UTF-7 fornisce la codifica per alcuni protocolli di posta elettronica che non funzionano con UTF-8.

Unicode

Unicode è uno standard internazionale per rappresentare i caratteri come numeri interi. Utilizza 16 bit per carattere contro i sette bit utilizzati da ASCII, il codice standard americano per lo scambio di informazioni. ASCII può riprodurre solo 128 caratteri contro i 65.000 caratteri univoci disponibili in Unicode. Questa gamma più ampia di caratteri rende Unicode più appropriato per le lingue dell'Asia orientale e altre con set di caratteri di grandi dimensioni, ma i caratteri Unicode devono essere codificati se devono essere trasmessi tramite canali a 7 o 8 bit.

UTF-8

UTF-8 è il formato di trasformazione universale più comune utilizzato per convertire i caratteri Unicode in segmenti a 8 bit per la trasmissione sul Web tramite e-mail o altri canali a 8 bit. Questo formato di codifica modifica ogni carattere Unicode in da uno a quattro ottetti, a seconda del valore intero del carattere Unicode, ed è molto efficiente per i documenti che utilizzano principalmente lettere che si trovano anche nel set di caratteri ASCII. UTF-8 tende a occupare più spazio rispetto alla codifica a byte singolo per gli alfabeti non occidentali.

UTF-7

UTF-7 è una variante speciale dell'Universal Transformation Format proposto per la prima volta a metà degli anni '90. È stato progettato per rappresentare il testo Unicode con una stringa di caratteri ASCII, producendo un metodo di codifica per e-mail più efficiente rispetto a UTF-8, oltre alla codifica stampabile tra virgolette necessaria per trasmettere su un percorso dati a 7 bit. L'uso della codifica UTF-7 riduce notevolmente la dimensione dei caratteri codificati.

Considerazioni

Sebbene UTF-7 sia più efficiente sui canali a 7 bit rispetto a UTF-8 più stampabile quotato, la maggior parte delle autorità, inclusi Internet Mail Consortium e Microsoft Developer Network, consiglia di utilizzare UTF-8 su UTF-7 quando possibile. Questo perché UTF-7 crea problemi di sicurezza e robustezza non presenti nel suo parente a 8 bit. L'IMC raccomanda inoltre che tutti i programmi di visualizzazione della posta creati dopo il 1 gennaio 1999 siano in grado di visualizzare la posta in UTF-8.


  1. Come programmare un convertitore RCA remoto
  2. Come accedere al BIOS del MacBook
  3. Come utilizzare la tastiera del Mac come dispositivo MIDI in Pro Tools
  4. Come risolvere un sistema audio surround Sony
  5. Come convertire le pagine Web in testo normale
  6. Come inserire simboli Unicode in Facebook