Mojibake

Mojibake (文字化け, pronunciato /modʑibake/) è il nome dei caratteri errati e illeggibili mostrati quando il software del computer non riesce a mostrare il testo correttamente. Quando si usano i computer, il testo viene codificato utilizzando una codifica di caratteri. Nel trasferimento, ogni carattere è sostituito dalla sua posizione (o numero) nella codifica. Per visualizzare nuovamente il carattere, la posizione viene nuovamente sostituita dal carattere. Quando la codifica originale non è specificata, un carattere diverso può essere usato quando il numero viene nuovamente sostituito con il carattere da visualizzare. Unicode è stato introdotto per risolvere questo problema: UTF-8 è in grado di codificare la maggior parte dei caratteri comuni in 2 byte.

Prima dell'introduzione di Unicode, venivano usate altre codifiche di caratteri. Per esempio, ISO-8859 contiene 15 codifiche diverse. Queste sono le stesse per i caratteri comunemente usati in inglese. Hanno diversi "blocchi" di "caratteri speciali", che sono archiviati in modo diverso per ogni codifica.



Ecco come può apparire un sito web se viene usata la codifica sbagliata dei caratteri.Zoom
Ecco come può apparire un sito web se viene usata la codifica sbagliata dei caratteri.

L'articolo di Wikipedia giapponese per Mojibake usa la codifica UTF-8. Questa schermata mostra come appare quando viene decodificato usando la codifica standard CP1252 di Windows.Zoom
L'articolo di Wikipedia giapponese per Mojibake usa la codifica UTF-8. Questa schermata mostra come appare quando viene decodificato usando la codifica standard CP1252 di Windows.

Origine della parola

Mojibake è una parola giapponese. La parola 文字化け ([moʥibake]) è composta da due parti. 文字 (moji) significa lettera, carattere. 化け (bake), dal verbo 化ける (bakeru), significa apparire sotto mentite spoglie, prendere la forma di, cambiare in peggio. Letteralmente, significa "mutazione del carattere".



Domande e risposte

D: Che cos'è il 'mojibake'?


R: Mojibake è il termine che indica i caratteri errati e illeggibili che appaiono quando il software del computer non riesce a visualizzare correttamente il testo.

D: Come viene codificato il testo quando si usa il computer?


R: Il testo viene codificato utilizzando una codifica di caratteri, dove ogni carattere viene sostituito dalla sua posizione o dal suo numero nella codifica.

D: Cosa succede quando la codifica originale non viene specificata durante il trasferimento del testo?


R: Quando la codifica originale non è specificata, può essere utilizzato un carattere diverso quando il numero viene sostituito con il carattere da visualizzare.

D: Che cos'è Unicode e come risolve questo problema?


R: Unicode è uno standard di codifica dei caratteri che può rappresentare la maggior parte dei caratteri in due byte. Risolve il problema dell'utilizzo di codifiche di caratteri diverse e garantisce la corretta visualizzazione dei caratteri.

D: Quali sono alcuni esempi di altre codifiche di caratteri utilizzate prima di Unicode?


R: ISO-8859 è un esempio di un'altra codifica di caratteri utilizzata prima di Unicode.

D: Quante codifiche diverse contiene ISO-8859?


R: ISO-8859 contiene 15 codifiche diverse.

D: I caratteri speciali in ISO-8859 sono gli stessi per tutte le codifiche?


R: No, i caratteri speciali in ISO-8859 sono archiviati in modo diverso per ogni codifica.

AlegsaOnline.com - 2020 / 2023 - License CC3