Unicode Transformation Format 8-bit (UTF-8)

8-bit Unicode Transformation Format is een manier om Unicode/ISO 10646-tekens op te slaan als een stroom van bytes, een zogenaamde tekencodering.

UTF-8 is een tekencodering met een variabele lengte: niet elk teken gebruikt evenveel bytes. Afhankelijk van het teken worden tussen 1 en 4 bytes gebruikt. Voor het vastleggen van elk van de 128 ASCII-tekens is slechts één byte nodig.

Hoewel het niet efficiënt lijkt om Unicodetekens in 4 bytes te moeten coderen, is het zo dat UTF-8 eenvoudig in gebruik is omdat de codering van een tekst met uitsluitend ASCII-tekens in ASCII en UTF-8 gelijk is.

UTF-8 maakt deel uit van DE BASIS.

Status in Nederlandse kwaliteitszorgsysteem


Status: DE BASIS
Versie: 5.0
Open standaard: ja
Erfgoedsector: Generiek
Geschikt voor archivering: Ja
Soort: Standaard
Registernummer: C.02.01.11.02

beheer en documentatie

beherende organisatie

Unicode Consortium

documentatie

rfc3629 Unicode Standard




Reacties (0)

Er zijn nog geen reacties geplaatst.