Unicode Transformation Format 8-bit (UTF-8)
8-bit Unicode Transformation Format is een manier om Unicode/ISO 10646-tekens op te slaan als een stroom van bytes, een zogenaamde tekencodering.
UTF-8 is een tekencodering met een variabele lengte: niet elk teken gebruikt evenveel bytes. Afhankelijk van het teken worden tussen 1 en 4 bytes gebruikt. Voor het vastleggen van elk van de 128 ASCII-tekens is slechts één byte nodig.
Hoewel het niet efficiënt lijkt om Unicodetekens in 4 bytes te moeten coderen, is het zo dat UTF-8 eenvoudig in gebruik is omdat de codering van een tekst met uitsluitend ASCII-tekens in ASCII en UTF-8 gelijk is.
UTF-8 maakt deel uit van DE BASIS.
Status in Nederlandse kwaliteitszorgsysteem
Status: DE BASIS
Versie: 5.0
Open standaard: ja
Erfgoedsector: Generiek
Geschikt voor archivering: Ja
Soort: Standaard
Registernummer: C.02.01.11.02
beheer en documentatie
beherende organisatie
Unicode Consortiumdocumentatie
rfc3629 Unicode Standardprojecten
De volgende projecten maken gebruik van deze standaard:
Biografisch Portaal Nederland De Postzegel Experience Digitale rondgang door de bakkerij Digitaliseren, bron van kennis- en informatieoverdracht Geallieerde Collecties Prentencollectie TU Delft Schatten van het NAi

