Байт – це найменша одиниця обробки інформації. За допомогою одного байта можна закодувати 28 =256 символів.
У кодуванні Unicode один символ займає 16 біт пам'яті, що відповідає 2 байтам (1 байт = 8 біт).
У сучасних обчислювальних системах байт складається з 8 біт і, відповідно, може приймати одне з 256 (від 0 до 255) різних значень (Станів, кодів).
Кодовий простір Хоча форма запису UTF-8 дозволяє кодувати до 221 (2097152) кодових позицій, було прийнято рішення використовувати лише 1112064 для сумісності з UTF-16. Втім, навіть цього на даний момент більш ніж достатньо — у версії 14.0 використовується всього 144 697 кодових позицій.