1 символ комп'ютерного алфавіту «важить» 8 бітів.
UTF–8, порівняно з UTF-16, найбільший виграш у компактності дає для текстів на латиниці, оскільки латинські літери без діакритичних знаків, цифри та найпоширеніші розділові знаки кодуються в UTF–8 лише одним байтом, і коди цих символів відповідають їх кодам ASCII.
к. 256 = 2 ^ 8, то вага 1 символу – 8 біт. Цей вага можна сприймати як розрядність двійкового слова. Тобто двійковий код кожного символу у комп'ютерному тексті займає 1 байт пам'яті (або 8 біт).
Розширена ASCII дозволяє використовувати всі 8 біт для кодування. У таблиці Unicode використовується 2 байти, тому можна сказати, що 1 символ у комп'ютері займає 1 або 2 байти.