для кодирования строчных и прописных букв русского алфавита необходимо
Перевод текста в цифровой код.
Давайте разберемся как же все таки переводить тексты в цифровой код? Кстати, на нашем сайте вы можете перевести любой текст в десятичный, шестнадцатеричный, двоичный код воспользовавшись Калькулятором кодов онлайн.
Кодирование текста.
По теории ЭВМ любой текст состоит из отдельных символов. К этим символам относятся: буквы, цифры, строчные знаки препинания, специальные символы ( «»,№, (), и т.д.), к ним, так же, относятся пробелы между словами.
Необходимый багаж знаний. Множество символов, при помощи которых записываю текст, называется АЛФАВИТОМ.
Число взятых в алфавите символов, представляет его мощность.
Количество информации можно определить по формуле : N = 2b
Алфавит, в котором будет 256 может вместить в себя практически все нужные символы. Такие алфавиты называют ДОСТАТОЧНЫМИ.
Если взять алфавит мощностью 256, и иметь в виду что 256 = 28
Если перевести каждый символ в двоичный код, то этот код компьютерного текста будет занимать 1 байт.
Как текстовая информация может выглядеть в памяти компьютера?
Любой текст набирают на клавиатуре, на клавишах клавиатуры, мы видим привычные для нас знаки (цифры, буквы и т.д.). В оперативную память компьютера они попадают только в виде двоичного кода. Двоичный код каждого символа, выглядит восьмизначным числом, например 00111111.
Поскольку, байт – это самая маленькая адресуемая частица памяти, и память обращена к каждому символу отдельно – удобство такого кодирование очевидно. Однако, 256 символов – это очень удобное количество для любой символьной информации.
Естественно, встал вопрос: Какой конкретно восьми разрядный код принадлежит каждому символу? И как осуществить перевод текста в цифровой код?
Этот процесс условный, и мы вправе придумать различные способы для кодировки символов. Каждый символ алфавита имеет свой номер от 0 до 255. И каждому номеру присвоен код от 00000000 до 11111111.
Таблица для кодировки – это «шпаргалка», в которой указаны символы алфавита в соответствии порядковому номеру. Для различных типов ЭВМ используют разные таблицы для кодировки.
ASCII(или Аски), стала международным стандартом для персональных компьютеров. Таблица имеет две части.
Таблица кода символов ASCII.
Первая половина для таблицы ASCII. (Именно первая половина, стала стандартом.)
Соблюдение лексикографического порядка, то есть, в таблице буквы (Строчные и прописные) указаны в строгом алфавитном порядке, а цифры по возрастанию, называют принципом последовального кодирования алфавита.
Для русского алфавита тоже соблюдают принцип последовательного кодирования.
Сейчас, в наше время используют целых пять систем кодировок русского алфавита(КОИ8-Р, Windows. MS-DOS, Macintosh и ISO). Из-за количества систем кодировок и отсутствия одного стандарта, очень часто возникают недоразумения с переносом русского текста в компьютерный его вид.
Одним из первых стандартов для кодирования русского алфавита на персональных компьютерах считают КОИ8(«Код обмена информацией, 8-битный»). Данная кодировка использовалась в середине семидесятых годов на серии компьютеров ЕС ЭВМ, а со средины восьмидесятых, её начинают использовать в первых переведенных на русский язык операционных системах UNIX.
С начала девяностых годов, так называемого, времени, когда господствовала операционная система MS DOS, появляется система кодирования CP866 («CP» означает «Code Page», «кодовая страница»).
Гигант компьютерных фирм APPLE, со своей инновационной системой, под упралением которой они и работали (Mac OS), начинают использовать собственную систему для кодирования алфавита МАС.
Международная организация стандартизации (International Standards Organization, ISO)назначает стандартом для русского языка еще одну систему для кодирования алфавита, которая называется ISO 8859-5.
А самая распространенная, в наши дни, система для кодирования алфавита, придумана в Microsoft Windows, и называется CP1251.
С второй половины девяностых годов, была решена проблема стандарта перевода текста в цифровой код для русского языка и не только, введением в стандарт системы, под названием Unicode. Она представлена шестнадцатиразрядной кодировкой, это означает, что на каждый символ отводится ровно по два байта оперативной памяти. Само собой, при такой кодировке, затраты памяти увеличены в два раза. Однако, такая кодовая система позволяет переводить в электронный код до 65536 символов.
Специфика стандартной системы Unicode, является включением в себя абсолютно любого алфавита, будь он существующим, вымершим, выдуманным. В конечном счете, абсолютно любой алфавит, в добавок к этом, система Unicode, включает в себя уйму математических, химических, музыкальных и общих символов.
Давайте с помощью таблицы ASCII посмотрим, как может выглядеть слово в памяти вашего компьютера.
Очень часто случается так, что ваш текст, который написан буквами из русского алфавита, не читается, это обусловлено различием систем кодирования алфавита на компьютерах. Это очень распространенная проблема, которая довольно часто обнаруживается.
Представление информации в памяти компьютера (8-й класс)
Класс: 8
1 этап (теория) – представление урока в виде презентации
Для того чтобы сохранить на внешних носителях текстовый документ, созданный с помощью компьютера, он должен быть представлен двоичным кодом с помощью двух цифр – 0 и 1.
Самый удобный и понятный способ такого представления следующий:
1) записать алфавит;
2) пронумеровать все буквы по порядку;
3) номер буквы перевести в двоичную систему счисления;
4) составить таблицу соответствия символов двоичным или десятичным кодам.
Уже получилось 143 символа.
Чтобы закодировать такое количество символов необходимо не менее 8 бит (или 1 байт)
Теперь мы знаем, что для кодирования одного символа требуется один байт информации.
И так кодирование заключается в том, что каждому символу ставиться в соответствие уникальный двоичный код от 00000000 до 11111111 (или десятичный код от 0 до 255).
Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется кодовой таблицей.
Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера (коды), называется таблицей кодировки.
Для разных типов ЭВМ используются различные кодировки.
С распространением IBM PC международным стандартом стала таблица кодировки ASCII (American Standart Code for Information Interchange) – Американский стандартный код для информационного обмена.
Стандартной в этой таблице является только первая половина, т.е. символы с номерами от 0 (00000000) до 127 (0111111). Сюда входят буква латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.
Остальные 128 кодов используются в разных вариантах. Например, в русских кодировках размещаются символы русского алфавита.
Так же получил широкое распространение новый международный стандарт Unicode (Юникод), который отводит на каждый символ два байта. С его помощью можно закодировать 65 536 (216= 65 536) различных символов.
Решение задач
Пример1. Записать слово «stop» в двоичном и десятичном кодах.
Решение. Двоичный 001110011 01110100 01101111 01110000
Десятичный 115 116 111 112
Пример 2. Сколько бит памяти компьютера займет слово «Микропроцессор»?
Решение. Слово состоит из 14 букв. Каждая буква является символом компьютерного алфавита, поэтому занимает 1 байт памяти. Слово займет 14 байт (112 бит)
Пример 3. Текст занимает 0,25 Кбайт памяти компьютера, Сколько символов содержит этот текст?
Решение. 0,25 х 1024 = 256 (байт); 256 : 1 (байт) = 256 символов.
Пример 4. С помощью десятичных кодов зашифровано слово «stop» 115 116 111 112. Записать последовательность десятичных кодов для этого же слова, но записанного заглавными буквами.
Решение. При шифровке не обязательно пользоваться таблицей. Достаточно учесть, что разница между кодом строчных и прописных букв равна 32. 115 – 32 = 83; 116 – 32 = 84; 111 – 32 = 79; 112 – 32 = 80. Слову «STOP» соответствует последовательность кодов: 83 84 79 80.
Пример 5. Оценить информационный объем фразы, закодированной с помощью Юникода: Без труда не вытащишь и рыбку из пруда
Решение. В Юникоде 1 символ закодирован 2 байтами или 16 битами. Во фразе 38 символов (с учетом пробелов). В байтах – 38 х 2 = 76 байтов; в битах 38 х 16 = 608 бит.
Домашнее задание: Тема «Тексты в компьютерной памяти». Задание: Закодировать в двоичной форме свою фамилию, используя таблицу в учебнике.
Урок 2. Лабораторная работа
Цель: Познакомить учащихся с различными кодировками символов, используя текстовые редакторы.
Задача: Выполнить задания в различных текстовых приложениях
1. Текстовый редактор Блокнот
а) Используя клавишу Alt и малую цифровую клавиатуру раскодировать фразу: 145 170 174 224 174 255 170 160 173 168 170 227 171 235;
Технология выполнения задания: При удерживаемой клавише Alt, набрать на малой цифровой клавиатуре указанные цифры. Отпустить клавишу Alt, после чего в тексте появится буква, закодированная набранным кодом.
Ответ: скоро каникулы
б) Используя ключ к кодированию, закодировать слово – зима;
Технология выполнения задания: Из предыдущего задания выяснить, каким кодом записана буква а. Учитывая, что буквы кодируются в алфавитном порядке, выяснить коды остальных букв.
Ответ: 167 168 172 160
Что вы заметили при выполнении этого задания во время раскодировки? Запишите свои наблюдения.
Возможный вариант: в кодировочной таблице нет буквы ё.
2. Текстовый процессор MS Word.
Технология выполнения задания: рассмотрим на примере: представить в различных кодировках слово Кодировка
Задание: Открыть Word.
Используя окно «Вставка символа» выполнить задания: Закодировать слово Forest
а) Выбрать шрифт Courier New, кодировку ASCII(дес.) Ответ: 70 111 114 101 115 116
б) Выбрать шрифт Courier New, кодировку Юникод(шест.) Ответ: 0046 006F 0072 0665 0073 0074
в) Выбрать шрифт Times New Roman, кодировку Кирилица(дес.) Ответ: 70 111 114 101 115 116
г) Выбрать шрифт Times New Roman, кодировку ASCII(дес.) Ответ: 70 111 114 101 115 116
Вывод: _________________________________________________________
Ответ вывода: код символа не зависит от типа шрифта. Предлагаемые MS Word кодировки кодируют символы одинаково.
3. Составьте 3 варианта объявления о наборе группы обучения работе в Текстовых приложениях.
а) в Текстовом редакторе Блокнот
б) в Текстовом процессоре Word
в) в Издательской системе Publisher (публикация)
Ответьте на вопрос: в чем отличительные особенности (положительные и отрицательные) каждого из использованных приложений. Оформите ответ в виде вывода.
Вывод: __________________________________________________________
Ответ вывода: блокнот – положительное: простота использования, отрицательные: ограничение возможностей
Word положительное: множество возможностей, отрицательные: сложность использования Publisher положительное : множество профессиональных возможностей, отрицательные: необходимость определенных навыков работы и знаний
2 этап (практика) – Лабораторная работа «Представление текстовой информации в компьютере»
Практическая работа «Вставка символов в тексте» (Приложение 3)
Выполнение лабораторной работы оформить в виде таблицы:
Задание
Ответ
Выводы
код символа не зависит от типа шрифта. Предлагаемые MS Word кодировки кодируют символы одинаково
Тест, выполненный в MS Excel, содержит задания типа А и В для двух вариантов.
1. Буква Z имеет десятичный код 90, а z – 122. Записать слово «sport» в десятичном коде. Ответ: 115 112 111 114 116
2. С помощью десятичных кодов зашифровано слово «info» 105 110 102 111. Записать последовательность десятичных кодов для этого же слова, но записанного заглавными буквами. Ответ: 73 78 70 79
3. Текст занимает 0,5 Кбайт памяти компьютера, Сколько символов содержит этот текст? Ответ: 512
4. Сколько бит памяти компьютера займет слово «Антивирус»? Ответ: 72
5. Буква Б имеет код 193, а б – 295. Запишите через пробел коды букв Л и л. Ответ: 203 235
6. Оцените информационный объем фразы, закодированной с помощью Юникода: Делу время, потехе час Ответ: 352 бита
1. Буква Z имеет десятичный код 90, а z – 122. Записать слово «forma» в десятичном коде. Ответ: 102 111 114 109 97
2. С помощью десятичных кодов зашифровано слово «port» 112 111 114 116. Записать последовательность десятичных кодов для этого же слова, но записанного заглавными буквами. Ответ: 80 79 82 84
3. Текст занимает 0,75 Кбайт памяти компьютера, Сколько символов содержит этот текст? Ответ: 768
4. Сколько бит памяти компьютера займет слово «Информация»? Ответ: 80
5. Буква Я имеет код 223, а я – 255. Запишите через пробел коды букв Ш и ш. Ответ: 216 248
6. Оцените информационный объем фразы, закодированной с помощью Юникода: Делу время, потехе час Ответ: 44 байта
Для кодирования строчных и прописных букв русского алфавита необходимо
Тема: Вычисление информационного объема сообщения.
· с помощью K бит можно закодировать Q=2 k различных вариантов (чисел)
· таблица степеней двойки, она же показывает, сколько вариантов Q можно закодировать с помощью K бит:
· при измерении количества информации принимается, что в одном байте 8 бит, а в одном килобайте (1 Кбайт) – 1024 байта, в мегабайте (1 Мбайт) – 1024 Кбайта [i]
· чтобы найти информационный объем сообщения (текста) I, нужно умножить количество символов (отсчетов) N на число бит на символ (отсчет) K: I=N*K
· две строчки текста не могут занимать 100 Кбайт в памяти
· мощность алфавита M – это количество символов в этом алфавите
· если алфавит имеет мощность M, то количество всех возможных «слов» (символьных цепочек) длиной N (без учета смысла) равно Q=M N ; для двоичного кодирования (мощность алфавита M – 2 символа) получаем известную формулу: Q=2 N
Пример задания:
Для регистрации на сайте некоторой страны пользователю требуется придумать пароль. Длина пароля – ровно 11 символов. В качестве символов используются десятичные цифры и 12 различных букв местного алфавита, причём все буквы используются в двух начертаниях: как строчные, так и заглавные (регистр буквы имеет значение!).
Под хранение каждого такого пароля на компьютере отводится минимально возможное и одинаковое целое количество байтов, при этом используется посимвольное кодирование и все символы кодируются одинаковым и минимально возможным количеством битов.
Определите объём памяти, который занимает хранение 60 паролей.
1) 540 байт 2) 60 0 байт 3) 66 0 б ай т 4) 720 байт
1) согласно условию, в пароле можно использовать 10 цифр (0..9) + 12 заглавных букв местного алфавита + 12 строчных букв, всего 10 + 12 + 12 = 34 символа
2) для кодирования 34 символов нужно выделить 6 бит памяти (5 бит не хватает, они позволяют закодировать только 2 5 = 32 варианта)
3) для хранения всех 11 символов пароля нужно 11 × 6 = 66 бит
4) поскольку пароль должен занимать целое число байт, берем ближайшее большее (точнее, не меньшее) значение, которое кратно 8: это 72 = 9 × 8; то есть один пароль занимает 9 байт
5) тогда 60 паролей занимают 9 × 60 = 540 байт
· часто забывают, что пароль должен занимать ЦЕЛОЕ число байт
Ещё пример задания:
В велокроссе участвуют 119 спортсменов. Специальное устройство регистрирует прохождение каждым из участников промежуточного финиша, записывая его номер с использованием минимально возможного количества бит, одинакового для каждого спортсмена. Каков информационный объем сообщения, записанного устройством, после того как промежуточный финиш прошли 70 велосипедистов?
1) 70 бит 2) 70 байт 3) 490 бит 4) 119 байт
7) велосипедистов было 119, у них 119 разных номеров, то есть, нам нужно закодировать 119 вариантов
8) по таблице степеней двойки находим, что для этого нужно минимум 7 бит (при этом можно закодировать 128 вариантов, то есть, еще есть запас); итак, 7 бит на один отсчет
9) когда 70 велосипедистов прошли промежуточный финиш, в память устройства записано 70 отсчетов
10) поэтому в сообщении 70*7 = 490 бит информации (ответ 3).
· дано число, которое есть в условии (неверные ответы 70 бит, 70 байт, 119 байт), чтобы сбить случайное угадывание
· указано правильное число, но другие единицы измерения (мог быть вариант 490 байт)
· расчет на невнимательное чтение условия: можно не заметить, что требуется определить объем только 70 отсчетов, а не всех 119 (мог быть вариант 119*7=833 бита)
Еще пример задания:
Объем сообщения, содержащего 4096 символов, равен 1/512 части Мбайта. Какова мощность алфавита, с помощью которого записано это сообщение?
1) 8 2) 16 3) 4096 4) 16384
Большие числа. Что делать?
Обычно (хотя и не всегда) задачи, в условии которых даны большие числа, решаются достаточно просто, если выделить в этих числах степени двойки. На эту мысль должны сразу наталкивать такие числа как
Нужно помнить, что соотношение между единицами измерения количества информации также представляют собой степени двойки:
1 байт = 8 бит = 2 3 бит,
1 Кбайт = 1024 байта = 2 10 байта
= 2 10 · 2 3 бит = 2 13 бит,
1 Мбайт = 1024 Кбайта = 2 10 Кбайта
= 2 10 · 2 10 байта = 2 20 байта
= 2 20 · 2 3 бит = 2 23 бит.
Правила выполнения операций со степенями:
· при умножении степени при одинаковых основаниях складываются
· … а при делении – вычитаются:
1) в сообщении было 4096 = 2 12 символов
1/512 Мбайта = 2 23 / 512 бита = 2 23 / 2 9 бита = 2 14 бита (= 16384 бита!)
3) место, отведенное на 1 символ:
2 14 бита / 2 12 символов = 2 2 бита на символ = 4 бита на символ
4) 4 бита на символ позволяют закодировать 2 4 = 16 разных символов
5) поэтому мощность алфавита – 16 символов
6) правильный ответ – 2.
· дано число, которое есть в условии (неверный ответ 4096), чтобы сбить случайное угадывание
· расчет на то, что увидев «правильное» число в ходе вычислений, учащийся не будет доводить расчет до конца (неверный ответ 16384)
· легко запутаться, если выполнять вычисления «в лоб», не через степени двойки
Решение (вариант 2, предложен В.Я. Лаздиным):
1 /512 Мбайт = 1024 /512 Кбайт = 2 Кбайт = 2048 байт
2) на 1 символ приходится 2048 байт / 4096 = 1/2 байта = 4 бита
3) 4 бита на символ позволяют закодировать 2 4 = 16 разных символов
4) поэтому мощность алфавита – 16 символов
5) правильный ответ – 2.
· не всегда удобно работать с дробными числами (1/2 байта)
· метод разработан специально для этой задачи, где он хорошо работает; в других задачах может быть не так гладко
Еще пример задания:
В зоопарке 32 обезьяны живут в двух вольерах, А и Б. Одна из обезьян заболела. Сообщение «Заболевшая обезьяна живет в вольере А» содержит 4 бита информации. Сколько обезьян живут в вольере Б?
1) 4 2) 16 3) 28 4) 30
1) информация в 4 бита соответствует выбору одного из 16 вариантов, …
2) … поэтому в вольере А живет 1/16 часть всех обезьян (это самый важный момент!)
3) всего обезьян – 32, поэтому в вольере А живет
4) поэтому в вольере Б живут все оставшиеся
· неверный ответ 1 (4 обезьяны) сбивает случайное угадывание «в лоб», по исходным данным
· можно сделать неверный вывод о том, что в вольере А живет 4 обезьяны (столько же, сколько бит информации мы получили), следовательно, в вольере Б живут оставшиеся 28 обезьян (неверный ответ 3)
· после п. 1 можно сделать (неверный) вывод о том, что в вольере А живет 16 обезьян, следовательно, в вольере Б – тоже 16 (неверный ответ 2)
1) обезьяна-альбинос может жить в вольере А (событие 1) или в вольере Б (событие 2)
2) по формуле Шеннона количество информации в сообщении о произошедшем событии с номером i равно
3) у нас не было никакой предварительной информации о том, где живет альбинос, поэтому можно считать, что вероятность определяется количеством обезьян в вольере – если вероятность равна 1/16, то в вольере живет 1/16 часть всех обезьян:
6) поэтому в вольере Б живут все оставшиеся
7) правильный ответ – 4.
Еще пример задания:
В корзине лежат 32 клубка шерсти, из них 4 красных. Сколько бит информации несет сообщение о том, что достали клубок красной шерсти?
1) красные клубки шерсти составляют 1/8 от всех, …
2) поэтому сообщение о том, что первый вынутый клубок шерсти – красный, соответствует выбору одного из 8 вариантов
3) выбор 1 из 8 вариантов – это информация в 3 бита (по таблице степеней двойки)
4) правильный ответ – 2.
Решение (вариант 2, использование формулы Шеннона):
1) красные клубки шерсти составляют 1/8 от всех, поэтому вероятность pk того, что первый вынутый клубок шерсти – красный, равна 1/8
2) по формуле Шеннона находим количество информации в битах:
3) правильный ответ – 2.
Еще пример задания:
В некоторой стране автомобильный номер длиной 7 символов составляется из заглавных букв (всего используется 26 букв) и десятичных цифр в любом порядке. Каждый символ кодируется одинаковым и минимально возможным количеством бит, а каждый номер – одинаковым и минимально возможным количеством байт. Определите объем памяти, необходимый для хранения 20 автомобильных номеров.
1) 20 байт 2) 105 байт 3) 120 байт 4) 140 байт
1) всего используется 26 букв + 10 цифр = 36 символов
3) таким образом, на каждый символ нужно 6 бит (минимально возможное количество бит)
4) полный номер содержит 7 символов, каждый по 6 бит, поэтому на номер требуется 6*7=42 бита
5) по условию каждый номер кодируется целым числом байт (в каждом байте – 8 бит), поэтому требуется 6 байт на номер (5*8=40
6) на 20 номеров нужно выделить 20*6=120 байт
7) правильный ответ – 3.
· неверный ответ 1 (20 байт) сбивает случайное угадывание «в лоб», по исходным данным
· если не обратить внимание на то, что каждый номер кодируется целым числом БАЙТ, получаем неверный ответ 2 (20*42=105*8 бит = 105 байт)
· если по невнимательности считать, что каждый СИМВОЛ кодируется целым числом байт, получаем 7 байт на символ и всего 140 байт (неверный ответ 4)
· если «забыть» про цифры, получим всего 26 символов, 5 бит на символ, 35 бит (5 полных байт) на каждый номер и неверный ответ 100 байт (на 20 номеров)
Еще пример задания:
Какое наименьшее число символов должно быть в алфавите, чтобы при помощи всевозможных трехбуквенных слов, состоящих из символов данного алфавита, можно было передать не менее 9 различных сообщений?
1) здесь используется только одна формула: если алфавит имеет мощность M, то количество всех возможных «слов» длиной N равно Q=M N
2) в данном случае нужно закодировать 9 сигналов (Q>=9) с помощью трехбуквенных слов (N=3)
3) таким образом, нужно найти наименьшее целое M, такое что Q=M 3 >= 9 (куб числа не меньше 9)
5) таким образом, правильный ответ – 3.
· нас интересуют только трехбуквенные слова (одно- и двухбуквенные слова учитывать не нужно)
Еще пример задания:
Каждая ячейка памяти компьютера, работающего в троичной системе счисления, может принимать три различных значения (-1, 0, 1). Для хранения некоторой величины отвели 4 ячейки памяти. Сколько различных значений может принимать эта величина?
1) непривычность этой задачи состоит в том, что используется троичная система
2) фактически мы имеем дело с языком, алфавит которого содержит M=3 различных символа
3) поэтому количество всех возможных «слов» длиной N равно Q=3 N
4) для N= 4 получаем Q=3 4 =81
5) таким образом, правильный ответ – 81.
· если не осознать, что используется троичная (а не двоичная!) система, можно «по инерции» получить неправильный ответ
Еще пример задания:
В школьной базе данных хранятся записи, содержащие информацию об учениках:
– 16 символов: русские буквы (первая прописная, остальные строчные),
– 12 символов: русские буквы (первая прописная, остальные строчные),
– 16 символов: русские буквы (первая прописная, остальные строчные),
– числа от 1992 до 2003.
Каждое поле записывается с использованием минимально возможного количества бит. Определите минимальное количество байт, необходимое для кодирования одной записи, если буквы е и ё считаются совпадающими.
1) 28 2) 2 9 3) 46 4) 56
1) очевидно, что нужно определить минимально возможные размеры в битах для каждого из четырех полей и сложить их;
2) важно! известно, что первые буквы имени, отчества и фамилии – всегда заглавные, поэтому можно хранить их в виде строчных и делать заглавными только при выводе на экран (но нас это уже не волнует)
3) таким образом, для символьных полей достаточно использовать алфавит из 32 символов (русские строчные буквы, «е» и «ё» совпадают, пробелы не нужны)
4) для кодирования каждого символа 32-символьного алфавита нужно 5 бит (32 = 2 555 5 ), поэтому для хранения имени, отчества и фамилии нужно (16 + 12 + 16)•5=220 бит
5) для года рождения есть 12 вариантов, поэтому для него нужно отвести 4 бита (2 4 = 16 ≥ 12)
6) таким образом, всего требуется 224 бита или 28 байт