придумайте собственный способ кодирования букв русского алфавита
Кодирование для чайников, ч.1
Не являясь специалистом в обозначенной области я, тем не менее, прочитал много специализированной литературы для знакомства с предметом и прорываясь через тернии к звёздам набил, на начальных этапах, немало шишек. При всём изобилии информации мне не удалось найти простые статьи о кодировании как таковом, вне рамок специальной литературы (так сказать без формул и с картинками).
Статья, в первой части, является ликбезом по кодированию как таковому с примерами манипуляций с битовыми кодами, а во второй я бы хотел затронуть простейшие способы кодирования изображений.
0. Начало
Давайте рассмотрим некоторые более подробно.
1.1 Речь, мимика, жесты
1.2 Чередующиеся сигналы
В примитивном виде кодирование чередующимися сигналами используется человечеством очень давно. В предыдущем разделе мы сказали про дым и огонь. Если между наблюдателем и источником огня ставить и убирать препятствие, то наблюдателю будет казаться, что он видит чередующиеся сигналы «включено/выключено». Меняя частоту таких включений мы можем выработать последовательность кодов, которая будет однозначно трактоваться принимающей стороной.
1.3 Контекст
2. Кодирование текста
Текст в компьютере является частью 256 символов, для каждого отводится один байт и в качестве кода могут быть использованы значения от 0 до 255. Так как данные в ПК представлены в двоичной системе счисления, то один байт (в значении ноль) равен записи 00000000, а 255 как 11111111. Чтение такого представления числа происходит справа налево, то есть один будет записано как 00000001.
Итак, символов английского алфавита 26 для верхнего и 26 для нижнего регистра, 10 цифр. Так же есть знаки препинания и другие символы, но для экспериментов мы будем использовать только прописные буквы (верхний регистр) и пробел.
Тестовая фраза «ЕХАЛ ГРЕКА ЧЕРЕЗ РЕКУ ВИДИТ ГРЕКА В РЕЧКЕ РАК СУНУЛ ГРЕКА РУКУ В РЕКУ РАК ЗА РУКУ ГРЕКУ ЦАП».
2.1 Блочное кодирование
Информация в ПК уже представлена в виде блоков по 8 бит, но мы, зная контекст, попробуем представить её в виде блоков меньшего размера. Для этого нам нужно собрать информацию о представленных символах и, на будущее, сразу подсчитаем частоту использования каждого символа:
Кодирование текстовой информации. Кодировки русского алфавита. Практическая работа «Кодирование текстовой информации»
Тип урока: Урок ознакомления с новым материалом.
(см. Презентация, слайд 2)
ПЛАН УРОКА
1. Организационный момент.
Сообщение темы, целей и задач урока.
Учитель: Сегодня на уроке вы узнаете, как представляется текстовая информация в компьютере. Научитесь кодировать и декодировать текстовую информацию с помощью кодовых таблиц и ПК.
2. Ход урока
1. Объяснение нового материала.
Учитель: Сегодня на уроке мы с вами разберём понятия: текстовая информация, кодовая таблица. Будем кодировать и декодировать текстовую информацию.
Начиная с конца 60-х годов, компьютеры получили возможность работать с текстовой информацией.
Текстовая информация – это информация, выраженная в письменной форме.
(см. Презентация, слайд 3)
Определение текстовой информации записать в тетрадь.
В процессе восприятия, передачи и хранения информации человеком и техническими устройствами происходит её кодирование.
Учитель: Ребята, давайте вспомним: Что такое кодирование?
(см. Презентация, слайд 4)
Ответ: Кодирование – это процесс преобразования информации в форму, воспринимаемую компьютером, т.е. двоичный код.
Ответ: Декодирование – это процесс обратный кодированию, который заключается в том, что происходит преобразование данных из двоичного кода в форму, понятную человеку.
(см. Презентация, слайд 5)
Учитель: Человек различает знаки по их начертанию. Для предоставления текста в памяти компьютера необходимо представить его в виде двоичного кода.
Ребята, как представлен двоичный код в компьютере? (В виде каких символов?)
Ответ: в виде последовательности из 0 и 1
Для представления текстовой информации (прописные и строчные буквы русского и латинского алфавитов, цифры, знаки и математические символы) достаточно 256 различных знаков. По формуле можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак:
N = 2 i 256 = 2 8 i = 8 бит | N – мощность алфавита i – информационный вес символа |
Записать в тетрадь.
(см. Презентация, слайд 6)
Учитель: При вводе в компьютер текстовой информации происходит её двоичное кодирование, изображение символа преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу с символом, и в компьютер поступает определённая последовательность из 8 электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает одну ячейку.
В процессе вывода символа на экран компьютера производится обратный процесс – декодирование, т.е. преобразование кода символа в его изображение.
(см. Презентация, слайд 7)
Учитель: Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера (коды), называется таблицей кодировки.
Определение таблицы кодировки записать в тетрадь.
(см. Презентация, слайд 8)
Учитель: Международным стандартом для ПК стала таблица ASCII (читается аски) (Американский стандартный код для информационного обмена).
(см. Презентация, слайд 9)
Таблица кодов ASCII делится на:
1) Функциональные клавиши (принято называть управляющими) Символы с номерами от 0 до 31. Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п.
Символ 32 – пробел, т.е. пустая позиция в тексте.
2) Коды 32 – 127 – входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.
3) Коды 128 – 255 – национальный алфавит.
Учитель: Рассмотрим кодовую таблицу MS – DOS (СР(кодовая страница)866) подробнее.
Кодовая таблица MS – DOS (СР(кодовая страница)866) (называемая кодовой страницей) включает в себя:
(см. Презентация, слайд 10)
Понятие кодировки Unicode
В мире существует примерно 6800 различных языков. Если прочитать текст, напечатанный в Японии на компьютере в России или США, то понять его будет нельзя. Чтобы буквы любой страны можно было читать на любом компьютере, для их кодировки стали использовать 2 байта (16 бит).
N = 2 i 2 i = 2 16 = 65536 N = 65536 | N – мощность алфавита символов в кодовой таблице Unicode. i – информационный вес символа |
(см. Презентация, слайд 11 – 12)
Для разных типов ЭВМ используютcя различные кодировки:
В настоящее время существует 5 кодовых таблиц для русских букв: Windows (СР(кодовая страница)1251), MS – DOS (СР(кодовая страница)866), KOИ – 8 (Код обмена информацией, 8-битный) (используется в OS UNIX), Mac (Macintosh), ISO (OS UNIX).
Тексты, созданные в одной кодировке не будут правильно отображаться в другой.
(см. Презентация, слайд 13)
На данном слайде вы видите сравнение кодов в различных кодировочных таблицах.
(см. Презентация, слайд 14)
1. Давайте с помощью кодовой таблицы ASCII (аски) декодируем текст: С помощью последовательности десятичных кодов: 99 111 109 112 117 116 101 114 (computer)
(см. Презентация, слайд 15)
Цель: научиться определять числовые коды символов и вводить символы с помощью числовых кодов.
(см. Презентация, слайд 16)
Учитель: Работа в текстовом редакторе MS Word. Запустите текстовый редактор MS Word. Удерживая клавишу “ALT”, наберите коды на дополнительной цифровой клавиатуре:
152 170 174 171 160
Учитель: Какое слово получили?
Выполнение практической работы учащимися
Проверка выполнения практической работы.
3. Подведение итогов урока
Учитель: Сегодня на уроке вы научились кодировать и декодировать текстовую информацию при помощи кодировочной таблицы MS – DOS (СР(кодовая страница)866).
4. Домашнее задание
(см. Презентация, слайд 17)
Учебник Н.Д. Угриновича § 3.1, ответить на вопросы. Произвести кодирование стихотворения из 4– строк (до 100 символов).
Придумайте собственный способ кодирования букв русского алфавита
Для кодирования букв О, В, Д, П, А решили использовать двоичное представление чисел 0, 1, 2, 3 и 4 соответственно (с сохранением одного незначащего нуля в случае одноразрядного представления). Закодируйте последовательность букв ВОДОПАД таким способом и результат запишите восьмеричным кодом.
Сначала следует представить данные в условии числа в двоичном коде:
Затем закодировать последовательность букв: ВОДОПАД — 010010001110010. Теперь разобьём это представление на тройки справа налево и переведём полученный набор чисел в десятичный код, затем в восьмеричный (восьмеричное предствление совпадает с десятичным при разбиении тройками)
010 010 001 110 010 — 22162.
Для кодирования букв Д, X, Р, О, В решили использовать двоичное представление чисел 0, 1, 2, 3 и 4 соответственно (с сохранением одного незначащего нуля в случае одноразрядного представления). Закодируйте последовательность букв ХОРОВОД таким способом и результат запишите восьмеричным кодом.
Сначала следует представить данные в условии числа в двоичном коде:
Д | Х | Р | О | В |