изобретатель системы кодирования информации использующий два символа точку и тире
Дистанционная олимпиада по информатике для 5-7 классов
Дистанционная олимпиада по информатике для 5-7 классов
I. Третий–лишний (1 балл за каждый правильный ответ)
Для каждого из выделенных курсивом терминов приведены три определения, одно из которых не соответствует термину. Необходимо указать это определение.
b) образное представление схемы организации на диске файлов и каталогов (папок);
c) многолетнее растение с твердым стволом.
a) устройство для подключения внешних устройств к компьютеру;
b) точка в программе для вызова другой программы;
c) место для стоянки и разгрузки судов.
a) отметка в некотором месте программы, с помощью которой можно перейти в это место;
b) значок на экране, щелкнув мышью на котором можно открыть некоторую программу, документ или папку;
c) листок с наименованием товара и другими сведениями.
II. Анаграмма: переставить буквы и получить новое слово. (4 балла за каждый правильный ответ)
III. Определение слов. (4 балла за каждый правильный ответ)
По представленной информации необходимо определить слова A, B, C, D.
1. Слово А без двух последних букв и слово В без последней буквы вместе образуют слово.
Определить слова А, В и С. МОРЗЕ, ДЕМО, МОДЕМ
2. Если в слове А его вторую половину заменить на слово В, то получится слово С.
Определить слова А, В и С РАЗЪЕМ, РЯД, РАЗРЯД
Например: 1. А – Алгол, В – ритм, С – алгоритм
IV. Какие странные слова… (1 балл за каждый правильный ответ)
Для слов иностранного происхождения вам будут предложены три определения. Необходимо выбрать определение, которое соответствует рассматриваемому слову
a. Звуковой сигнал на компьютере;
b. Минимальный элемент изображения на экране монитора;
c. Единица измерения высоты символов.
a. Главный компьютер многоранговой локальной сети;
b. Элемент системного блока ПК;
c. Человек, ремонтирующий компьютеры;
a. Второе название программы «Проводник» ОС Windows ХР.
b. Фирма, предоставляющая услуги по пользованию Интернетом;
c. Фирма, осуществляющая ремонт компьютеров.
b. Доведённый до совершенства;
c. Не имеющий физического воплощения, а созданный на экране монитора компьютера.
II. Зарядка для мозгов
Кулинар приготовил торт из трех коржей и положил его на зеленый поднос. Но оказалось, что на столе вся посуда красного цвета. Помогите кулинару переложить все коржи на красный поднос, используя желтый поднос, как вспомогательный. Обратите внимание! За один ход можно переложить только один корж, и на маленький корж нельзя положить большой.
«Реши головоломку» (6 баллов)
Словарь секретной переписки: кто на самом деле изобрёл азбуку Морзе и как она работает
Американский художник, основатель Национальной академии дизайна — едва ли вы назовете имя Сэмюэла Морзе, услышав данные регалии. Потому что всему миру этот человек известен не как дизайнер, а как создатель знаменитой азбуки из точек и тире. В честь 230-летия со дня рождения изобретателя рассказываем о его главном наследии.
Всего один провод
Сэмюэл Морзе — американский художник и изобретатель. Получил блестящее художественное образование в Британии, писал пейзажи и портреты, удостоился золотой медали Лондонской королевской академии художеств и даже основал Национальную академию дизайна в Нью-Йорке. Однако в начале XIX века в США было мало ценителей искусства, поэтому в 1830-х Морзе решил стать изобретателем. Над своей телеграфной системой он работал с начала 1830-х. Первая демонстрация в 1837 году оказалась неудачной. Только заключив партнёрство с изобретателем Альфредом Вейлом, Морзе смог доработать свою задумку до работающего прототипа. Заручившись поддержкой Конгресса США, 24 мая 1843 года он открыл свою первую телеграфную линию из Балтимора в Вашингтон. Первую телеграмму отправил сам Морзе — ею стала цитата из Библии (Числа 23:23): «Вот что творит Бог!» («What Hath God Wrought!»). Фразу выбрала Энни Гудрич Эллсворт, дочь Генри Эллсворта, руководителя патентного ведомства США, лоббировавшего изобретение в Конгрессе. Морзе подписал историческую телеграмму и подарил её Энни.
Аппарат Морзе не был первым телеграфом. На тот момент уже больше сорока лет (с 1792-го) функционировала первая в мире сеть оптического телеграфа Клода Шаппа во Франции. А электрический телеграф за пять лет до Морзе — в 1832 году — продемонстрировал русский дипломат и изобретатель Павел Львович Шиллинг. Однако система Морзе обладала рядом преимуществ, благодаря которым она на долгие годы стала самой популярной телеграфной системой в мире и до сих пор сохраняет свою актуальность в некоторых областях. Во-первых, для системы Морзе требовался всего один провод, ведь сигнал представляет собой лишь замыкание электрической цепи. Позже эта особенность стала незаменимой для радио, ведь для такого простого сигнала было достаточно очень узкой полосы частот. Кроме того, аппарат Морзе был одним из первых пишущих телеграфных аппаратов. Он фиксировал сообщение в форме точек и тире на бумажной ленте одновременно с получением сообщения. Это позволяло принять телеграмму, даже если телеграфист отсутствовал на линии.
В качестве передатчика электрических сигналов (станция А) в телеграфном аппарате Морзе применяется ключ, подключенный к источнику электричества. Телеграфист нажимал на ключ, замыкая цепь, подававшую ток на линию связи. На приемной станции ток поступал на электромагнит, который прижимал смоченный чернилами валик к телеграфной ленте. Позже телеграфисты заметили, что могут принимать телеграммы на слух, не обращая внимания на телеграфную ленту, благодаря музыкальности азбуки Морзе.
Тире — точка — тире
Азбука Морзе — способ кодирования знаков (букв, цифр и специальных сигналов) при помощи комбинаций коротких и длинных сигналов (точек и тире). Азбука Морзе является неравномерным кодом, поскольку у разных букв алфавита длина кода изменяется от одного (E) до шести (для различных знаков препинания) символов (точек и тире). Длина кода обычно соответствует частоте использования буквы, поэтому на гласные в среднем приходится меньшее количество точек и тире. Фактически системе необходим третий сигнал — пауза для отделения букв друг от друга.
Несмотря на название азбуки, Морзе все же нельзя назвать её полноправным автором
В оригинальном патенте Морзе предложил неудобную и громоздкую систему, где, например, числу 1 соответствовала одна точка, а числу 9 — девять точек. Первую рабочую версию азбуки Морзе разработал его партнёр и коллега Альфред Вейл, американский бизнесмен и изобретатель. Впоследствии Вейл долго судился с Морзе, пытаясь добиться признания своей роли в разработке телеграфа Морзе.
В дальнейшем азбука Морзе многократно перерабатывалась и адаптировалась, становясь всё более удобной для приёма на слух и использования на радио. Появились ее национальные варианты. Русская версия азбуки Морзе была утверждена 21 июня 1856 года в табеле «Высочайше утвержденные телеграфическiе знаки Морзе для Латинской и Русской азбукъ». А знакомый нам сейчас международный вариант азбуки Морзе на самом деле был разработан Фридрихом Гёрке в 1848 году. Он отличался тем, что оптимизировал количество тире — ведь тире занимает гораздо дольше времени, чем точка. В 1865 году система Гёрке была принята как международный стандарт.
«Условный язык»
Для экономии времени и денег текст телеграмм максимально сокращался — отсюда пошло выражение «телеграфный стиль». Для максимального сокращения использовались кодовые книги — своеобразные словари, в которых часто встречающимся выражениям и словам соответствовали специальные буквенные или числовые коды. Помимо экономии, это позволяло скрыть содержимое сообщения от любопытных глаз. Первой кодовой книгой для азбуки Морзе стал «Словарь секретной переписки, приспособленный к использованию с электромеханическим телеграфом Морзе» (1845) Фрэнсиса Смита, компаньона Морзе, лоббировавшего изобретение в Конгрессе США и финансировавшего путешествие изобретателя в Европу.
В России использование таких кодовых книг долгое время было разрешено только для государственных и военных целей. В коллекции Музея криптографии, например, есть первая кодовая книга в Российской империи — «Русский универсальный телеграфный код» (1908). Составитель, Михаил Юрьевич Поггенполь, лично обратился к министру внутренних дел П. А. Столыпину и добился отмены устаревшего закона о запрете использовать «условный язык» (код) в телеграфной переписке. В 1907 году Столыпин внёс соответствующие изменения в правила телеграфной корреспонденции.
Есть все мы, а есть Андрей Зализняк: история жизни великого русского лингвиста
Ещё один предмет в коллекции музея — «Словарь для шифрованной корреспонденции» Министерства торговли и промышленности (1916). Режим секретности военного времени требовал дополнительных мер безопасности, поэтому фразы и слова кодировались числовыми группами и могли перешифровываться при помощи аддитивов, то есть прибавления заранее условленных чисел к полученному коду. Например, фраза «Купите электролитическую медь и феррохром из Огайо за полцены согласно поручению начальника отдела промышленности» кодировалась таким образом:
12602 08947 06119 10775 06146 19231 12709 12983 22802 21104
Первые три числа каждой кодовой группы чисел соответствовали странице словаря, а последние два — номеру слова на этой странице. После кодирования сообщения отправитель прибавлял к каждому коду аддитив — заранее условленную и известную получателю последовательность чисел. Благодаря этому, даже имея данный словарь, но не зная аддитив, злоумышленник мог дешифровать только абсурдный набор слов, например «Частная железная дорога долголетняя многозначительно чеканит монету по причине болезни ъ родительный падеж…».
Ритм Пятой симфонии Бетховена
Несмотря на своё удобство, азбука Морзе вызывала определённые сложности для криптографов, ведь всего одна упущенная точка могла изменить количество букв в секретном сообщении, из-за чего все последующие буквы оказывались сдвинуты относительно ключа шифрования и были бы расшифрованы неправильно. Поэтому многие шифры специально разрабатывались для использования с азбукой Морзе. Например, в немецком шифре ADFGVX для кодирования сообщений использовалось всего 6 букв, подобранных таким образом, чтобы максимально отличаться в азбуке Морзе.
Некоторые буквы азбуки Морзе становились политическими символами. Например, символом из самых масштабных антифашистских компаний в Европе во время Второй мировой войны стала V — не только буква латинского алфавита, но и соответствующий ей ритм в азбуке Морзе.
«V for Victory» — одна из самых масштабных антифашистских кампаний в Европе во время Второй мировой войны
Виктор Огюст де Лавеле, бывший бельгийский министр юстиции, бежал в Англию и стал диктором на британской радиостанции BBC. В эфире 14 января 1941 года он попросил всех бельгийцев использовать букву V в качестве объединяющего знака, являющегося первой буквой victoire («победа») на французском языке и vrijheid («свобода») на голландском. Это было началом V-кампании. После чего V-граффити быстро распространились на стенах Бельгии, а затем и всей Европы. Уинстон Черчилль и многие другие поддержали эту кампанию.
Буква V (начало слова Victory) на азбуке Морзе напоминает ритм Пятой симфонии Бетховена: ее первые четыре ноты соответствуют точка — точка — точка — тире.
Попробовать расшифровать слова, переданные с помощью кода Морзе, а также посмотреть на первые российские кодовые книги можно будет в Музее криптографии, который откроется в этом году в Москве.
На обложке: портрет Сэмюэла Морзе, около 1850 года. Фото: Мэтью Брейди
Методическая разработка внеклассного мероприятия «Турнир знатоков информатики» (5-9 класс)
Новые аудиокурсы повышения квалификации для педагогов
Слушайте учебный материал в удобное для Вас время в любом месте
откроется в новом окне
Выдаем Удостоверение установленного образца:
Описание презентации по отдельным слайдам:
Турнир знатоков Информатики Составитель: Уч. информатики Шишкина О.Д. 2015 г.
«Дальше, дальше…» Конкурс №1
Значок на экране, щелкнув мышью на котором можно открыть некоторую программу, документ или папку. №1
Запись числа 10 в 16-ричной системе счисления. №2
Фирма, предоставляющая услуги по пользованию Интернетом. №3
Многократно повторяющаяся часть алгоритма (программы). №5
Человек – фанат компьютерных игр. №6
Сколько байт в 40 битах? №7
Минимальная единица измерения информации. №8
Какой носитель имеет форму пиццы? №9
Книгу по какому языку программирования химики называют книгой про ионы меди? №10
Состояние, при котором включенный компьютер не реагирует на действия пользователя №11
Изобретатель системы кодирования информации, использующий два символа: точку и тире. №12 СТОП
Перечисление всех папок (каталогов), в которые вложен файл. №1
Запись числа 15 в 16-ричной системе счисления. №2
Вредные для компьютера программы №3
Процесс представления сообщений в конкретном виде при помощи некоторой последовательности знаков-кодов. №4
Текст, содержащий связи с текстом других документов №5
Минимальный элемент изображения на экране монитора. №6
Начинающий пользователь. №7
Начинающий пользователь. №8
Минимальный информационный объект. №9
Последовательность действий, направленная для достижения конкретной цели №10
Что общего между папирусом, берестяной грамотой, книгой и дискетой? №11
Как называются программы, предназначенные для просмотра страниц Интернета? №12 СТОП
«Компьютерное зазеркалье» Конкурс №2
Гибкая плата Видимая папка Долговременный склероз Естественная глупость Коллективные счеты Лиственный файл Отцовский блок Одеяло для кошки Ручная вакцина Низкий запрет Жесткий диск Скрытый файл Оперативная память Искусственныйинтеллект Персональный компьютер Корневой каталог Материнская плата Коврик для мышки Компьютерный вирус Высокое разрешение
«Объяснялки» Конкурс №3
«Анаграммы» Конкурс №4 АНАГРАММА ИСХОДНОЕ СЛОВО Салькап Паскаль Красен Сканер Кастор Строка Бискей Бейсик Терполт Плоттер Фигарка Графика Иголка Логика Корсет Сектор Фуралом Формула Волусие Условие Урвиск Курсив Таксиед Дискета
«Опознай пословицу» Конкурс №5
Компьютер на столе не для одних только игр Голова на плечах не для одной только шапки По ноутбуку встречают, по уму провожают По одёжке встречают, по уму провожают
Дарёному компьютеру в системный блок не заглядывают Дарёному коню в зубы не смотрят В Силиконовую долину со своим компьютером не ездят В Тулу со своим самоваром не ездят
Не Intel’ом единым жив процессорный мир Не хлебом единым жив человек Мал микропроцессор, да дорог Мал золотник, да дорог
Не всё WINDOWS, что висит Не всё то золото, что блестит Семь бед – один “Reset”. Семь бед – один ответ
Бит байт бережёт Копейка рубль бережёт Не имя красит файл, а файл имя Не имя красит человека, а человек имя
Наудалял с три Корзины Наврал с три короба Что из Корзины удалено, то пропало Что с возу упало, то пропало
«И то, и другое – что это такое?» Конкурс №5
И нота, и язык программирования И семейный, и военный, и файловый И футбольное, и в таблице базы данных И категория в спорте, и позиция в записи числа И грызун, и манипулятор И в трапеции, и у памятника, и у системы счисления И почтовый, и нижний или верхний, и у элемента массива
«Стань роботом» Конкурс №5
Курс повышения квалификации
Дистанционное обучение как современный формат преподавания
Курс повышения квалификации
Применение облачных сервисов в педагогической практике учителя (практический курс)
Курс профессиональной переподготовки
Информатика: теория и методика преподавания в образовательной организации
«Турнир знатоков информатики»
Цели:
Продолжительность: 40 минут.
Рекомендуемые классы: 5-9
Оборудование:
ХОД МЕРОПРИЯТИЯ
В: – Добрый день, дорогие участники, члены жюри. В современном мире информатика – самая молодая и стремительно развивающаяся наука, знание которой просто необходимо каждому человеку. Сегодня мы с вами и в шутку, и всерьез попытаемся прикоснуться к разным граням этой интереснейшей науки. Итак ребята, вам сейчас необходимо разбиться на команды, придумать название команды и выбрать капитанов.
Представление капитанов команд и членов жюри.(Раиса Николаевна, Антон Олегович)
№1 Конкурс. «Дальше, дальше…»
В: За 60 секунд каждая команда должна верно ответить на как можно большее количество вопросов. Если команда затрудняется с ответом, капитан просит перейти к следующему вопросу, сказав «Дальше». Верный ответ приносит команде 1 балл.
Жюри подсчитывает количество верных ответов и регламентирует время.
Вопросы 1 команде:
Вопросы 2 команде:
Объявление итогов жюри
2 Конкурс «Компьютерное зазеркалье» Муз.
В: Сейчас вы получите карточки, в которых написаны словосочетания, связанные с компьютерами и информатикой, слова заменены на противоположные по смыслу, назначению, размерам и т.п. Команды за 3 минуты должны определить исходные словосочетания. За каждый правильный ответ 2 балл.
Например, Беззвучный микрофон (звуковая колонка)
Объявление ответов (слайд 29) и итогов жюри
№3 Конкурс «Объяснялки»
В: Сейчас ученики начальных классов будут вам рассказывать о терминах относящихся к информатике, а вы должны будете их угадать. Командам необходимо как можно быстрее определить термин и хлопком подать сигнал о том, что команда готова дать ответ. За правильный ответ команда получает 2 балла. Внимание на экран.
Unicode: как человечество пришло к международному стандарту кодирования символов
Уверена, что большинство читателей хоть немного знакомы с терминами «Unicode» и «UTF-8». Но все ли знают, что именно стоит за ними? По сути они относятся к стандартам кодирования символов, также известным как наборы символов. Концепция появилась во времена оптического телеграфа, а не в компьютерную эру, как можно было подумать. Еще в 18 веке существовала потребность в быстрой передаче информации на большие расстояния, для чего использовались так называемые телеграфные коды. Информация кодировалась с помощью оптических, электронных и других средств.
В течение сотен лет, прошедших с момента изобретения первого телеграфного кода, не было никаких реальных попыток международной стандартизации таких схем кодирования. Даже первые десятилетия эры телетайпов и домашних компьютеров мало что изменили. Несмотря на то, что EBCDIC (8-битная кодировка символов IBM, продемонстрированная на перфокарте в заглавной иллюстрации) и ASCII немного улучшили ситуацию, способа кодировать растущую коллекцию символов без значительных затрат памяти все еще не было.
Развитие Юникода началось в конце 1980-х годов, когда рост обмена цифровой информацией во всем мире сделал потребность в единой системе кодирования более насущной. В наши дни Юникод позволяет нам использовать единую схему кодирования для всего — от базового английского текста и традиционного китайского, вьетнамского, даже майянского языков до пиктограмм, которые мы привыкли называть «эмодзи».
От кода к графикам
Еще в эпоху Римской империи было хорошо известно, что быстрая передача информации имеет значение. В течение долгого времени это означало наличие гонцов на лошадях, которые доставляли сообщения на большие расстояния, или их эквивалента. Как улучшить систему доставки информации, придумали еще в 4 веке до нашей эры — так появились водяной телеграф и система сигнальных огней. Но действительно эффективной передача данные на большие расстояния стала лишь в 18 веке.
Об оптическом телеграфе, также называемом «семафоре», мы уже писали в статье об истории оптической связи. Он состоял из ряда ретрансляционных станций, каждая из которых была оборудована системой поворотных стрелок, используемой для отображения символов телеграфного кода. Система братьев Шапп, которая использовалась французскими войсками между 1795 и 1850-ми годами, была основана на деревянной перекладине с двумя подвижными концами (рычагами), каждый из которых мог перемещаться в одно из семи положений. Вместе с четырьмя позициями для перекладины семафор в теории мог обозначить 196 символов (4x7x7). На практике число сокращалось до 92-94 позиций.
Французский оптический телеграфный код братьев Шапп, 1809 год
Система семафоров использовалась не столько для прямого кодирования символов, сколько для обозначения определенных строк в кодовой книге. Метод подразумевал, что по нескольким кодовым сигналам можно было расшифровать все сообщение. Это ускоряло передачу и делало бессмысленным перехват сообщений.
Улучшение производительности
Затем оптический телеграф был заменен электрическим. Это означало, что времена, когда кодировки фиксировались людьми, наблюдающими за ближайшей релейной вышкой, прошли. С двумя телеграфными устройствами, соединенными металлическим проводом, инструментом для передачи информации стал электрический ток. Это изменение привело к появлению новых кодов электрического телеграфа, а код Морзе в итоге стал международным стандартом (за исключением США, которые продолжали использовать американский код Морзе за пределами радиотелеграфии) с момента его изобретения в Германии в 1848 году.
Международный код Морзе имеет преимущество перед американским аналогом: в нем используется больше тире, чем точек. Такой подход снижает скорость передачи, но улучшает прием сообщения на другом конце линии. Это было необходимо, когда длинные сообщения передавались по многокилометровым проводам операторами разного уровня подготовки.
По мере развития технологий ручной телеграф был заменен на Западе автоматическим. В нем использовался 5-битный код Бодо, а также производный от него код Мюррея (последний основывался на использовании бумажной ленты, в которой пробивались отверстия). Система Мюррея позволяла заранее подготовить ленту с сообщениями, а затем загрузить ее в устройство для чтения, чтобы сообщение передалось автоматически. Код Бодо лег в основу международного телеграфного алфавита версии 1 (ITA 1), а модифицированный код Бодо-Мюррея лег в основу ITA 2, которая использовалась вплоть до 1960-х годов.
К 1960-м годам ограничение в 5 бит на символ уже не требовалось, что привело к развитию 7-битного ASCII в США и таких стандартов, как JIS X 0201 (для японских символов катакана) в Азии. В сочетании с телетайпами, которые тогда широко использовались, это позволяло передавать довольно сложные сообщения, включающие символы верхнего и нижнего регистров.
Полный набор символов 7-битного ASCII
В течение 1970-х и начала 1980-х годов ограничений 7- и 8-битных кодировок, таких как расширенный ASCII (например, ISO 8859-1 или Latin 1), было достаточно для основных домашних компьютеров и офисных нужд. Несмотря на это, потребность в улучшении была очевидна, поскольку общие задачи, такие как обмен цифровыми документами и текстом, часто приводили к хаосу из-за множества кодировок ISO 8859. Первый шаг был сделан в 1991 году — появился 16-битный Unicode 1.0.
Развитие 16-битных кодировок
Удивительно, что всего в 16 битах Unicode удалось охватить не только все западные системы письма, но и многие китайские иероглифы и множество специальных символов, используемых, например, в математике. С 16 битами, допускающими до 65 536 кодовых точек, Unicode 1.0 легко вмещал 7 129 символов. Но к моменту появления Unicode 3.1 в 2001 году он содержал не менее 94 140 символов.
Сейчас, в своей 13 версии, Unicode содержит в общей сложности 143 859 символов, не считая управляющих. Изначально Unicode предполагалось использовать только для кодирования систем записи, которые применяются в настоящее время. Но к релизу Unicode 2.0 в 1996 году стало понятно, что эту цель следует переосмыслить, чтобы кодировать даже редкие и исторические символы. Чтобы достичь этого без обязательной 32-битной кодировки каждого символа, Unicode изменился: он позволил не только кодировать символы напрямую, но и использовать их компоненты, или графемы.
Концепция в чем-то похожа на векторные изображения, где не указывается каждый пиксель, а вместо этого описываются элементы, составляющие рисунок. В результате кодировка Unicode Transformation Format 8 (UTF-8) поддерживает 2 31 кодовую точку, при этом для большинства символов в текущем наборе символов Unicode обычно требуется один-два байта.
Unicode на любой вкус и цвет
На данный момент довольно много людей, вероятно, сбиты с толку из-за различных терминов, которые используются, когда дело доходит до Unicode. Поэтому здесь важно отметить, что Unicode относится к стандарту, а различные Unicode Transformation Format являются его реализациями. UCS-2 и USC-4 — это более старые 2- и 4-байтовые реализации Unicode, при этом UCS-4 идентичен UTF-32, а UCS-2 заменяем UTF-16.
Обзор базовой многоязычной плоскости Unicode, первой плоскости Unicode практически со всеми современными языками
UTF-32, как следует из названия, кодирует каждый символ в четырех байтах. Это немного расточительно, зато абсолютно предсказуемо. Тот же UTF-8 символ может кодировать символ в диапазоне от одного до четырех байтов. В случае с UTF-32 определение количества символов в строке — это простая арифметика: взять все количество байтов и поделить на четыре. Это привело к появлению компиляторов и некоторых языков, например Python, позволяющих использовать UTF-32 для представления строк Unicode.
Однако из всех форматов Unicode наиболее популярным на сегодняшний день является UTF-8. Этому во многом способствовала всемирная сеть Интернет, где большинство веб-сайтов обслуживают свои HTML-документы в кодировке UTF-8. Из-за компоновки различных плоскостей кодовых точек в UTF-8, Western и многие другие распространенные системы записи умещаются в пределах двух байтов. Если сравнивать со старыми кодировками ISO 8859 и Shift JIS, фактически тот же текст в UTF-8 не занимает больше места, чем раньше.
От оптических башен до интернета
Времена конных гонцов, ретрансляционных вышек и небольших телеграфных станций прошли. Коммуникационные технологии сильно развились. Даже те дни, когда телетайпы были обычным явлением в офисах, вспоминаются с трудом. Однако на каждом этапе развития истории человечеству было необходимость кодировать, хранить и передавать информацию. И это привело нас к тому, что теперь мы можем мгновенно передавать сообщение по всему миру в системе символов, которую можно декодировать независимо от того, где вы находитесь.
Для тех, кому довелось переключаться между кодировками ISO 8859 в почтовых клиентах и веб-браузерах, чтобы получить что-то, похожее на исходное текстовое сообщение, поддержка Unicode стала благословением. Я могу понять этих людей. Когда 7-битный ASCII (или EBCDIC) был безальтернативной технологией, иногда приходилось тратить часы, разбираясь в символьной путанице цифрового документа, полученного из европейского или американского офиса.
Даже если Unicode не лишен проблем, трудно не испытывать благодарности, сравнивая его с тем, что было раньше. Вот они, 30 лет существования Unicode.