к регистрационной системе кодирования относятся
Регистрационное кодирование
Классификационное кодирование
Общие понятия
СИСТЕМА КОДИРОВАНИЯ
Лекция №4
Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.
Система кодирования — совокупность правил кодового обозначения объектов.
Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется:
· длиной — число позиций в коде;
· структурой — порядок расположения в коде символов, используемых для обозначения классификационного признака.
Процедура присвоения объекту кодового обозначения называется кодированием. Можно выделить две группы методов, используемых в системе кодирования, которые образуют:
· классификационную систему кодирования, ориентированную на проведение предварительной классификации объектов либо на основе иерархической системы, либо на основе фасетной системы;
· регистрационную систему кодирования, не требующую предварительной классификации объектов.
Рассмотрим представленную на рисунке схему системы кодирования.
Система кодирования, использующая разные методы
Классификационное кодирование применяется после проведения классификации объектов. Различают последовательное и параллельное кодирование.
Последовательное кодирование используется для иерархической классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования обладает теми же достоинствами и недостатками, что и иерархическая система классификации.
Пример 1. Проведем кодирование информации, классифицированной с помощью иерархической схемы. Количество кодовых группировок будет определяться глубиной классификации и равно 4. Прежде чем начать кодирование, необходимо определиться с алфавитом, т.е. какие будут использоваться символы. Для большей наглядности выберем десятичную систему счисления — 10 арабских цифр. Анализ схемы на рисунке для информационного объекта «Факультет» показывает, что длина кода определяется 4 десятичными разрядами, а кодирование группировки на каждом уровне можно делать путем последовательной нумерации слева направо. В общем виде код можно записать как ХХХХ, где Х — значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:
1-й (старший) разряд выделен для классификационного признака «название факультета» и имеет следующие значения: 1 — коммерческий; 2 — информационные системы; 3 — для следующего названия факультета и т.д.;
2-й разряд выделен для классификационного признака «возраст» и имеет следующие значения: 1 — до 20 лет; 2 — от 20 до 30 лет; 3 — свыше 30 лет;
3-й разряд выделен для классификационного признака «пол» и имеет следующие значения: 1 — мужчины; 2 — женщины;
4-й разряд выделен для классификационного признака «наличие детей у женщин» и имеет следующие значения: 1 — есть дети; 2 — нет детей, 0 — для мужчин, так как подобной информации не требуется.
Принятая система кодирования позволяет легко расшифровать любой код группировки, например:
1310 — студенты коммерческого факультета, свыше 30 лет, мужчины;
2221 — студенты факультета информационных систем, от 20 до 30 лет, женщины, имеющие детей.
Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.
Пример 2. Проведем кодирование информации, классифицированной с помощью фасетной схемы (см. рисунок для информационного объекта «Факультет»). Количество кодовых группировок определяется количеством фасетов и равно 4. Выберем десятичную систему счисления в качестве алфавита кодировки, что позволит для значений фасетов выделить один разряд и иметь длину кода, равную 4. В отличие от последовательного кодирования для иерархической системы классификации в данном методе не имеет значения порядок кодировки фасетов. В общем виде код можно записать как ХХХХ, где Х — значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:
1-й (старший) разряд выделен для фасета «пол» и имеет следующие значения: 1 — мужчины; 2 — женщины;
2-й разряд выделен для фасета «наличие детей у женщин» и имеет следующие значения: 1 — есть дети; 2 — нет детей, 0 — для мужчин, так как подобной информации не требуется ;
3-й разряд выделен для фасета «возраст» и имеет следующие значения: 1 —до 20 лет; 2 — от 20 до 30 лет; 3 — свыше 30 лет;
4-й разряд выделен для фасета «название факультета» и имеет следующие значения: 1 — радиотехнический, 2 — машиностроительный, 3 — коммерческий; 4 — информационные системы; 5 — математический и т.д.
Принятая система кодирования позволяет легко расшифровать любой код группировки, например:
2135 — женщины в возрасте свыше 30 лет, имеющие детей и являющиеся студентами математического факультета;
1021 — мужчины возраста от 20 до 30 лет, являющиеся студентами радиотехнического факультета.
Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно—порядковую систему.
Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе,
Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.
Пример 3. Все студенты одного факультета разбиваются на учебные группы (в данной терминологии — серии), для которых используется порядковая нумерация. Внутри каждой группы производится упорядочение фамилий студентов по алфавиту и каждому студенту присваивается номер.
Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет
—> Электронный кабинет преподавателя Емельяновой М.С.
СИСТЕМА КОДИРОВАНИЯ
Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.
Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется:
§ длиной – число позиций в коде;
§ структурой – порядок расположения в коде символов, используемых для обозначения классификационного признака.
Процедура присвоения объекту кодового обозначения называется кодированием. Можно выделить две группы методов, используемых в системе кодирования (рис.2.7), которые образуют:
§ классификационную систему кодирования, ориентированную на проведение предварительной классификации объектов либо на основе иерархической системы, либо на основе фасетной системы;
§ регистрационную систему кодирования, не требующую предварительной классификации объектов.
Рассмотрим представленную на рис. 2.7 систему кодирования.
Рис. 2.7. Система кодирования, использующая разные методы
Классификационное кодирование
Классификационное кодирование применяется после проведения классификации объектов. Различают последовательное и параллельное кодирование.
Последовательное кодирование используется для иерархической классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования обладает теми же достоинствами и недостатками, что и иерархическая система классификации.
Пример 2.15. Проведем кодирование информации, классифицированной с помощью иерархической схемы (см. рис. 2.4). Количество кодовых группировок будет определяться глубиной классификации и равно 4. Прежде чем начать кодирование, необходимо определиться с алфавитом, т.е. какие будут использоваться символы. Для большей наглядности выберем десятичную систему счисления – 10 арабских цифр. Анализ схемы на рис. 2.4 показывает, что длина кода определяется 4 десятичными разрядами, а кодирование группировки на каждом уровне можно делать путем последовательной нумерации слева направо. В общем виде код можно записать как ХХХХ, где X – значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:
1-й (старший) разряд выделен для классификационного признака «название факультета» и имеет следующие значения: 1 – коммерческий; 2 – информационные системы; 3 – для следующего названия факультета и т.д.;
2-й разряд выделен для классификационного признака «возраст» и имеет следующие значения: 1 – до 20 лет; 2 – от 20 до 30 лет; 3 – свыше 30 лет; 3-й разряд выделен для классификационного признака «пол» и имеет следующие значения: 1 – мужчины; 2 – женщины;
4-й разряд выделен для классификационного признака «наличие детей у женщин» и имеет следующие значения: 1 – есть дети; 2 – нет детей, 0 – для мужчин, так как подобной информации не требуется.
Принятая система кодирования позволяет легко расшифровать любой код группировки, например:
1310 – студенты коммерческого факультета, свыше 30 лет, мужчины; 2221 – студенты факультета информационных систем, от 20 до 30 лет, женщины, имеющие детей.
Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.
Пример 2.16. Проведем кодирование информации, классифицированной с помощью фасетной схемы (см. рис. 2.6). Количество кодовых группировок определяется количеством фасетов и равно 4. Выберем десятичную систему счисления в качестве алфавита кодировки, что позволит для значений фасетов выделить один разряд и иметь длину кода, равную 4. В отличие от последовательного кодирования для иерархической системы классификации в данном методе не имеет значения порядок кодировки фасетов. В общем виде код можно записать как ХХХХ, где X – значение десятичного разряда. Рассмотрим структуру кода, начиная со старшего разряда:
2-й разряд выделен для фасета «наличие детей у женщин» и имеет следующие значения: 1 – есть дети; 2 – нет детей, 0 – для мужчин, так как подобной информации не требуется;
3-й разряд выделен для фасета «возраст» и имеет следующие значения: 1 – до 20 лет; 2 – от 20 до 30 лет; 3 – свыше 30 лет;
4-й разряд выделен для фасета «название факультета» и имеет следующие значения: 1 – радиотехнический, 2 – машиностроительный, 3 – коммерческий; 4 – информационные системы; 5 – математический и т.д.
Принятая система кодирования позволяет легко расшифровать любой код группировки, например:
2135 – женщины в возрасте свыше 30 лет, имеющие детей и являющиеся студентами математического факультета;
1021 – мужчины возраста от 20 до 30 лет, являющиеся студентами радиотехнического факультета.
Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-порядковую систему.
Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.
Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.
Пример 2.17. Все студенты одного факультета разбиваются на учебные группы (в данной терминологии – серии), для которых используется порядковая нумерация. Внутри каждой группы производится упорядочение фамилий студентов по алфавиту и каждому студенту присваивается номер.
КЛАССИФИКАЦИЯ ИНФОРМАЦИИ ПО РАЗНЫМ ПРИЗНАКАМ
Любая классификация всегда относительна. Один и тот же объект может быть классифицирован по разным признакам или критериям. Часто встречаются ситуации, когда в зависимости от условий внешней среды объект может быть отнесен к разным классификационным группировкам. Эти рассуждения особенно актуальны при классификации видов информации без учета ее предметной ориентации, так как она часто может быть использована в разных условиях, разными потребителями, для разных целей.
На рис. 2.8 приведена одна из схем классификации циркулирующей в организации (фирме) информации. В основу классификации положено пять наиболее общих признаков: место возникновения, стадия обработки, способ отображения, стабильность, функция управления.
Рис. 2.8. Классификация информации, циркулирующей в организации
Место возникновения. По этому признаку информацию можно разделить на входную, выходную, внутреннюю, внешнюю.
Входная информация – это информация, поступающая в фирму или ее подразделения.
Выходная информация – это информация, поступающая из фирмы в другую фирму, организацию (подразделение).
Одна и та же информация может являться входной для одной фирмы, а для другой, ее вырабатывающей, выходной. По отношению к объекту управления (фирма или ее подразделение: цех, отдел, лаборатория) информация может быть определена как внутренняя, так и внешняя.
Пример 2.18. Содержание указа правительства об изменении уровня взимаемых налогов для фирмы является, с одной стороны, внешней информацией, с другой стороны – входной. Сведения фирмы в налоговую инспекцию о размере отчислении в госбюджет являются, с одной стороны, выходной информацией, с другой стороны – внешней по отношению к налоговой инспекции.
Стадия обработки. По стадии обработки информация может быть первичной, вторичной, промежуточной, результатной.
Первичная информация – это информация, которая возникает непосредственно в процессе деятельности объекта и регистрируется на начальной стадии.
Вторичная информация – это информация, которая получается в результате обработки первичной информации и может быть промежуточной и результатной.
Промежуточная информация используется в качестве исходных данных для последующих расчетов.
Результатная информация получается в процессе обработки первичной и промежуточной информации и используется для выработки управленческих решений.
Пример 2.19. В художественном цехе, где производится роспись чашек, в конце каждой смены регистрируется общее количество произведенной продукции и количество расписанных чашек каждым работником. Это первичная информация. В конце каждого месяца мастер подводит итоги первичной информации. Это будет, с одной стороны, вторичная промежуточная информация, а с другой стороны – результатная. Итоговые данные поступают в бухгалтерию, где производится расчет заработной платы каждого работника в зависимости от его выработки. Полученные расчетные данные – результатная информация.
Способ отображения. По способу отображения информация подразделяется на текстовую и графическую.
Текстовая информация – это совокупность алфавитных, цифровых и специальных символов, с помощью которых представляется информация на физическом носителе (бумага, изображение на экране дисплея).
Графическая информация – это различного рода графики, диаграммы, схемы, рисунки и т.д.
Стабильность. По стабильности информация может быть переменной (текущей) и постоянной (условно-постоянной).
Переменная информация отражает фактические количественные и качественные характеристики производственно-хозяйственной деятельности фирмы. Она может меняться для каждого случая как по назначению, так и по количеству. Например, количество произведенной продукции за смену, еженедельные затраты на доставку сырья, количество исправных станков и т.п.
Постоянная (условно-постоянная) информация – это неизменная и многократно используемая в течение длительного периода времени информация. Постоянная информация может быть справочной, нормативной, плановой:
§ постоянная справочная информация включает описание постоянных свойств объекта в виде устойчивых длительное время признаков. Например, табельный номер служащего, профессия работника, номер цеха и т.п.;
§ постоянная нормативная информация содержит местные, отраслевые и общегосударственные нормативы. Например, размер налога на прибыль, стандарт на качество продуктов определенного вида, размер минимальной оплаты труда, тарифная сетка оплаты государственным служащим;
§ постоянная плановая информация содержит многократно используемые в фирме плановые показатели. Например, план выпуска телевизоров, план подготовки специалистов определенной квалификации.
Плановая информация – информация о параметрах объекта управления на будущий период. На эту информацию идет ориентация всей деятельности фирмы.
Пример 2.20. Плановой информацией фирмы могут быть такие показатели, как план выпуска продукции, планируемая прибыль от реализации, ожидаемый спрос на продукцию и т.д.
Нормативно-справочная информация содержит различные нормативные и справочные данные. Ее обновление происходит достаточно редко.
Пример 2.21. Нормативно-справочной информацией на предприятии являются:
§ время, предназначенное для изготовления типовой детали (нормы трудоемкости);
§ среднедневная оплата рабочего по разряду;
§ адрес поставщика или покупателя и т.д.
Пример 2.22. Учетной информацией являются: количество проданной продукции за определенный период времени; среднесуточная загрузка или простой станков и т.п.
Оперативная (текущая) информация – это информация, используемая в оперативном управлении и характеризующая производственные процессы в текущий (данный) период времени. К оперативной информации предъявляются серьезные требования по скорости поступления и обработки, а также по степени ее достоверности. От того, насколько быстро и качественно проводится ее обработка, во многом зависит успех фирмы на рынке.
Пример 2.23. Оперативной информацией являются:
§ количество изготовленных деталей за час, смену, день;
§ количество проданной продукции за день или определенный час;
§ объем сырья от поставщика на начало рабочего дня и т.д.
ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ
1. В чем различие информации и данных?
2. Что такое адекватность информации?
3. Какие существуют показатели качества информации?
4. Что такое система классификации информации?
5. Основные идеи иерархического, фасетного, дескрипторного методов классификации. Примеры.
6. Что такое система кодирования информации? Классификация методов.
7. Что такое классификационное, регистрационное кодирование? Примеры.
8. Сопоставьте назначения системы классификации и системы кодирования.
9. Расскажите о классификации информации, циркулирующей в организации.
ЛИТЕРАТУРА
Использован материал учебника «Информатика» Н.В.Макаровой
Регистрационные системы кодирования
Порядковый метод
Порядковый метод кодирования наиболее простой. Суть его заключается в том, что позиции кодируемой номенклатуры обозначаются порядковыми номерами. Предварительной классификации при этом не требуется. Расположение позиций номенклатуры для их кодирования может проводиться в любом порядке: хронологическом, алфавитном и др.
Ниже приведен пример построения порядкового кода видов тканей:
Драп 01 Крепдешин 07
Кашемир 02 Шифон 08
Шерсть 03 Трикотин 09
Для удобства обработки информации с помощью ЭВМ используется равномерная длина кодов для всей номенклатуры. Зависимость между длиной кодового обозначения и числом объектов номенклатуры, которая может быть закодирована с его помощью, выражается формулой:
где N — число объектов в номенклатуре кодируемого множества;
а — число символов, составляющих алфавит кода;
l — число разрядов кода.
Этот метод обеспечивает минимальную длину кода, позволяет легко вносить изменения в кодификатор: каждому вновь появляющемуся объекту присваивается очередной свободный порядковый номер. Долговечность порядкового кода практически может быть достигнута за счет незначительной избыточности, так как добавление только одного разряда увеличивает емкость кода ва раз.
Серийно-порядковый метод
Серийно-порядковый метод отличается от порядкового тем, что номенклатура кодируемых объектов предварительно разбивается на подмножества. Эти подмножества состоят, как правило, из элементов, обладающих общим свойством. Элементы каждого подмножества кодируются порядковыми номерами в пределах отведенной для него серии номеров. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество подмножеств невелико.
В каждой серии обычно предусматриваются резервные номера (на случай появления новых позиций), которые могут располагаться в любом месте серии.
Пример.Закодируем оборудование ателье по пошиву одежды (таблица 3.1).
Однако дальнейшая детализация возможна лишь с помощью справочника (словаря).
Этому методу, в основном, присущи те же достоинства и недостатки, что и порядковому кодированию. Но здесь коды, помимо идентификации объекта, несут некоторую дополнительную информацию об объектах.
Классификационные (позиционные) системы кодирования
Позиционный метод кодирования основывается на разделении кодируемой номенклатуры объектов на ряд классификационных группировок. Структура позиционного кода выражает принятую систему классификации объектов. В качестве признаков группировок выбирают такие свойства объектов, которые отвечают требованиям задачи, решаемым с помощью классификаторов. Для выражения каждого признака объекта выделяется группа (позиция) из одного или нескольких разрядов кода.
Таким образом, код объекта, построенный с использованием позиционного метода, состоит из нескольких позиций, отражающих классификационные признаки. Значение признака объекта определяется не только конкретным числом (группой чисел), но и той позицией числа (группы чисел) в структуре кода, которая отведена для выражения данного признака.
Различают две разновидности позиционного метода кодирования: последовательное и параллельное кодирование свойств объектов.
Последовательное кодирование
| Х | Х | ХХ |
![]() | ||
| Третья ступень классификации (материал) | ||
| Вторая ступень классификации (тип) | ||
| Первая ступень классификации (вид) |
Таким образом, пальто удлиненное из кашемира будет иметь код 1102; короткая кожаная куртка 4206.
К достоинствам этого метода относится прежде всего то, что форма кода наглядно отражает логику классификатора и свойства кодируемого объекта и их взаимосвязь. Кроме того, этот код позволяет легко получить итоги по группировке, осуществить поиск данных. Вместе с тем последовательное кодирование имеет ряд серьезных недостатков.
Прежде всего, следует отметить недолговечность существования кодов в случае высокой динамичности кодируемой номенклатуры. Появление новых объектов может привести к переполнению отдельных классификационных группировок при незначительной заполненности других. Изменение отдельных группировок, их исключение или введение новых может потребовать перекодирования части объектов (иногда существенной).
Для удлинения продолжительности существования кодов предусматривается значительное количество резервных позиций путем увеличения длины кодового обозначения. Поэтому вторым недостатком данного метода кодирования является избыточность кодов, которая в то же время далеко не всегда гарантирует их долговечность, так как практически в отдельных ветвях классификатора объекты появляются неравномерно. Наконец, следует отметить сложность присвоения кодов новым объектам, так как они предварительно должны быть классифицированы.
Параллельное кодирование
Пример.Рассмотрим структуру кода детали изделия швейного производства.
| Х | Х X | Х | Х X | Х | Х | Х | Х |
![]() | |||||||
| количество деталей в изделии | |||||||
| размер | |||||||
| элемент детали | |||||||
| тип детали | |||||||
| вид детали | |||||||
| тип изделия | |||||||
| вид изделия | |||||||
| пол |
В структуре десятиразрядного кода содержится восемь фасетов: (1+2+1+2+1+1+1+1), из которых:
Важным достоинством рассматриваемого метода построения кода является гибкость структуры кода, что позволяет относительно просто наращивать количество аспектов классификации и заменять при необходимости отдельные фасеты. Зная фасетную формулу и кодовые обозначения фокусов, можно легко определить свойства классифицируемого объекта по его коду.
Однако этот код избыточен, так как на практике многие сочетания признаков объекта могут не существовать и, следовательно, не будет полностью использоваться возможная емкость кода. Кроме того, в отдельных фасетах количество фокусов (значений признаков) может быть меньше минимально необходимого количества разрядов кодового обозначения.
Дата добавления: 2019-09-13 ; просмотров: 408 ; Мы поможем в написании вашей работы!





