Дискретное (цифровое) представление текстовой, графической, звуковой информации

Компьютеры часто используются для обработки текстовой информации.

В каждом компьютере используется некоторая система кодирования символьных данных, сопоставляющая каждому символу - цифре, букве, специальному знаку - определенный двоичный код.

Количество разных символов, которые может различать компьютер, зависит от числа двоичных разрядов, отводимых для кодирования любого символа.

Традиционно для кодирования одного символа используется количество информации, равное 1 байту, то есть I= 1 байт = 8 битов.

Для кодирования одного символа требуется 1 байт информации. Если рассматривать символы как возможные события, то можно вычислить, какое количество различных символов можно закодировать:

N = 2I = 28 = 256

Такое количество символов вполне достаточно для представления текстовой информации, включая прописные и строчные буквы русского и латинского алфавита, цифры, знаки, графические символы и пр.

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертаниям, а компьютер — по их кодам.

При вводе в компьютер текстовой информации происходит ее двоичное кодирование, изображение символа преобразуется в его двоичный код. Пользователь нажимает на клавиатуре клавишу с символом, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает один байт.

В процессе вывода символа на экран компьютера производится обратный процесс — декодирование, то есть преобразование кода символа в его изображение.

Важно, что присвоение символу конкретного кода — это вопрос соглашения, которое фиксируется в кодовой таблице (например, ASCII (англ. AmericanStandardCodeforInformationInterchange) — американский стандартный код для обмена информацией.ASCII представляет собой кодировку для представления десятичных цифр, латинского и национального алфавитов, знаков препинания и управляющих символов). Первые 33 кода (с 0 по 32) соответствуют не символам, а операциям (перевод строки, ввод пробела и так далее).

Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

Коды с 128 по 255 являются национальными, то есть в национальных кодировках одному и тому же коду соответствуют различные символы.

В настоящее время существуют пять различных кодовых таблиц для русских букв (КОИ8, СР1251, СР866, Маc, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.

Широкое распространение получил новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, поэтому с его помощью можно закодировать не 256 символов, а N = 216 = 65536 различных символов. Эту кодировку поддерживают последние версии платформы MicrosoftWindows&Office (начиная с 1997 года). 

Аналоговый и дискретный способы представления изображений и звука

Человек способен воспринимать и хранить информацию в форме образов (зрительных, звуковых, осязательных, вкусовых и обонятельных).

Информация, в том числе графическая и звуковая, может быть представлена в аналоговой или дискретной форме. При аналоговом представлении физическая величина принимает бесконечное множество значений, причем ее значения изменяются непрерывно. При дискретном представлении физическая величина принимает конечное множество значений, причем ее величина изменяется скачкообразно.

Преобразование графической и звуковой информации из аналоговой формы в дискретную производится путем дискретизации, то есть разбиения непрерывного графического изображения и непрерывного (аналогового) звукового сигнала на отдельные элементы. В процессе дискретизации производится кодирование, то есть присвоение каждому элементу конкретного значения в форме кода.

 Дискретизация — это преобразование непрерывных изображений и звука в набор дискретных значений в форме кодов.

Двоичное кодирование графической информации

Пространственная дискретизация. В процессе кодирования изображения производится его пространственная дискретизация. Пространственную дискретизацию изображения можно сравнить с построением изображения из мозаики (большого количества маленьких разноцветных стекол). Изображение разбивается на отдельные маленькие фрагменты (точки), причем каждому фрагменту присваивается значение его цвета, то есть код цвета (красный, зеленый, синий и так далее).

Формирование растрового изображения. Графическая информация на экране монитора представляется в виде растрового изображения, которое формируется из определенного количества строк, которые в свою очередь содержат определенное количество точек (пикселей).

Качество изображения определяется разрешающей способностью монитора, т.е. количеством точек, из которых оно складывается. Чем больше разрешающая способность, то есть чем больше количество строк растра и точек в строке, тем выше качество изображения. В современных персональных компьютерах обычно используются три основные разрешающие способности экрана: 800 х 600, 1024 х 768 и 1280 х 1024 точки.

Цветные изображения формируются в соответствии с двоичным кодом цвета каждой точки, хранящимся в видеопамяти. Цветные изображения могут иметь различную глубину цвета, которая задается количеством битов, используемым для кодирования цвета точки. Наиболее распространенными значениями глубины цвета являются 8, 16, 24 или 32 бита.

Качество двоичного кодирования изображения определяется разрешающей способностью экрана и глубиной цвета

Глубина цвета и количество отображаемых цветов

Глубина цвета (I)

Количество отображаемых цветов (N)

8

28 = 256

16(High Color)

216 = 65 536

24 (True Color)

224= 16 777 216

32 (TrueColor)

232 = 4 294 967 296

Цветное изображение на экране монитора формируется за счет смешивания трех базовых цветов: красного, зеленого и синего. Такая цветовая модель называется RGB-моделью по первым буквам английских названий цветов (Red, Green, Blue).

Для получения богатой палитры цветов базовым цветам могут быть заданы различные интенсивности. Например, при глубине цвета в 24 бита на каждый из цветов выделяется по 8 бит, то есть для каждого из цветов возможны N = 28 = 256 уровней интенсивности, заданные двоичными кодами (от минимальной — 00000000 до максимальной — 11111111).

Графический режим. Графический режим вывода изображения на экран монитора определяется величиной разрешающей способности и глубиной цвета. Для того чтобы на экране монитора формировалось изображение, информация о каждой его точке (код цвета точки) должна храниться в видеопамяти компьютера. Рассчитаем необходимый объем видеопамяти для одного из графических режимов, например, с разрешением 800 х 600 точек и глубиной цвета 24 бита на точку.

Всего точек на экране: 800 • 600 = 480 000.

Необходимый объем видеопамяти:

24 бит • 480 000 = 11 520 000 бит = 1 440 000 байт = 1406,25 Кбайт = 1,37 Мбайт.

Аналогично рассчитывается необходимый объем видеопамяти для других графических режимов.

В Windows предусмотрена возможность выбора графического режима и настройки параметров видеосистемы компьютера, включающей монитор и видеоадаптер.

Единицы измерения объема информации в компьютере

Количество информации, хранящейся в ЭВМ, измеряется ее "длиной” (или "объемом”), которая выражается в битах (от английского binary digit - двоичная цифра).

Каждый разряд (цифру) двоичного числа называют битом.

Бит - минимальная единица измерения информации.

В каждом бите может храниться 0 или 1.

Чаще всего в компьютере для кодирования символа отводится фиксированное число двоичных разрядов, равное 8 и называемое байтом.

В этом случае всего можно закодировать до 28=256 различных символов.

Информационным объемом сообщения называется количество битов в этом сообщении.

Единицы измерения информационного объема сообщения

1 байт = 8 бит;

1 Кбайт = 210 байт = 1024 байт ≈ 1000 (1 тыс.) байт;

1 Мбайт = 210 Кбайт = 1024 Кбайт ≈ 1000000 (1 млн.) байт;

1 Гбайт = 210 Мбайт = 1024 Мбайт ≈ 1000000000 (1 млрд.) байт;

При работе с текстовой информацией для кодирования одного символа используется количество информации, равное 1 байту, то есть I= 1 байт = 8 битов.

Пример: Некоторое время назад для хранения информации использовались односторонние 5-дюймовые дискеты, на которых можно было записать 360 Кбайт информации. Определим, документ из скольких знаков можно сохранить на такой дискете.

360 Кбайт = 360 * 1024 = 368640 Байт

Из-за особенностей записи информации на дисковых магнитных носителях расчет можно производить приблизительно, т.е. считать, что килобайт содержит примерно 1000 байт, что значительно облегчает расчет: