Урок 24. Представление данных

Данные и информация

Любой компьютер работает с данными. Данные – это зарегистрированные сигналы (цифры, символы, слова, изображения), которые сами по себе не несут смысловой нагрузки для пользователя. Когда данные интерпретируются по определенным правилам, они превращаются в информацию.

Ключевой принцип: вся информация в компьютере представлена в двоичной форме – в виде последовательности всего двух цифр: 0 и 1. Это связано с тем, что удобно реализовывать технические устройства, которые могут надежно находиться только в двух устойчивых состояниях:

есть ток / нет тока;
высокое напряжение / низкое напряжение;
намагничено / не намагничено.

Каждая такая двоичная цифра называется бит (англ. bit – binary digit). Это наименьшая единица измерения информации.

2. Представление числовой информации

2.1. Представление целых чисел

Для представления целых чисел используется несколько схем.

а) Прямой код
Это最简单ший способ. Старший бит (самый левый) отводится под знак числа:

0 – положительное число;
1 – отрицательное число.

Остальные биты представляют собой двоичную запись модуля числа.

Пример: Представим число +5 и -5 в 8-битном прямом коде:

+5 -> 0 0000101
-5 -> 1 0000101

Недостаток: сложность арифметических операций (нужно учитывать знак).

б) Дополнительный код
Это основной способ представления целых чисел в памяти компьютера. Он позволяет заменить операцию вычитания на операцию сложения.

Алгоритм получения дополнительного кода для отрицательного числа:

Записать двоичное представление модуля числа (прямой код без знака).
Инвертировать все биты полученного числа (заменить 0 на 1, 1 на 0). Это обратный код.
К полученному обратному коду прибавить 1.

Пример: Представим число -5 в 8-битном дополнительном коде:

Модуль: 5 -> 00000101
Инвертируем: 11111010 (это обратный код)
Прибавляем 1: 11111010 + 1 = 11111011

Проверим: -5 + 5 = 0.
11111011 (-5) + 00000101 (5) = 1 00000000. Единица в старшем (9-м) бите выходит за разрядную сетку и теряется. Результат: 00000000 (0).

2.2. Представление вещественных чисел

Вещественные числа (числа с дробной частью) представляются в памяти в формате с плавающей запятой (экспоненциальная форма). Этот формат аналогичен записи чисел в стандартном виде (например, 1.5 · 10²).

Любое число X можно записать как:
X = M · R^p
, где:

M – мантисса (дробная часть, определяющая точность числа),
R – основание системы счисления (в компьютере R=2),
p – порядок (экспонента, определяет диапазон representable чисел).

В памяти компьютера число занимает 4 (32 бита) или 8 байт (64 бита). Стандарт IEEE 754 определяет структуру:

1 бит отводится под знак мантиссы.
Определенное количество бит отводится под порядок (смещенный порядок).
Оставшиеся биты отводятся под мантиссу (хранится только ее дробная часть, так как целая часть всегда равна 1 для нормализованных чисел).

Пример для понимания: Число 123.75 в десятичной системе.
123.75 = 1.2375 · 10² -> мантисса 1.2375, порядок 2.

3. Представление текстовой информации

Любой текст состоит из символов: букв, цифр, знаков препинания. Каждому символу ставится в соответствие уникальный двоичный код.

Для кодирования символов используются таблицы кодировки – стандарты, определяющие соответствие между символом и его числовым кодом.

ASCII (American Standard Code for Information Interchange) – 7-битная кодировка, содержит 128 символов (латиница, цифры, управляющие символы). Расширенная версия использует 8 бит (256 символов).
КОИ-8, Windows-1251 (CP1251) – 8-битные кодировки для кириллицы.
Unicode – современный стандарт, предназначенный для кодирования символов всех письменных языков мира. Наиболее распространенная кодировка Unicode – UTF-8, которая является переменной длины (от 1 до 4 байт на символ). Именно UTF-8 является стандартом для web-страниц и современных операционных систем.

Пример: В кодировке Windows-1251 буква 'А' (кириллическая) имеет код 192, что в двоичном виде 11000000.

4. Представление графической информации

4.1. Растровая графика

Изображение разбивается на мелкие элементы – пиксели (picture element). Каждому пикселю ставится в соответствие код его цвета.

Глубина цвета – количество бит, отводимое для кодирования цвета одного пикселя.

1 бит: 2 цвета (черный/белый).
8 бит: 256 цветов (индексированные цвета, палитра).
24 бита (True Color): 2²⁴ ≈ 16.7 млн. оттенков. Цвет представляется как интенсивность трех каналов: Red (8 бит), Green (8 бит), Blue (8 бит) – модель RGB.

Объем растрового изображения вычисляется по формуле:
V = I · J · i, где

I – количество пикселей по горизонтали,
J – количество пикселей по вертикали,
i – глубина цвета в битах.

4.2. Векторная графика

Изображение описывается не как набор точек, а как совокупность графических примитивов (линии, окружности, многоугольники) и математических формул для их описания. Например, окружность задается координатами центра, радиусом, толщиной и цветом линии.

Преимущества: малый объем файла для чертежей и схем, возможность неограниченного масштабирования без потери качества.

Видео урок по данному уроку от учителя информатики Трашкова Олега Леонидовича

Page updated

Google Sites

Report abuse