вторник, 13 февраля 2024 г.

Урок 23. Кодирование текстовой информации

Дата проведения занятия  14.02.24

Для данного поста использованы материалы электронного приложения к  учебнику Информатики для 10 класса Босовой Л.Л., Босовой А.Ю 

Кодировка ASCII и ее расширения

Компьютеры третьего поколения «научились» работать с текстовой информацией. Текстовая информация по своей природе дискретна, т. к. представляется последовательностью отдельных символов.

Для компьютерного представления текстовой информации достаточно:

    1) определить множество всех символов (алфавит), требуемых для представления текстовой информации;

    2) выстроить все символы используемого алфавита в некоторой последовательности (присвоить каждому символу алфавита свой номер);

    3) получить для каждого символа n-разрядный двоичный код (n ≤ 2n), переведя номер этого символа в двоичную систему счисления.

В памяти компьютера хранятся специальные кодовые таблицы, в которых для каждого символа указан его двоичный код. Все кодовые таблицы, используемые в любых компьютерах и любых операционных системах, подчиняются международным стандартам кодирования символов.

Основой для компьютерных стандартов кодирования символов послужил код ASCII (American Standard Code for Information Interchange) — американский стандартный код для обмена информацией, разработанный в 1960-х годах в США и применявшийся для любых, в том числе и некомпьютерных, способов передачи информации (телеграф, факсимильная связь и т. д.). Этот код 7-битовый: общее количество символов составляет 27 = 128, из них первые 32 символа — управляющие, а остальные — изображаемые, т. е. имеющие графическое изображение. К изображаемым символам в ASCII относятся буквы латинского алфавита (прописные и строчные), цифры, знаки препинания и арифметических операций, скобки и некоторые специальные символы.

Стандарт UNICODE

Ограниченность 8-битной кодировки, не позволяющей одновременно пользоваться несколькими языками, а также трудности, связанные с необходимостью преобразования одной кодировки в другую, привели к разработке нового кода. В 1991 году был разработан новый стандарт кодирования символов, получивший название Unicode (Юникод), позволяющий использовать в текстах любые символы любых языков мира.

В Unicode на кодирование символов отводится 31 бит. Первые 128 символов (коды 0-127) совпадают с таблицей ASCII. Далее размещены основные алфавиты современных языков: они полностью умещаются в первой части таблицы, их коды не превосходят 65 536 = 216.


Информационный объем текстового сообщения

 Алфавитный подход позволяет измерить информационный объем сообщения независимо от его содержания.


Более полное представление о кодировании текста вы получите, если посмотрите презентацию  Кодирование текстовой информации из Электронного приложения к учебнику Босовой Л.Л. «Информатика» для 10 класса.
Для тех, кто пропустил урок -  ссылка на учебник Босовой Л.Л., параграф 14

Задания для тренировки

1. Укажите фрагмент текста, имеющий максимальную сумму кодов символов (в таблице ASCII). «19k»; «kzn»; «z99»; «91А». Ответ: «kzn»

2. Используется кодовая таблица CP-1251 (Windows Cirillic). Сколько килобайт будет занимать файл в простом текстовом формате (plain 73 text), если в тексте 200 страниц, на странице 32 строки, а в строке в среднем 48 символов? 307,2; 300; 384; 2400. Ответ: 300 Кб

3. Сообщение на русском языке было первоначально записано в 16-битном коде Unicode. При его перекодировке в 8-битную кодировку КОИ-8 информационное сообщение уменьшилось на 960 бит. Какова длина сообщения в символах? Ответ: 120 символов

4. В таблице ниже представлена часть кодовой таблицы ASCII: 

Символ

1

3

A

T

Z

a

z

Десятичный код

49

51

65

84

90

97

122

Восьмеричный код

61

63

101

124

132

141

172

Каков восьмеричный код символа «t»? Ответ: 164

5. Одна кодировочная таблица содержит 2048 символов. Для кодирования символа с помощью второй таблицы требуется на 2 бита меньше, чем для кодирования символа с помощью первой таблицы. Определите, сколько символов включено во вторую кодировочную таблицу.

Ответ: 512 символов

Комментариев нет:

Отправить комментарий