четверг, 13 февраля 2025 г.

Урок 22. Кодирование текстовой информации

Дата проведения занятия  13.02.25

Для данного поста использованы материалы электронного приложения к  учебнику Информатики для 10 класса Босовой Л.Л., Босовой А.Ю 

Кодировка ASCII и ее расширения

Компьютеры третьего поколения «научились» работать с текстовой информацией. Текстовая информация по своей природе дискретна, т. к. представляется последовательностью отдельных символов.

Для компьютерного представления текстовой информации достаточно:

    1) определить множество всех символов (алфавит), требуемых для представления текстовой информации;

    2) выстроить все символы используемого алфавита в некоторой последовательности (присвоить каждому символу алфавита свой номер);

    3) получить для каждого символа n-разрядный двоичный код (n ≤ 2n), переведя номер этого символа в двоичную систему счисления.

В памяти компьютера хранятся специальные кодовые таблицы, в которых для каждого символа указан его двоичный код. Все кодовые таблицы, используемые в любых компьютерах и любых операционных системах, подчиняются международным стандартам кодирования символов.

Основой для компьютерных стандартов кодирования символов послужил код ASCII (American Standard Code for Information Interchange) — американский стандартный код для обмена информацией, разработанный в 1960-х годах в США и применявшийся для любых, в том числе и некомпьютерных, способов передачи информации (телеграф, факсимильная связь и т. д.). Этот код 7-битовый: общее количество символов составляет 27 = 128, из них первые 32 символа — управляющие, а остальные — изображаемые, т. е. имеющие графическое изображение. К изображаемым символам в ASCII относятся буквы латинского алфавита (прописные и строчные), цифры, знаки препинания и арифметических операций, скобки и некоторые специальные символы.

Стандарт UNICODE

Ограниченность 8-битной кодировки, не позволяющей одновременно пользоваться несколькими языками, а также трудности, связанные с необходимостью преобразования одной кодировки в другую, привели к разработке нового кода. В 1991 году был разработан новый стандарт кодирования символов, получивший название Unicode (Юникод), позволяющий использовать в текстах любые символы любых языков мира.

В Unicode на кодирование символов отводится 2 байта. Первые 128 символов (коды 0-127) совпадают с таблицей ASCII. Далее размещены основные алфавиты современных языков: они полностью умещаются в первой части таблицы, их коды не превосходят 65 536 = 216.


Информационный объем текстового сообщения

 Алфавитный подход позволяет измерить информационный объем сообщения независимо от его содержания.


Более полное представление о кодировании текста вы получите, если посмотрите презентацию Кодирование текстовой информации из Электронного приложения к учебнику Босовой Л.Л. «Информатика» для 10 класса.
Для тех, кто пропустил урок ссылка на учебник Босовой Л.Л.,  параграф 14, стр 138


Домашнее задание.
Задания для тренировки к контрольной работе

Проработать параграф 14, стр 138  из учебника Босовой Л.Л.


1. Укажите фрагмент текста, имеющий максимальную и минимальную сумму кодов символов (в таблице ASCII). «19k»; «kzn»; «z99»; «kzN»; «91А».

2. Используется кодовая таблица CP-1251 (Windows Cirillic). Сколько килобайт будет занимать файл в простом текстовом формате (plain 73 text), если в тексте 200 страниц, на странице 32 строки, а в строке в среднем 48 символов? Варианты ответов: 307,2 Кб; 300 Кб; 384 Кб; 2400 Кб

3. Сообщение на русском языке было первоначально записано в 16-битном коде Unicode. При его перекодировке в 8-битную кодировку КОИ-8 информационное сообщение уменьшилось на 960 бит. Какова длина сообщения в символах?

4. Фразу "Я кодирую в Windows-1251" закодировали с помощью кодовой таблицы Windows-1251. Какой текст получит пользователь, если для раскодирования воспользуется таблицей КОИ-8?

Кодовые таблицы в учебнике Босовой Л.Л., стр 140-141 

5. В таблице ниже представлена часть кодовой таблицы ASCII: 

Символ

1

3

A

T

Z

a

z

Десятичный код

49

51

65

84

90

97

122

Восьмеричный код

61

63

101

124

132

141

172

Каков восьмеричный код символа «t»?  Каков восьмеричный код символа «F»? 

6. Одна кодировочная таблица содержит 2048 символов. Во второй таблице для кодирования символа требуется на 2 бита меньше, чем для кодирования символа с помощью первой таблицы. Определите, сколько символов включено во вторую кодировочную таблицу.


Комментариев нет:

Отправить комментарий