Для данного поста использованы материалы электронного приложения к учебнику Информатики для 10 класса Босовой Л.Л., Босовой А.Ю
Кодировка ASCII и ее расширения
Компьютеры третьего поколения «научились» работать с текстовой информацией. Текстовая информация по своей природе дискретна, т. к. представляется последовательностью отдельных символов.
Для компьютерного представления текстовой информации достаточно:
1) определить множество всех символов (алфавит), требуемых для представления текстовой информации;
2) выстроить все символы используемого алфавита в некоторой последовательности (присвоить каждому символу алфавита свой номер);
3) получить для каждого символа n-разрядный двоичный код (n ≤ 2n), переведя номер этого символа в двоичную систему счисления.
В памяти компьютера хранятся специальные кодовые таблицы, в которых для каждого символа указан его двоичный код. Все кодовые таблицы, используемые в любых компьютерах и любых операционных системах, подчиняются международным стандартам кодирования символов.
Основой для компьютерных стандартов кодирования символов послужил код ASCII (American Standard Code for Information Interchange) — американский стандартный код для обмена информацией, разработанный в 1960-х годах в США и применявшийся для любых, в том числе и некомпьютерных, способов передачи информации (телеграф, факсимильная связь и т. д.). Этот код 7-битовый: общее количество символов составляет 27 = 128, из них первые 32 символа — управляющие, а остальные — изображаемые, т. е. имеющие графическое изображение. К изображаемым символам в ASCII относятся буквы латинского алфавита (прописные и строчные), цифры, знаки препинания и арифметических операций, скобки и некоторые специальные символы.
Стандарт UNICODE
Ограниченность 8-битной кодировки, не позволяющей одновременно пользоваться несколькими языками, а также трудности, связанные с необходимостью преобразования одной кодировки в другую, привели к разработке нового кода. В 1991 году был разработан новый стандарт кодирования символов, получивший название Unicode (Юникод), позволяющий использовать в текстах любые символы любых языков мира.
В Unicode на кодирование символов отводится 2 байта. Первые 128 символов (коды 0-127) совпадают с таблицей ASCII. Далее размещены основные алфавиты современных языков: они полностью умещаются в первой части таблицы, их коды не превосходят 65 536 = 216.
Информационный объем текстового сообщения
Задания для тренировки к контрольной работе
1. Укажите фрагмент текста, имеющий максимальную и минимальную сумму кодов символов (в таблице ASCII). «19k»; «kzn»; «z99»; «kzN»; «91А».
2. Используется кодовая таблица CP-1251 (Windows Cirillic). Сколько килобайт будет занимать файл в простом текстовом формате (plain 73 text), если в тексте 200 страниц, на странице 32 строки, а в строке в среднем 48 символов? Варианты ответов: 307,2 Кб; 300 Кб; 384 Кб; 2400 Кб.
3. Сообщение на русском языке было первоначально записано в 16-битном коде Unicode. При его перекодировке в 8-битную кодировку КОИ-8 информационное сообщение уменьшилось на 960 бит. Какова длина сообщения в символах?
4. Фразу "Я кодирую в Windows-1251" закодировали с помощью кодовой таблицы Windows-1251. Какой текст получит пользователь, если для раскодирования воспользуется таблицей КОИ-8?
Кодовые таблицы в учебнике Босовой Л.Л., стр 140-141
5. В таблице ниже представлена часть кодовой таблицы ASCII:
Каков восьмеричный код символа «t»? Каков восьмеричный код символа «F»?
6. Одна кодировочная таблица содержит 2048 символов. Во второй таблице для кодирования символа требуется на 2 бита меньше, чем для кодирования символа с помощью первой таблицы. Определите, сколько символов включено во вторую кодировочную таблицу.
Комментариев нет:
Отправить комментарий