Учителю
Представление текстовой информации в компьютере (8 класс)

Представление текстовой информации в компьютере (8 класс)

Автор публикации: Фролов В.В.

Дата публикации: 11.01.2015

Краткое описание: Цель урока: ü сформировать у учащихся представление о том, как в компьютере кодируется текстовая информация.Учащиеся должны научиться: ü кодировать и декодировать символы с помощью таблицы кодов; ü находить информационный объем текстов и сообщений.Программно-дидак

предварительный просмотр материала

Урок по теме: Представление текстовой информации в компьютере (8 класс)

Цель урока:

сформировать у учащихся представление о том, как в компьютере кодируется текстовая информация.

Учащиеся должны научиться:

кодировать и декодировать символы с помощью таблицы кодов;
находить информационный объем текстов и сообщений.

Программно-дидактическое обеспечение: ПК, таблицы кодов, текстовый редактор, калькулятор.

Постановка целей урока.

Как кодируются символы в компьютере? Почему именно так, а не иначе?
Всегда ли разные компьютеры «понимают» друг друга? Почему?
Сколько текстов поместится на дискете? А на жестком диске?

Актуализация знаний.

Как в компьютере кодируются символы?
Что такое «компьютерный алфавит»? Какова его мощность?
Чему равен информационный объем одного символа компьютерного алфавита?
Почему иногда текст, состоящий из букв русского алфавита, полученный с другого компьютера, мы видим на своем компьютере в виде "абракадабры"?

Изложение нового материала.

Компьютеры не самого рождения могли обрабатывать символьную информацию. Лишь с конца 60-х годов они стали использоваться для обработки текстов и в настоящее время большинство пользователей ПК занимаются вводом, редактированием и форматированием текстовой информации.

Таблица кодирования ASCII.

А теперь «заглянем» в память компьютера и разберемся, как же представлена в нем текстовая информация.

Текстовая информация состоит из символов: букв, цифр, знаков препинания, скобок и других. Мы уже говорили, что множество всех символов, с помощью которых записывается текст, называется алфавитом, а число символов в алфавите - его мощностью.

Для представления текстовой информации в компьютере используется алфавит мощностью 256 символов. Мы знаем, что один символ такого алфавита несет 8 битов информации: 2 в 8 степени равно 256. 8 битов = 1 байт, следовательно:

Один символ в компьютерном тексте занимает 1 байт памяти.

Как мы выяснили, традиционно для кодирования одного символа используется 8 бит. И, когда люди определились с количеством бит, им осталось договориться о том, каким кодом кодировать тот или иной символ, чтобы не получилось путаницы, т.е. необходимо было выработать стандарт - все коды символов сохранить в специальной таблице кодов. В первые годы развития вычислительной техники таких стандартов не существовало, а сейчас наоборот, их стало очень много, но они противоречивы. Первыми решили эти проблемы в США, в институте стандартизации. Этот институт ввел в действие таблицу кодов ASCII (American Standard Code for Information Interchange - стандартный код информационного обмена США).

Рассмотрим таблицу кодов ASCII.

Пояснение: раздать учащимся распечатанную таблицу кодов ASCII.

Таблица ASCII разделена на две части. Первая - стандартная - содержит коды от 0 до 127. Вторая - расширенная - содержит символы с кодами от 128 до 255.

Первые 32 кода отданы производителям аппаратных средств и называются они управляющие, т.к. эти коды управляют выводом данных. Им не соответствуют никакие символы.

Коды с 32 по 127 соответствуют символам английского алфавита, знакам препинания, цифрам, арифметическим действиям и некоторым вспомогательным символам.

Коды расширенной части таблицы ASCII отданы под символы национальных алфавитов, символы псевдографики и научные символы.

Стандартная часть таблицы кодов ASCII

Если вы внимательно посмотрите на обе части таблицы, то увидите, что все буквы расположены в них по алфавиту, а цифры - по возрастанию. Этот принцип последовательного кодирования позволяет определить код символа, не заглядывая в таблицу.

Коды цифр берутся из этой таблицы только при вводе и выводе и если они используются в тексте. Если же они участвуют в вычислениях, то переводятся в двоичную систему счисления.

Коды национального (русского) алфавита

расширенной части таблицы ASCII

А
льтернативные системы кодирования кириллицы.

Тексты, созданные в одной кодировке, не будут правильно отображаться в другой. В настоящее время для поддержки букв русского алфавита (кириллицы) существует несколько кодовых таблиц (кодировок), которые используются различными операционными системами, что является существенным недостатком и в ряде случаев приводит к проблемам, связанным с операциями декодирования числовых значений символов.

Для разных типов ЭВМ используются различные кодировки:

В настоящее время существует 5 кодовых таблиц для русских букв: Windows (СР(кодовая страница)1251), MS - DOS (СР(кодовая страница)866), KOИ - 8 (Код обмена информацией, 8-битный) (используется в OS UNIX), Mac (Macintosh), ISO (OS UNIX).

Одним из первых стандартов кодирования кириллицы на компьютерах был стандарт КОИ-8.

Национальная часть кодовой таблицы стандарта КОИ8-Р

В настоящее время применяется и кодовая таблица, размещенная на странице СР866 стандарта кодирования текстовой информации, которая используется в операционной системе MS DOS или сеансе работы MS DOS для кодирования кириллицы.

Н
ациональная часть кодовой таблицы СР866

В настоящее время для кодирования кириллицы наибольшее распространение получила кодовая таблица, размещенная на странице СР1251 соответствующего стандарта, которая используется в операционных системах семейства Windows фирмы Microsoft.

Национальная часть кодовой таблицы СР1251

Во всех представленных кодовых таблицах, кроме таблицы стандарта Unicode, для кодирования одного символа отводится 8 двоичных разрядов (8 бит).

В мире существует примерно 6800 различных языков. Если прочитать текст, напечатанный в Японии на компьютере в России или США, то понять его будет нельзя. Чтобы буквы любой страны можно было читать на любом компьютере, для их кодировки стали использовать 2 байта (16 бит).

N = 2i

2i = 216 = 65536

N = 65536 N - мощность алфавита символов в кодовой таблице Unicode.

i - информационный вес символа

Основополагающая таблица использования кодового пространства Unicode

Начало области

Конец области

Набор символов

Начало области

Конец области

Набор символов

0000

007F

Basic Latin

2150

218F

Number Forms

0080

00FF

Latin-1 Supplement

2190

21FF

Arrows

0100

017F

Latin Extended-A

2200

22FF

Mathematical Operators

0180

024F

Latin Extended-B

2300

23FF

Miscellaneous Technical

0250

02AF

IPA Extensions

2400

243F

Control Pictures

02B0

02FF

Spacing Modifier Letters

2440

245F

Optical Character Recognition

0300

036F

Combining Diacritical Marks

2460

24FF

Enclosed Alphanumerics

0370

03FF

Greek

2500

257F

Box Drawing

0400

04FF

Cyrillic

2580

259F

Block Elements

0530

058F

Armenian

25A0

25FF

Geometric Shapes

0590

05FF

Hebrew

2600

26FF

Miscellaneous Symbols

0600

06FF

Arabic

2700

27BF

Dingbats

0700

074F

Syriac

2800

28FF

Braille Patterns

0780

07BF

Thaana

2E80

2EFF

CJK Radicals Supplement

0900

097F

Devanagari

2F00

2FDF

Kangxi Radicals

0980

09FF

Bengali

2FF0

2FFF

Ideographic Description Characters

0A00

0A7F

Gurmukhi

3000

303F

CJK Symbols and Punctuation

0A80

0AFF

Gujarati

3040

309F

Hiragana

0B00

0B7F

Oriya

30A0

30FF

Katakana

0B80

0BFF

Tamil

3100

312F

Bopomofo

0C00

0C7F

Telugu

3130

318F

Hangul Compatibility Jamo

0C80

0CFF

Kannada

3190

319F

Kanbun

0D00

0D7F

Malayalam

31A0

31BF

Bopomofo Extended

0D80

0DFF

Sinhala

3200

32FF

Enclosed CJK Letters and Months

0E00

0E7F

Thai

3300

33FF

CJK Compatibility

0E80

0EFF

Lao

3400

4DB5

CJK Unified Ideographs Extension A

0F00

0FFF

Tibetan

4E00

9FFF

CJK Unified Ideographs

1000

109F

Myanmar

A000

A48F

Yi Syllables

10A0

10FF

Georgian

A490

A4CF

Yi Radicals

1100

11FF

Hangul Jamo

AC00

D7A3

Hangul Syllables

1200

137F

Ethiopic

D800

DB7F

High Surrogates

13A0

13FF

Cherokee

DB80

DBFF

High Private Use Surrogates

1400

167F

Unified Canadian Aboriginal Syllabics

DC00

DFFF

Low Surrogates

1680

169F

Ogham

E000

F8FF

Private Use

16A0

16FF

Runic

F900

FAFF

CJK Compatibility Ideographs

1780

17FF

Khmer

FB00

FB4F

Alphabetic Presentation Forms

1800

18AF

Mongolian

FB50

FDFF

Arabic Presentation Forms-A

1E00

1EFF

Latin Extended Additional

FE20

FE2F

Combining Half Marks

1F00

1FFF

Greek Extended

FE30

FE4F

CJK Compatibility Forms

2000

206F

General Punctuation

FE50

FE6F

Small Form Variants

2070

209F

Superscripts and Subscripts

FE70

FEFE

Arabic Presentation Forms-B

20A0

20CF

Currency Symbols

FEFF

Specials

20D0

20FF

Combining Marks for Symbols

FF00

FFEF

Halfwidth and Fullwidth Forms

2100

214F

Letterlike Symbols

FFF0

FFFD

Specials

Использование Unicode значительно упрощает создание многоязычных документов, публикаций и программных приложений.

Рассмотрим примеры.

Представьте в форме шестнадцатеричного кода слово «ЭВМ» во всех пяти кодировках. Воспользуемся компьютерным калькулятором для перевода чисел из десятичной в шестнадцатеричную систему счисления.

Последовательности десятичных кодов слова «ЭВМ» в различных кодировках составляем на основе кодировочных таблиц:

КОИ8-Р: 252 247 237

СР1251: 221 194 204

СР866: 157 130 140

Мас: 157 130 140

ISO: 205 178 188

Переводим с помощью калькулятора последовательности кодов из десятичной системы в шестнадцатеричную:

КОИ8-Р: FC F7 ED

СР1251: DD C2 CC

СР866: 9D 82 8C

Мас: 9D 82 8C

ISO: CD B2 BC

Определить числовой код символа в кодировке Unicode с помощью текстового редактора Microsoft Word.

В операционной системе Windows запустить текстовый редактор Microsoft Word.
В текстовом редакторе Microsoft Word ввести команду [Вставка-Символ…]. На экране появится диалоговое окно Символ. Центральную часть диалогового окна занимает фрагмент таблицы символов.

Для определения числового кола знака кириллицы с помощью раскрывающегося списка Набор: выбрать пункт кириллица.
Для определения шестнадцатеричного числового кода символа в кодировке Unicode с помощью раскрывающегося списка из: выбрать тип кодировки Юникод (шестн.).
В таблице символов выбрать символ Э. В текстовом поле код знака : появится его шестнадцатеричный числовой код (в данном случае 042D).

Закрепление изученного материала.

Решение задач.

Используем кодировочные таблицы

№1

Закодируйте с помощью кодировочной таблицы ASCII и представьте в шестнадцатеричной системе счисления следующие тексты:

Password;
Windows;
Информация;
Paint.

Решение:

Найдите в кодовой таблице ASCII коды соответствующих символов (в десятичной системе счисления)

Password → 80 97 115 115 119 111 114 100.
Windows → 87 105 110 100 111 119 115.
Информация → 200 237 244 238 240 236 224 246 232 255
Paint → 80 97 105 110 116

Переведите коды с помощью калькулятора в шестнадцатеричную систему счисления.

80 97 115 115 119 111 114 100 → 50 61 73 73 77 6F 72 64
87 105 110 100 111 119 115 → 57 69 6E 64 6F 77 73
200 237 244 238 240 236 224 246 232 255→ C8 ED F4 EE F0 EC E0 F6 E8 FF
80 97 105 110 116 → 50 61 69 6E 74

Ответ:

50 61 73 73 77 6F 72 64
57 69 6E 64 6F 77 73
C8 ED F4 EE F0 EC E0 F6 E8 FF
50 61 69 6E 74

⇧

⇩

скачать материал