- Учителю
- Открытый урок на тему: Алфавитный подход к определению количества информации. Единицы измерения информации. Кодирование текстовой информации
Открытый урок на тему: Алфавитный подход к определению количества информации. Единицы измерения информации. Кодирование текстовой информации
Тема урока: «Алфавитный подход к определению количества информации. Единицы измерения информации. Кодирование текстовой информации»
Изучение нового материала
Цели урока:
-
познакомить с алфавитным подходом к измерению информации;
-
ввести единицы измерения информации и соотношение между ними;
-
научить вычислять информационный объём сообщения, записанного знаками какого-либо алфавита и представлять его в различных единицах измерения;
-
дать представление о способе хранения текстовой информации в памяти компьютера.
Термины
Алфавит, мощность алфавита, единицы измерения информации, текстовая информация, кодовая таблица.
Ход урока:
-
Организационный момент.
-
Устная работа.
Проверка домашнего задания.1.3
4) 1бит
1.4
1 Кбайт = 210*23=213бит
1 Мбайт = 210*213=223бит
1 Гбайт= 210*223=233бит
1. Что такое код, кодирование, длина кода?
2. Какая единица принимается за количество информации?
Бит - минимальная единица измерения информации.
Байт - единица измерения информации в системе СИ.
-
Теоретически основы урока.
Алфавитный подход к определению количества информации
Алфавит - набор всех допустимых символов знаковой системы.
где N - мощность алфавита;
i - количество информации, которое несёт каждый символ алфавита;
I - Количество информации в сообщении при алфавитном подходе.
4. Объяснение нового материала.
При алфавитном подходе рассматривается запись сообщения с помощью какой-либо знаковой системы. Пусть алфавит знаковой системы состоит из N символов. Представим, что передать нужно всего один символ (это может быть один из N символов). Опять возникает неопределённость. Значит, количество информации, которое несёт сообщение, равное одному знаку, определяется соотношением:
С помощью этой формулы можно определить количество информации, которое несёт знак в двоичной знаковой системе:
Пример 1:
Пусть передаётся простое арифметическое выражение. Алфавит арифметических выражений состоит из 16 знаков:
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, +, -, *, /, (, ) . N=16, => 16=24 =>24 = 2I => I = 4 бит.
Один знак арифметического выражения несёт 4 бита информации.
Пример 2:
Пусть сообщение записано русскими буквами. Алфавит русского языка состоит из 32 знаков(исключая ё) N=32, => 32=25 =>25 = 2I => I = 5 бит.
Один знак русского алфавита несёт 5 бит информации.
Пример 3:
Алфавит двоичной знаковой системы состоит из двух знаков (0,1), поэтому N=2, =>
2=2I => 21=2I => I = 1 бит
Т.О. в двоичной знаковой системе знак несёт 1 бит информации.Информационная ёмкость знака двоичной знаковой системы составляет один бит
Вопросы:
Какова мощность алфавита:
нотных знаков:N=7 (до, ре, ми, фа, соль, ля, си)
Знаков Зодиака:N=12
Цифр: N=10
Латинских букв: N=26
Сообщение состоит из последовательности знаков. Допусти, что сообщение содержит k знаков. Каждый знак несёт определённое количество информации i. Количество информации во всём сообщении: I=i•k.
Пример 4:
Слово «ЭВМ» содержит I = 5 бит • 3 символа = 15 бит
(Информационная ёмкость знака русского алфавита равна 5 бит, N=32, => 32=25 =>25 = 2I => I = 5 бит)
Слово «Компьютер» содержит I = 5 бит • 9 символов = 45 бит.
Пример 5:
Выражение «4+5=9» содержит I = 4 бита • 5символов = 20 бит.
Выражение «2•(4+5)=18» содержит I = 4 бита • 10 символов = 40 бит.
Пример 6:
Двоичный код «1000101» содержит I = 1 бит •7 символов = 7 бит.
Двоичный код «1111111» содержит I = 1 бит •7 символов = 7 бит.
Измерение информации
Памятка
Пример 1:
Необходимо вычислить количество информации, содержащейся на одной странице набранного на компьютере текста. Текст состоит из 50 строк по 60 символов.
Сообщение содержит: k=50•60=3000 символов
Количество информации в тексте:
I = i*k = 1байт • 3000 = 3000 байт = 3000/1024 =2.93 Кбайт
Пример 2:
Вычислить количество информации на 10 страницах.
k = 3000 символов * 10 страниц = 30000 символов.
I = i*k = 1 байт • 30000 символов = 30000 байт = 30000/1024=29.3 Кбайт
Пример 3:
Сколько страниц текста уместится на дискету и компакт-диск?
Объём одной дискеты:
1.44 Мбайт = 1.44 • 1024 = 1509949,44 байт
k = 1509949,44 / 3000 = 500 страниц
Объём одного компакт-диска:
650 Мбайт = 650 • 1024 = 681574400 байт
k = 681574400/3000 = 227190 страниц
Кодирование текстовой информации
Информация, выраженная в письменной форме, называется текстовой информацией.
Достаточно 256 различных символов.
N=2i, 256=2i, 28=2i, i=8 бит
Для представления текста в память компьютера необходимо представить его в двоичной знаковой системе.
Для кодирования каждого знака требуется количество информации, равное 8 битам.
Коды 0-31 соответствуют операциям (перевод строки и т.д)
Коды 32-127 - международный алфавит (латинские буквы, цифры, знаки препинания).
Коды 128-255 - национальный алфавит. В настоящее время существует 5 кодовых таблиц для русских букв (Windows, MS-DOS, КОИ-8, Mac, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.
2
3
4
5
6
7
150
Ц
ж
ж
151
Ч
в
з
152
Ш
ь
и
153
Щ
ы
й
154
Ъ
з
к
Стандарт кодирования Unicode отводит под каждый символ 2 байта, что позволило закодировать многое алфавиты в одной таблице.
N = 2i, 2i = 216 =65536, N=65536 символов в кодовой таблице Unicode.
Домашнее задание: Приложение 1