Сколько символов содержит компьютерный алфавит
Перейти к содержимому

Сколько символов содержит компьютерный алфавит

  • автор:

1. Алфавитный (объёмный) подход к измерению информации

С помощью алфавитного подхода можно определять количество информации в текстовом сообщении, которое состоит из символов определённого алфавита.

Алфавит — это набор символов, которые используются в некотором языке с целью представления информации.

В качестве символов могут быть использованы буквы, цифры, скобки, специальные знаки.
Мощность алфавита — это количество символов в алфавите, которое вычисляется по формуле:
N = 2 i , где \(i\) — информационный вес символа.

Например, мощность алфавита, состоящего из \(26\) латинских букв и дополнительных символов (скобки, пробел, знаки препинания (\(11\) шт.), \(10\) цифр), — \(47\).

Информационный вес \(1\) символа, \(i\) (бит)
Мощность алфавита, \(N\)

определи информационный объём сообщения (в Кбайтах), состоящего из 8192 символов, если используется алфавит из 128 символов.

Составим краткую запись условия задачи.

1. определим, какое количество бит необходимо для кодировки одного символа. Так как мощность используемого алфавита \(N\)\(=\) 128 , то \(i\) \(=\) 7 (использовали формулу N = 2 i ).

2. Вычислим информационный объём сообщения, которое состоит из 8192 символов, используя формулу I = K · i :

I = 8192 ⋅ 7 \(=\) 57344 бит.
3. Переведём биты в Кбайты.
Поскольку \(1\) байт \(=\) \(8\) бит, \(1\) Кбайт \(=\) \(1024\) байт, получим:
57344 бит \(=\) 57344 8 байт \(=\) 7168 байт \(=\) 7168 1024 Кбайт \(=\) 7 Кбайт.
Ответ: 7 Кбайт.
Единицы измерения информации

Любая компьютерная техника работает в двоичном коде, понимая только значения \(0\) — «сигнала нет» и \(1\) — «сигнал есть». Эти значения хранятся в бите — наименьшей единице измерения информации. Однако удобнее использовать более крупные единицы измерения информации, которые приведены в таблице.

\(1\) байт \(8\) бит \(=\) 2 3 бит
\(1\) Кбайт (килобайт) 2 10 байт
\(1\) Мбайт (мегабайт) 2 10 Кбайт
\(1\) Гбайт (гигабайт) 2 10 Мбайт
\(1\) Тбайт (терабайт) 2 10 Гбайт

1) определить, сколько Мбайт информации содержится в \(512\) битах. Ответ дай в виде степени числа \(2\).

2. Информационный объём сообщения

Каждый объект в компьютере (или любом другом электронном устройстве) имеет свой информационный объём, то есть то количество информации, которое он занимает в памяти устройства.

Например, текстовый документ на \(2\)–\(3\) страницы может иметь информационный объём \(150\) Кб.
Изображение в хорошем качестве — \(2\)–\(4\) Мб.
Аудиофайл с песней на \(3\) минуты — около \(6\) Мб.
Рассмотрим измерение текстовой информации в компьютере.

Размер текстового сообщения зависит от того, с помощью какого алфавита он был написан и сколько в нём символов.

Алфавит (N) — это количество символов в некотором языке.
Чем больше алфавит, тем больше информационный вес одного символа.
Информационный вес одного символа (i) — это количество информации, которое отводится на один символ.
Обрати внимание!
Они связаны формулой: N = 2 i .

Например, в русском алфавите \(33\) буквы, вычислим информационный вес одного символа по формуле: 33 = 2 i , i ≈ 6 бит. То есть вес одного символа (буквы) — \(6\) бит.

Представим, что в тетрадке записана следующая строка: «Мама сидела за столом».
Как посчитать, сколько информации несёт в себе это сообщение?

Нам известно, сколько весит один символ — \(6\) бит, можно подсчитать количество символов в данном сообщении — \(18\), соответственно, чтобы найти, сколько всего информации несёт в себе это сообщение, нужно перемножить информационный вес одного символа и количество символов в сообщении.

Урок информатики в 8-м классе по теме «Количество информации»

— Ребята давайте понаблюдаем за тем , что мы видим за окном. Что вы можете сказать о природе? (Наступила зима.)
— Но почему вы решили, что наступила зима? (Холодно , идет снег.)
— Но ведь нигде не написано, что это признаки зимы. (Но мы знаем, что все это означает: наступила зима.)

Поэтому и получается, что , то знание, которое мы извлекаем из окружающей действительности и есть информация. (слайд 1)

Заполнить таблицу и стрелочками показать соответствия.

Носители информации Их использование
Дискета Написать письмо
Бумага Записать компьютерную игру
Аудиокассета Сделать фотоизображение
Фотопленка Записать исполнение песни
Видеокассета Записать ноты песни

— Можно ли измерить количество информации и как это сделать? (Да)

Оказывается, информацию также можно измерять и находить ее количество.

Существуют два подхода к измерению информации. С одним из них мы сегодня познакомимся. (Смотри приложение слайд 2)

2. Изучение нового материала.

Каким образом можно найти количество информации?

У нас есть небольшой текст, написанный на русском языке. Он состоит из букв русского алфавита, цифр, знаков препинания. Для простоты будем считать, что символы в тексте присутствуют с одинаковой вероятностью.

Множество используемых в тексте символов называется алфавитом.

В информатике под алфавитом понимают не только буквы, но и цифры, и знаки препинания, и другие специальные знаки.

У алфавита есть размер (полное количество символов), который называется мощностью алфавита. При алфавитном подходе считается, что каждый символ текста имеет определенный “информационный вес”. С увеличением мощности алфавита увеличивается информационный вес символов этого алфавита.

Обозначим мощность алфавита через N.

Найдем зависимость между информационным весом символа (i) и мощностью алфавита (N). Самый наименьший алфавит содержит 2 символа, которые обозначаются “0” и “1”. Информационный вес символа двоичного алфавита принят за единицу информации и называется 1 бит. (Cмотри приложение слайд 3)

N 2 4 8 16 32 64 128 256
i 1бит 2бит 3бит 4бит 5бит 6бит 7бит 8бит

N= 2 i

В компьютере также используется свой алфавит, который можно назвать компьютерным. Количество символов, которое в него входит, равно 256 символов. Это мощность компьютерного алфавита.

Также мы выяснили, что закодировать 256 разных символов можно показать с помощью 8 битов.

8 бит является настолько характерной величиной, что ей присвоили свое название – байт.

Используя этот факт: можно быстро подсчитать количество информации, содержащееся в компьютерном тексте, т.е.в тексте набранном с помощью компьютера, учитывая, что большинство статей, книг, публикаций и т.д. написаны с помощью текстовых редакторов, то таким способом можно найти информационный объем любого сообщения, созданного подобным образом.

Правило для измерения информации с точки зрения алфавитного подхода посмотрим на слайде. (Cмотри приложение слайд 4)

Пример:

Найти информационный объем страницы компьютерного текста.

1. Найдем мощность: N=256
2. Найдем информационный объем одного символа : N= 2 i i = 8 бит = 1 байт.
3. Найдем количество символов на странице. Примерно.

(Найти количество символов в строке и умножить на количество строк)

Пусть дети выберут произвольную строку и подсчитают количество символов в ней, учитывая все знаки препинания и пробелы.

40 символов * 50 строк = 2000символов.

4. Найдем информационный объем всей страницы: 2000 * 1 = 2000 байтам

Согласитесь, что байт – маленькая единица измерения информации. Для измерения больших объемов информации используют следующие единицы (Cмотри приложение слайд5)

3. Закрепление изученного материала.

Заполнить пропуски числами и проверить правильность.

1 Кбайт = ___ байт = ______бит,
2 Кбайт = _____ байт =______бит,
24576 бит =_____байт =_____Кбайт,
512 Кбайт = ___ байт =_____бит.

Предлагается ученикам задачи:

1) Сообщение записано с помощью алфавита, содержащего 8 символов. Какое количество информации несет одна буква этого алфавита?

Решение: N=8 , то i= 3 битам

2) Сообщение , записанное буквами из 128-символьного алфавита, содержит 30 символов. Какой объем информации оно несет?

1. N= 128 , K=30
2. N= 2 i i= 7 битам (объем одного символа)
3. I = 30*7 = 210бит (объем всего сообщения)

4. Творческая работа.

Наберите на компьютере текст, информационный объем которого равен 240 байт.

5. Итоги урока.

— Что нового сегодня мы узнали на уроке?
— Как определяется количество информации с алфавитной точки зрения?
— Как найти мощность алфавита?
— Чему равен 1байт?

6. Домашнее задание (Cмотри приложение слайд 6).

Выучить правило для измерения информации с точки зрения алфавитного подхода.

Выучить единицы измерения информации.

1) Мощность некоторого алфавита равна 64 символам. Каким будет объем информации в тексте, состоящем из 100символов.
2) Информационный объем сообщения равен 4096 бит. Оно содержит 1024 символа. Какова мощность алфавита, с помощью которого составлено это сообщение?

Измерение информации. Алфавитный подход к измерению информации. Мощность алфавита. Информационный объем текста

на главную

Алфавитный подход к измерению информации Вам хорошо известно, что для измерения таких величин, как, например, расстояние, масса, время, существуют эталонные единицы. Для расстояния — это метр, для массы — килограмм, для времени — секунда. Измерение происходит путем сопоставления измеряемой величины с эталонной единицей. Сколько раз эталонная единица укладывается в измеряемой величине, таков и результат измерения. Следовательно, и для измерения информации должна быть введена своя эталонная единица. Алфавитный подход позволяет измерять информационный объем текста на некотором языке (естественном или формальном), не связанный с содержанием этого текста.

Алфавит. Мощность алфавита
Под алфавитом мы будем понимать набор букв, знаков препинания, цифр, скобок и др. символов, используемых в тексте. В алфавит также следует включить и пробел, т. е. пропуск между словами.
Полное число символов в алфавите принято называть мощностью алфавита. Будем обозначать эту величину буквой N. Например, мощность алфавита из русских букв и отмеченных дополнительных символов равна 54:33 буквы + 10 цифр + 11 знаков препинания, скобки, пробел.

Информационный вес символа
При алфавитном подходе считается, что каждый символ текста имеет определенный информационный вес. Информационный вес символа зависит от мощности алфавита. А каким может быть наименьшее число символов в алфавите? Оно равно двум! Скоро вы узнаете, что такой алфавит используется в компьютере. Он содержит всего 2 символа, которые обозначаются цифрами «0» и «1». Его называют двоичным алфавитом. Изучая устройство и работу компьютера, вы узнаете, как с помощью всего двух символов можно представить любую информацию.

Информационный вес символа двоичного алфавита принят за единицу информации и называется 1 бит.

С увеличением мощности алфавита увеличивается информационный вес символов этого алфавита. Так один символ из четырехсимвольного алфавита (N = 4) «весит» 2 бита. Объяснение этому можно дать следующее: все символы такого алфавита можно закодировать всеми возможными комбинациями из двух цифр двоичного алфавита. Комбинацию из нескольких (двух, трех и т. д.) знаков двоичного алфавита назовем двоичным кодом.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *