Вход
кодирование текста в информатике

Криптография: кодирование информации в информатике

В предыдущей статье мы обсуждали, как компьютер понимает числа. Они получаются из других чисел – двоичных, которые компьютер понимает. А как быть с буквами? Картинками? Играми?

Какие вообще бывают виды кодирования информации в науке обращения с компьютером – информатике?

Тут надо на секунду задуматься, как общаются сами люди. Мы используем слова, из слов делаем предложения, из предложений – текст, рассказ, диалог. Но чтобы сделать слово, мы используем буквы, которых всего-навсего 33 штуки!

Просто представьте: все книги, которые вы когда-либо читали – это лишь разные сочетания одних и тех же 33 букв.

Но мы делаем из букв слова по определённым правилам, а словами обозначаем предметы, свойства, действия, эмоции, фантазии. Буквы – это кубики, из которых мы строим слова. А слова – это код, которым мы обозначаем всё, что встречается в нашей жизни, чтобы потом об этом кому-нибудь рассказать.

Точно так же происходит и с компьютером. При помощи цифр мы объясняем компьютеру, что у него есть монитор, мышка, клавиатура и другие детали, рассказываем, как с ними обращаться и как реагировать, когда что-то делаем мы.

Но сейчас мы с вами поговорим о более конкретных и практических кодах. И начнём с того, как компьютер понимает буквы.

Раз компьютер знает только цифры, значит и буквы он видит через цифры. Это, примерно, как если бы мы букву А записали как 1, Б как 2, В как 3, и так далее.

кодирование в информатике

Примерно такие таблицы (только больше и сложнее) компьютер и использует, чтобы понимать буквы.

Представьте себе: кто-то записал анекдот на компьютер и прислал вам. Вы открываете документ, а там ничего непонятно. Примерно вот так:

 Р§РµР"овек сейчас СѓРІРёРґРёС‚ Р"ишь то, что ожидает увидеть.

Это компьютер ошибся с кодировкой. Что такое кодирование в информатике? Так обычно называют присвоение каждому символу (букве, знакам препинания и так далее) определённого кода согласно специальной табличке. Кодировка – это способ, которым зашифровывает и расшифровывает буквы компьютер, можно сказать, табличка, которую он выбирает. Табличек у него на такой случай много, и надо знать, по какой расшифровывать, иначе получится белиберда.

Давайте немножко побудем компьютером. У нас с вами будет две таблички: в одной сначала будет идти алфавит, а потом знаки препинания, в другой – наоборот.

Кодировочная Таблица 1:

кодирование текста детям

Кодировочная Таблица 2:

кодирование текста для детей

Зашифруем с вами фразу «Пароль – три зелёных свистка». Зашифровывать мы будем по первой таблице, а расшифровывать – по второй.

Первая буква – П. В первой таблице у неё номер 17. Дальше буква А. У неё номер 1. Продолжите сами и проверьте себя, правильно ли у вас получится!

А получилась в итоге вот такая строчка:

17-1-18-16-13-30 38 20-18-10 9-6-13-6-15-29-23 19-3-10-19-20-12-1

Теперь попробуем расшифровать её при помощи второй таблицы.

Во второй таблице цифра 17 у буквы И, цифра 1 у точки и так далее (расшифруйте сами).

У нас получилось:

И.йзех э лйв(жфо к?вклд

(Самые внимательные из вас наверняка заметили, на что это похоже из шифров, про которые мы говорили в первой статье).

Итак, результат, во-первых, непонятный, а, во-вторых, совершенно не похож на ту фразу, которую мы хотели передать. И получилось это из-за того, что таблица для шифровки и таблица для дешифровки не совпали.

Точно так же с фразой и с текстом вроде «Р§РµР"овек сейчас» – так получается, когда компьютер пытается расшифровать текст не по той таблице, по которой он был зашифрован. Ещё в таких случаях говорят, что «в тексте неправильная кодировка». Сам текст от этого не испортился, просто программе где-нибудь в настройках надо указать, какой кодировкой воспользоваться (обычно это utf8, или UNICODE, или как в этом случае Windows-1251).

Давным-давно, когда компьютеры были большими, а жёсткие диски в них –маленькими, придумали кодировку ASCII (читается как «аскИ»).

как объяснить кодирование в информатике

Это табличка, где зашифрованы буквы латинского алфавита (мы обычно привыкли о них думать, как об английских буквах), знаки препинания и некоторые служебные символы (например, символ, который обозначает, что надо продолжить с нового абзаца).

Когда в компьютерах придумывают что-то новое, однажды бывает очень важно, чтобы кто-то сказал: «А теперь ВОТ ЭТО мы все делаем одинаково». Например, весь вай-фай в мире работает примерно одинаково, поэтому почти любой телефон может подключиться почти к любой точке вай-фай.

Точно так же произошло и с кодировочной таблицей. Мы с вами раньше уже убедились, что она обязательно должна быть одинаковая у отправителя и получателя, и этой одинаковой таблицей стала ASCII аж в 1963 году.

Сначала всё было замечательно, но потом компьютеры стали становиться меньше и удобнее, ими стали пользоваться разные люди, в том числе не знающие английского. А русский, например, алфавит (который также называют «кириллица») в ASCII не входит. Как быть? Куда бежать? И в 1991 году был придуман UNICODE (читается как «Юникод» или «Уникод» – почти как «Универмаг», но не магазин).

объяснить детям кодирование в информатике

Юникод может закодировать очень большое число символов из разных письменностей: китайские иероглифы, математические символы, буквы греческого алфавита, латиницы и кириллицы.

ASCII стала первой частью Юникода, и специальные договоренности в программах позволяют читать при помощи Юникода текст, который был закодирован в ASCII.

Когда вы сохраняете файл в том же «Блокноте», вы можете выбрать кодировку и при выборе заметить, что их гораздо больше, чем мы разобрали в статье.

В заключение давайте поговорим, где какая кодировка нужна.

Обычно выбором кодировки занимаются люди, работающие с компьютерами профессионально – при написании программ, настройки баз данных и т. п. Мы с вами не будем вникать во все тонкости, и рассмотрим этот вопрос в общих чертах:

Windows-1251

Как видно из названия, это основная кодировка операционных систем семьи Windows. Когда вы точно знаете, что все компьютеры, которые будут работать с файлами, используют Windows – она отличный выбор. Если же нет, могут возникнуть проблемы с невидимыми символами. Потому что Windows-1251 их считает служебными, а многие другие кодировки решают, что это такие буквы непонятные, и в результате случается неразбериха.

ASCII

Старая, но надёжная. Подойдёт, если ваш текст на английском, а компьютер, где надо открыть файл – очень, очень старый.

UNICODE

Это рекомендуемая кодировка для всех систем! Если друг прислал вам файл, а у вас в нём кракозябры, попросите его пересохранить файл с кодировкой unicode, и, скорее всего, проблема будет решена.

UTF-8

Вариант записи того же Юникода. Он специфический, и обычно используется программами при общении внутри себя самих (например, общение программы со своей базой данных).

Итак, кодированием текста в информатике обычно называют способ компьютера перевести текст в понятный ему вид по одной из общепринятых табличек. Если файл был сохранён в одной кодировке, а открыт в другой – обычно получается белиберда вместо текста.

Все компьютеры знают одни и те же кодировки, чтобы понимать файлы, сделанные другими компьютерами, но кодировки существуют разные – под разные цели. Лучше всего сохранять файлы в кодировке UNICODE –  так больше всего шансов, что у другого человека этот файл откроется.

Как можно увидеть, криптография – это не только наука про тайны и не только детская игра. У этой науки есть множество простых практических точек приложения, и если ребёнок знаком с её концепциями, то многое, что может испугать, сбить с толку и привести в отчаяние, для него будет просто задачей, к которой надо найти правильное решение.

Ави Айвер

Оставить комментарий

apteka mujchine for man ukonkemerovo woditely driver.