Хранение и кодирование информации

 

План


Введение

І. Информационные ресурсы

. Понятие «Информационный ресурс»

. Возникновение информационных ресурсов

. Возникновение информационных технологий и компьютерных средств

. Информация и данные

. Динамика роста информационных потребностей

. Смена приоритета информационного развития

ІІ. Процессы, методы и средства технологии хранения информации

. Единицы измерения памяти

. Принцип хранения данных

. Классификация памяти по функциональности

. Классификация запоминающих устройств

ІІІ. Кодирование информации. Методы и средства кодирования информации на сегодняшний день

. Понятие «кодирование информации» и его смысл

. Способы кодирования

. Таблицы кодировок

Заключение

Список литературы


Введение


К концу XX в. стала складываться, сначала в рамках кибернетики, а затем информатики, информационная картина мира. Строение и функционирование сложных систем различной природы (биологических, социальных, технических) оказалось невозможным объяснить, не рассматривая общих закономерностей информационных процессов.

Получение и преобразование информации является условием жизнедеятельности любого организма. Даже простейшие одноклеточные организмы постоянно воспринимают и используют информацию, например, о температуре и химическом составе среды для выбора наиболее благоприятных условий существования.

Любой живой организм, в том числе человек, является носителем генетической информации, которая передается по наследству. Она определяет строение и развитие живых организмов. Человек воспринимает окружающий мир (получает информацию) с помощью органов чувств (зрения, слуха, обоняния, осязания, вкуса). Чтобы правильно ориентироваться в мире, он запоминает полученные сведения (хранит информацию). В процессе достижения каких-либо целей человек принимает решения (обрабатывает информацию), а в процессе общения с другими людьми - передает и принимает информацию. Человек живет в мире информации.

Потоки информации, циркулирующие в мире, который нас окружает, огромны. Во времени они имеют тенденцию к увеличению. Поэтому в любой организации, как большой, так и маленькой, возникает проблема такой организации управления данными, которая обеспечила бы наиболее эффективную работу. Некоторые организации используют для этого шкафы с папками, но большинство предпочитают компьютеризированные способы - базы данных, позволяющие эффективно хранить, структурировать и систематизировать большие объемы данных. И уже сегодня без баз данных невозможно представить работу большинства финансовых, промышленных, торговых и прочих организаций. Не будь баз данных, они бы просто захлебнулись в информационной лавине.

Существует много веских причин перевода существующей информации на компьютерную основу. Сейчас стоимость хранения информации в файлах ЭВМ дешевле, чем на бумаге. Базы данных позволяют хранить, структурировать информацию и извлекать оптимальным для пользователя образом. Использование клиент/серверных технологий позволяют сберечь значительные средства, а главное и время для получения необходимой информации, а также упрощают доступ и ведение, поскольку они основываются на комплексной обработке данных и централизации их хранения. Кроме того ЭВМ позволяет хранить любые форматы данных текст, чертежи, данные в рукописной форме, фотографии, записи голоса и т.д.

Для использования столь огромных объемов хранимой информации, помимо развития системных устройств, средств передачи данных, памяти необходимы средства обеспечения диалога человек-ЭВМ, которые позволяют пользователю вводить запросы, читать файлы, модифицировать хранимые данные, добавлять новые данные или принимать решения на основании хранимых данных.

В связи с этим вопрос современных технологий хранения данных на сегодняшний день актуален. В данной работе рассматривается следующий ряд вопросов:

.Будет раскрыто понятие информационного ресурса. И место технологий в данной сфере.

.Так же рассмотрится история возникновения технологий и их развитие.

.Методы хранения информации в ЭВМ.

.А так же технологии кодирования информации в ЭВМ.

В частности, будут раскрыты вопросы, связанные с методами хранения информации и её кодирования на компьютере, изучением взаимосвязи информационных технологий с технологиями хранения данных, раскрытие понятия информационный ресурс и многое другое, связанное с хранением информации в современном мире.

Однако в науке информатика этим терминам есть и другое, более полное и техническое объяснение.


Глава I. Информационные ресурсы


. Понятие «Информационный ресурс»


Изменение человеком окружающего мира влечет развитие информационного пространства. На каждом этапе этого развития неизбежно накапливается информация первого порядка - опыт деятельности человека и информация второго порядка - сведения об опыте обработки и переработки информации.

Накапливающийся опыт деятельности человека, фиксируется в виде информации - это сначала служит основной предпосылкой возникновения информационной деятельности и информационных технологий.

Информация - это сведения, независимо от формы их представления, усваиваемые субъектом в форме знаний.

Информационная система - это организационно упорядоченная совокупность документов (информационных продуктов) и информационной инфраструктуры. (Примеры информационных систем - библиотеки, архивы, фильмотеки, базы данных, Internet.)

Информационные ресурсы - это отдельные документы, массивы документов, которые входят в состав информационных систем.

Итак, информация (informatio от латинского - разъяснение, изложение, осведомленность) - одно из наиболее общих положений науки, означающее некоторые сведения, совокупность каких-либо данных, знаний и так далее.

Информация в свою очередь делится на несколько видов: генетическая, геологическая, педагогическая, техническая, экономическая, полная, ложная и т.д.

Информатика - это техническая наука, систематизирующая приемы создания, хранения, обработки и передачи информации средствами вычислительной техники, а также принципы функционирования этих средств и методы управления ими.

Информационный ресурс - это семантическая информация, т.е. информация в виде понятийного знания. Информационный ресурс имеет две неделимые стороны: формально-логическую (информационную) и когнитивную (cognition от латинского - знание, познание). Из понятия информационный ресурс вырастает система оригинальных понятий информатики. Информационный ресурс - это симбиоз знаний и информации. Перед человечеством стоит громадная по своей важности и сложности задача - извлечь максимум информации из накопленных за всю историю сообщений (книг, описаний, т.е. «рассеянных» знаний) и превратить эту информацию в активно функционирующий ресурс (за счет разработки, в первую очередь, алгоритмов и программ).

Особенности информационного ресурса:

.практически неисчерпаем;

.имеет потенциальное значение (несамостоятелен);

.по мере использования не исчезает, а сохраняется и даже увеличивается;

.эффективность повторного применения связана с эффектом повторного применения знаний;

.является формой непосредственного включения науки в состав производительных сил;

.возникает в результате не просто умственного труда, а его творческой части;

.превращение знаний в информационный ресурс зависит от возможностей их кодирования, распределения и передачи.


2. Возникновение информационных ресурсов


В процессе жизни и деятельности человека его опыт как накапливающаяся в огромном количестве субъективная и объективная информация может быть зафиксирована, сохранена и передана другим людям. Исторический аспект рассмотрения проблемы накопления информации позволяет вскрыть наиболее значимые для человечества аспекты, проследить динамику информационного развития.

Сначала человек учится на своих ошибках, на своем опыте, затем наиболее значимая информация, которая содержит знания о природе, о деятельности, о людях, о событиях фиксируется и передается другим людям в процессе коммуникации. Однако не меньшей ценностью для общества обладают определенные методы и информационные механизмы фиксации и передачи информации. Так потребность индивидуума в информации не только о своем опыте, но и об опыте других за всю историю человечества стимулировала развитие информационного ресурса.

Информация первого порядка, фиксирующая опыт деятельности человека неизбежно накапливается в таких количествах, что приходится решать вопрос, как лучше фиксировать, упорядочивать и передавать необходимую информацию. Решение подобных вопросов является для человечества неоценимым достоянием.

Сведения об опыте обработки и переработки информации и составляют информацию второго порядка. Таким образом, формируется и фиксируется в виде информации опыт деятельности человека, что и служит основной предпосылкой зарождения информационных ресурсов в технологической сфере (информационных технологий).


3. Возникновение информационных технологий и компьютерных средств


Получив в виде готовой информации знания других людей, человек смог смелее, быстрее достигать своих целей, стремится ставить новые цели и узнавать о новых способах их достижения. То есть информация раскрывает новые возможности, пробуждает дополнительные информационные потребности. Как говорится, «чем больше знаешь, тем больше хочешь знать».

Постепенно потребность в информации вышла за границы личного общения - обобщенный опыт начал накапливаться и фиксироваться при помощи все более совершенных средств. Как речь, так и письменность - это весьма значимые для развития человеческого общества информационные технологии. Все новые технологии поддерживают производство и передачу информации, обеспечивая развитие информационных потребностей и множество информационных ресурсов.

Далее объем общественно значимой информации превысил информационные возможности одного отдельного человека, таким образом, информационная технология стала нуждаться в изобретении все новых и новых средств обеспечения информационной деятельности - так на основе письменности возникло книгопечатание. В результате каждого революционного изобретения с новой силой развивается процесс информатизации. Такие информационные технологии, как письменная речь и книгопечатание позволили человеку подняться на соответствующий культурный уровень.

Возможность обладать информационными ресурсами, стимулировала развитие новых и новых информационных средств. Новые средства, в свою очередь раскрывали более широкие горизонты информационных потребностей. В отличие от истории развития техники, новый информационный ресурс, или новое информационное средство не вытесняет и заменяет старое, а дополняет собой существующую систему информационного общения. Наконец, объем информационного пространства вновь достиг критического объема, и это явилось закономерной предпосылкой поиска и открытия современных компьютерных средств фиксации и передачи информации. Зарождение информационных технологий и возникновение компьютерных средств стимулируют скачкообразное информационное развитие. В информационном плане это равносильно новой информационной революции.

И, наконец, развитие информационных ресурсов и информационных технологий и средств передачи информации повлекло возникновение усовершенствование средств ее обработки и фиксации - зародились и начали активно развиваться компьютерные средства.

Такие средства меняют структурную основу системы общения. Новые функциональные возможности компьютерной техники, которые с каждым годом наращиваются, воспринимаются сегодня в качестве мощного усилителя информационной деятельности человека и прогрессивного информационного развития общества.


4. Информация и данные


Информационные ресурсы в современном обществе играют не меньшую, а нередко и большую pоль, чем pесуpсы материальные. Знания, кому, когда и где продать товар, может цениться не меньше, чем собственно товар, и в этом плане динамика развития общества свидетельствует о том, что на "весах" материальных и информационных ресуpсов последние начинают пpевалиpовать, причем тем сильнее, чем более общество открыто, чем более развиты в нем средства коммуникации, чем большей информацией оно располагает.

С позиций рынка информация давно уже стала товаром и это обстоятельство требует интенсивного развития практики, промышленности и теории компьютеризации общества. Компьютер как информационная среда не только позволил совершить качественный скачек в организации промышленности, науки и рынка, но он определил новые самоценные области производства: вычислительная техника, телекоммуникации, прогpаммные продукты.

Тенденции компьютеризации общества связаны с появлением новых профессий, связанных с вычислительной техникой, и различных категорий пользователей ЭВМ. Если в 60-70е годы в этой сфере доминировали специалисты по вычислительной технике (инженеры-электpоники и пpогpаммисты), создающие новые средства вычислительной техники и новые пакеты прикладных пpогpамм, то сегодня интенсивно pасшиpяется категория пользователей ЭВМ - представителей самых разных областей знаний, не являющихся специалистами по компьютерам в узком смысле, но умеющих использовать их для решения своих специфических задач.

Пользователь ЭВМ (или конечный пользователь) должен знать общие принципы организации информационных процессов в компьютерной среде, уметь выбрать нужные ему информационные системы и технические средства и быстро освоить их применительно к своей предметной области. Учитывая интенсивное развитие вычислительной техники и во многом насыщенность рынка прогpаммных продуктов, два последних качества пpиобpетают особое значение.

Минимум знаний по организации компьютерных систем обычно называют компьютерной грамотностью. Не существует строго очерченных pамок, определяющих это понятие, - каждый пользователь определяет их для себя сам, но вместе с тем отсутствие такой грамотности делает сегодня невозможным доступ ко многим узко специальным профессиям, на первый взгляд весьма далеким от компьютера.

Данные.

Зададимся вопросом, что такое данные и как мы к ним относимся? Интуитивно ясно, что под данными мы подразумеваем какое-либо сообщение, наблюдаемый факт, сведения о чем-либо, результаты эксперимента и т.п. Иначе говоря, данные - это всегда конкретность, представленная в определенной форме (числом, записью, сообщением, таблицей и т.д.).

Данные (от лат. data) - это представление фактов и идей в формализованном виде, пригодном для передачи и обработки в некотором информационном процессе. Данные - это зарегистрированные сигналы. Данные могут рассматриваться как записанные наблюдения, которые не используются, а пока хранятся.

Традиционно выделяют два типа данных - двоичные (бинарные) и текстовые.

Двоичные данные обрабатываются только специализированным программным обеспечением, знающим их структуру, все остальные программы передают данные без изменений.

Текстовые данные воспринимаются передающими системами как текст, записанный на каком-либо языке. Для них может осуществляться перекодировка (из кодировки отправляющей системы, в кодировку принимающей), заменяться символы переноса строки, изменяться максимальная длина строки, изменяться количество пробелов в тексте.

Передача текстовых данных как бинарных приводит к необходимости изменять кодировку в прикладном программном обеспечении (это умеет большинство прикладного ПО, отображающего текст, получаемый из разных источников), передача бинарных данных как текстовых может привести к их необратимому повреждению.

Для повышения качества данные преобразуются из одного вида в другой с помощью методов обработки. Обработка данных включает операции:

.Ввод (сбор) данных - накопление данных с целью обеспечения достаточной полноты для принятия решений

.Формализация данных - приведение данных поступающих из разных источников, к одинаковой форме, для повышения их доступности.

.Фильтрация данных - это отсеивание «лишних» данных, в которых нет необходимости для повышения достоверности и адекватности.

.Сортировка данных - это упорядочивание данных по заданному признаку с целью удобства использования.

.Архивация - это организация хранения данных в удобной и легкодоступной форме.

.Защита данных - включает меры, направленные на предотвращение утраты, воспроизведения и модификации данных.

.Транспортировка данных - прием и передача данных между участниками информационного процесса.

.Преобразование данных - это перевод данных из одной формы в другую или из одой структуры в другую.

Сами по себе данные никакой ценности не представляют. На самом деле, как вы отнесетесь, например, к следующим данным:

·"тридцать семь с половиной";

·"2 + 2 = 4";

·"Петров стал директором".

Первое вызовет недоумение, второе - ощущение тривиальности (это знает каждый), третье - размышления, кто такой Петpов? Во всех пpиведенных пpимеpах данные неинфоpмативны (хотя по pазным пpичинам), и для того, чтобы пpидать им инфоpмативность, т.е. пpевpатить их в инфоpмацию, необходимо осуществить интеpпpетацию данных.

Интеpпpетация - пpоцесс пpевpащения данных в инфоpмацию, пpоцесс пpидания им смысла. Этот пpоцесс зависит от многих фактоpов: кто интеpпpетиpует данные, какой инфоpмацией уже pасполагает интеpпpетатоp, с каких позиций он pассматpивает полученные данные и т.д. Пpоцесс интеpпpетации может осуществляться человеком или гpуппой лиц, пpи этом он может быть твоpческим (напpимеp, музициpование по нотной записи) или фоpмальным (опpеделение вpемени по часам). Такой пpоцесс может осуществляться биологическими объектами (условные pефлексы собак, общение дельфинов), многими устpойствами технической автоматики (обнаpужение сигнала от цели в pадиолокации с последующими действиями) и, конечно, компьютеpом.

Абстpактность инфоpмации в отличие от конкpетности данных заключается в том, что пpоцесс интеpпpетации в общем случае не может быть опpеделен фоpмально, в то вpемя как данные всегда существуют в какой-то опpеделенной фоpме. Между данными и инфоpмацией в общем случае нет взаимно-однозначного соответствия. Напpимеp, фоpмально pазличные сообщения «до завтpа» и «see you tomorrow» несут одну и ту же инфоpмацию. Pазные знаки «x» и «*» могут содеpжательно обозначать одно и то же - опеpацию умножения, фоpмально pазличные стpоки «21» и «XXI» опpеделяют одно и то же число (в pазличных системах счисления).

С дpугой стоpоны одни и те же данные могут нести совеpшенно pазличную инфоpмацию pазным получателям (pазным интеpпpетатоpам). Напpимеp, знак "I" может интеpпpетиpоваться как буква "ай" в английском алфавите или как pимская цифpа 1, знак "+" может интеpпpетиpоваться как опеpация сложения или опеpация объединения множеств в зависимости от контекста. Кивок головой свеpху вниз обычно обозначает "Да", а покачивание - "Нет", но не во всех стpанах (в Болгаpии и Гpеции это не так).

Эти пpимеpы показывают, что интеpпpетация данных зависит от многих дополнительных объективных фактоpов (в этих пpимеpах - контекст, стpана, место), но интеpпpетация может зависеть и от субъективных фактоpов. Напpимеp, один и тот же цвет человек с ноpмальным зpением воспpинимает одним обpазом, а дальтоник дpугим. Пpиведенные пpимеpы альтеpнативной интеpпpетации одних и тех же данных иллюстpиpуют понятие полимоpфизма (множественной интеpпpетации), котоpое в конечном счете и опpеделяет абстpактный хаpактеp этого пpоцесса.

Наконец, еще один важный аспект интеpпpетации. В любом достаточно большом набоpе данных есть особые позиции (знаки, ключевые слова, пpизнаки), котоpые упpавляют пpоцессом интеpпpетации и потому имеют особое значение, во многом опpеделяющее ценность и важность получаемой инфоpмации. Классический пpимеp: сообщение «Казнить нельзя, помиловать». Положение запятой в этом пpимеpе (пеpед словом "нельзя" или после) pадикально меняет инфоpмационное содеpжание данных. Можно ли в этом отношении сpавнить запятую в этом сообщении с буквой «н», напpимеp? Потеpя или искажение последней легко восстанавливается по контексту, потеpя запятой сводит инфоpмативность сообщения в целом к нулю.

Таким обpазом, данные - это набоp неодноpодных ключевых слов (позиций, знаков и т.п.), несущих инфоpмацию pазной степени ценности.


5. Динамика роста информационных потребностей


Общественное развитие средств передачи информации связано с уровнем информационных потребностей общества и личности. Эта связь, начиная еще с далекого прошлого человечества, отражалась достаточно стабильными закономерностями. Однако со временем стало все более ясно, что наращивание потенциала системы общения опережает организацию управления этой системой.

Такое нарастание информации затрудняет процедуру принятия решения, осложняет выбор, который рано или поздно приходится делать. Затягивание выбора ведет к ситуации истощения, когда на фоне внешнего (объективного) избытка информации усугубляется внутренний (субъективный) недостаток необходимой информации.

Потребности личности не безграничны. Это относится и к информационным потребностям, которые на определенном уровне приближаются к насыщению.

Стремительный рост информационных ресурсов на определенном этапе проходит через зону насыщения информационных потребностей. Человеку, не адаптированному к избытку информации, грозит стресс.

Механизмами защиты от стресса являются своевременный выбор необходимой информации и защита от информационного шума, то есть от лишней, ненужной информации.

Другими словами, современный человек в информационном плане обладает многими излишествами, но часто лишен жизненно необходимого. Отсюда основная проблема информационного века - стресс. Стресс в информационном обществе связан с активным приспособлением человека к большому количеству постоянно меняющейся информации, соответственно условиям окружающей среды. Стресс сопровождается мобилизацией всех средств защиты. Он включает механизмы, как полезного, так и вредного для организма характера.

Сегодня информатизация охватывает все аспекты социальной сферы. Однако, пока действие внешних регуляторов малозначимо. Рост возможностей информационно-компьютерных инфраструктур уже не следует за потребностями человека, а, опередив их, подчиняется новым законам, законам саморазвития.


6. Смена приоритета информационного развития


Для того чтобы эффективно отслеживать необходимую информацию и принимать опережающие решения человеку приходится не просто повышать свои профессиональные знания и использовать новейшие информационные технологии современные компьютерные средства, но и расширять кругозор, налаживать связи с активизировавшейся общественностью. Овладение необходимыми коммуникативными навыками с использованием современных информационных технологий и компьютерных средств становится сейчас требованием времени.

Человек, сообразуясь с реальными условиями, на основе анализа внешней и внутренней информации, должен делать выбор, принимать массу решений относительно своей профессии, мета жительства, друзей, спутника жизни и т.п. У каждого специалиста соответственно возникают свои ситуации, связанные с необходимостью принятия решения.

Особенность современного динамичного информационного общества и новые приоритеты информационного развития могут быть вскрыты на основе анализа взаимодействия информационных потребностей и информационных ресурсов за последние столетие и десятилетие. В исследовании мы сравнили количественные данные, характеризующие динамику действующих, устаревающих и отменяемых информационных документов в течение последнего столетия и десятилетия. Для анализа взяты документы, регистрируемые в Министерстве юстиции, так как этот класс документов снабжен полной хронологической справкой об их издании, функционировании и отмене. Подробнее остановимся на особенностях последнего десятилетия.

Приведенные данные характеризуют динамику действующих, устаревающих и отменяемых информационных документов в девяностые годы 20 веке в нашей стране (рисунок 1).

Сравнение данных, характеризующих динамику действующих, устаревающих и отменяемых информационных документов в течение последнего десятилетия с данными за все столетие позволяет сделать вывод не только о количественных, но и о качественных изменениях. Налицо резкая смена закона информационного развития. Действительно, количество документов в рамках каждого десятилетия до 90-х годов 20 века еще могут быть с достаточной степенью точности аппроксимированы линейной функцией. Однако далее для вновь принимаемых информационных документов такой возможности уже нет, любой, даже малый интервал времени требует аппроксимации сначала квадратичной и затем экспоненциальной функцией. Динамика обработки, отмены и снятия с учета определенных документов остается в рамках линейного закона. Такая частичная смена закона информационного развития указывает на необходимость перемен в общественных системах, связанных с производством, восприятием, и переработкой информации.

Человечество вступило в информационную эпоху и не склонно отказываться от порождаемой им информации в виде документов, бумаг, компьютерных файлов.

Даже не действующие документы продолжают храниться в архивах и временами привлекаются к разнообразному учету и анализу. Люди создают новые документы, но не отменяют старые, то есть принимаемые решения не обретают завершенности. Если своевременный выбор не сделан, или сделан не некорректно, то лавинообразно нарастают информационные потоки, которые необходимо воспринимать и обрабатывать. Естественно, что неуправляемое, бесконтрольное нарастание информации вызывает тревогу.


Рисунок 1. Динамика роста информационного потока в последнем десятилетии XX века.


Глава II. Процессы, методы и средства технологии хранения информации


В тот самый момент, когда первый компьютер впервые обработал несколько байт данных моментально встал вопрос: где и как хранить полученные результаты? Как сохранять результаты вычислений, текстовые и графические образы, произвольные наборы данных?

К середине XX века поток информации достиг громадных размеров и продолжал стремительно расти в геометрической прогрессии. Человечество стало тонуть в захлестывающем его океане всевозможной информации. В этот критический момент и был изобретен компьютер - устройство для получения, накопления, хранения, обработки, передачи и распространения информации

Имеет смысл задуматься над тем, а в чём же измеряется информация и память, и где же можно хранить данные, которые сейчас, как правило, содержатся в электронном виде.


. Единицы измерения памяти


В информатике используются различные подходы к измерению информации:

·Содержательный подход к измерению информации. Сообщение - информативный поток, который в процессе передачи информации поступает к приемнику. Сообщение несет информацию для человека, если содержащиеся в нем сведения являются для него новыми и понятными Информация - знание человека, сообщение которого должно быть информативным. Если сообщение не информативно, то количество информации с точки зрения человека = 0.

·Алфавитный подход к измерению информации не связывает кол-во информации с содержанием сообщения. Алфавитный подход - объективный подход к измерению информации. Он удобен при использовании технических средств работы с информацией, т.к. не зависит от содержания сообщения. Кол-во информации зависит от объема текста и мощности алфавита. Ограничений на max мощность алфавита нет, но есть достаточный алфавит мощностью 256 символов. Этот алфавит используется для представления текстов в компьютере. Поскольку 256=28, то 1символ несет в тексте 8 бит (наименьшее деление) информации.

Итак, в чём же измеряется информация? В основном в информатике берут за основу единицы измерения, производные от бита, самой маленькой единицы информации. Целые количества бит отвечают количеству состояний, равному степеням двойки. Особое название имеет 4 бита - ниббл (полубайт, тетрада, четыре двоичных разряда), которые вмещают в себя количество информации, содержащейся в одной шестнадцатеричной цифре.

Байт. Следующей по порядку популярной единицей информации является 8 бит, или байт. Именно к байту (а не к биту) непосредственно приводятся все большие объёмы информации, исчисляемые в компьютерных технологиях.

Килобайт. Для измерения больших количеств байтов служат единицы «килобайт» (Кбайт) = 1000 байт - с точки зрения математики. Но в информатике 1 Кбайт = 1024 байт. Такая путаница происходит из за различий в десятичной и двоичной системах исчисления. Поэтому МЭК (Международная Электротехническая Комиссия) придумала для «Кбайт», «Мбайт», «Гбайт» и т. д. в качестве терминов «кикибайт», «мебибайт», «гибибайт». Однако, эту терминологию очень много критикуют и, поэтому, её редко можно слышать в устной речи. Но вернёмся к килобайтам. Такой порядок величин имеют, например:

·Сектор диска обычно равен 512 байтам то есть половине Кбайт, хотя для некоторых устройств может быть равен одному или двум Кбайт.

·Классический размер «блока» в файловых системах UNIX равен одному Кбайт (1024 байт).

·«Страница памяти» в процессорах x86 (начиная с модели Intel 80386) имеет размер 4096 байт, то есть 4 Кбайт.

Объём информации, получаемой при считывании дискеты «3,5? высокой плотности» равен 1440 Кбайт (ровно); другие форматы также исчисляются целым числом Кбайт.

Мегабайт. Единицы «мегабайт» (Мбайт) = 1000 килобайт = 1000000 байт и «мебибайт» = 1024 Кбайт = 1 048 576 байт применяются для измерения объёмов носителей информации.

Объём адресного пространства процессора Intel 8086 был равен 1 Мбайт. Оперативную память и ёмкость CD-ROM меряют двоичными единицами (мебибайтами, хотя их так обычно не называют), но для объёма НЖМД (Накопители на жестких магнитных дисках) десятичные мегабайты были более популярны. Современные жёсткие диски имеют объёмы, выражаемые в этих единицах минимум шестизначными числами, поэтому для них применяются гигабайты.

Гигабайт. Единицы «гигабайт» (Гбайт) = 1000 мегабайт = 1000000000 байт и «гибибайт» = 1024 Мбайт измеряют объём больших носителей информации, например жёстких дисков. Разница между двоичной и десятичной единицами уже превышает 7 %.

Размер 32-битного адресного пространства равен 4 Гбайт ? 4,295 Мбайт. Такой же порядок имеют размер DVD-ROM и современных носителей на флэш-памяти. Размеры жёстких дисков уже достигают сотен и тысяч гигабайт.

Для исчисления ещё больших объёмов информации имеются единицы «терабайт» или «тебибайт» (1012 Гбайт), «петабайт» или «пебибайт» (1015 Тбайт) и т. д.


2. Принцип хранения данных


Возрастающая ценность информации и консолидация вычислительных мощностей определяет новый подход к технологиям организации хранения и доступа к данным. Предприятиям необходимо решать задачи управления увеличивающимися массивами данных, организовать надежный доступ к информационным массивам, обеспечить защиту информации от утраты и повреждений.

Система хранения разрабатывается как обязательная подсистема в центрах обработки данных и является важнейшим компонентом для обеспечения надежного и стабильного функционирования всех информационных сервисов.

Система хранения данных (СХД) - предназначена для централизованного надежного хранения, управления и предоставления данных. СХД является ключевым элементом консолидации ЦОД (центр обработки данных), с которой тесно взаимодействуют вычислительные мощности, занятые обработкой информации. Структура СХД является технологическим фундаментом, вокруг которой строятся вычислительные системы. Технологии управления данными - решения для максимально эффективного использования ресурсов хранения и обеспечения непрерывности бизнеса.

Классическая система хранения данных включает в себя следующие компоненты:

·Устройства хранения данных: дисковые массивы и ленточные библиотеки. Современные дисковые массивы, как правило, используют технологию Fibre Channel для подключения к ним серверов и внутри массива для доступа к дискам. Они могут масштабироваться до сотен терабайт дискового пространства и обладают встроенным интеллектом для выполнения специальных функций;

·Инфраструктуру доступа серверов к устройствам хранения данных. В современных СХД для объединения компонент, как правило, используется Сеть Хранения Данных (Storage Area Network - SAN). SAN является высокопроизводительной информационной сетью, которая соединяет серверы и устройства хранения данных.;

·Программное обеспечение управления хранением данных. Программное обеспечение предназначено как для решения специфических задач, например повышения производительности доступа к данным СУБД Oracle, так и для управления всей СХД в целом на уровне качества предоставляемых услуг по хранению данных;

·Систему резервного копирования и архивирования данных. Система предназначена для создания резервных копий и восстановления данных. Система резервного копирования позволяет защитить данные от разрушения не только в случае сбоев или выхода из строя аппаратуры, но и в результате ошибок программных средств и пользователей.

Сеть хранения данных SAN- строится на основе высокоскоростной технологии Fibre Channel и является основой инфраструктуры СХД, к которой подключаются устройства обработки и хранения данных. Можно выделить следующие преимущества применения SAN:

·Масштабируемость - возможность динамического изменения конфигурации без остановки системы, поэтапное наращивание емкостей дисковых массивов согласно требованиям бизнеса заказчика.

·Отказоустойчивость - возможность создания отказоустойчивых конфигурация без единой точки отказа, аппаратная репликация данных между массивами основного и резервного ЦОД и высокая надежность дублированного хранения архивированных данных позволяют обеспечить работоспособность системы даже в случае утраты части оборудования.

·Простое управления и администрирование - возможность организации единой точки управления всей инфраструктурой хранения данных компании

·Низкая совокупная стоимость владения - простое и эффективное управление позволяет сократить количество обслуживающего персонала и повысить эффективность использования оборудования, а высокая защищенность данных гарантирует функционирование бизнес сервисов в чрезвычайных ситуациях.


3. Классификация памяти по функциональности


Следует различать классификацию памяти и классификацию запоминающих устройств (ЗУ). Первая классифицирует память по функциональности, вторая же - по технической реализации. Для начала рассмотрим первую - таким образом, в неё попадают как аппаратные виды памяти (реализуемые на ЗУ), так и структуры данных, реализуемые в большинстве случаев программно.

Доступные операции с данными.

·Память только для чтения (read-only memory, ROM);

·Память для чтения/записи.

Память на программируемых и перепрограммируемых ПЗУ (постоянно запоминающее устройство) не имеет общепринятого места в этой классификации. Её относят либо к подвиду памяти «только для чтения», либо выделяют в отдельный вид.

Также предлагается относить память к тому или иному виду по характерной частоте её перезаписи на практике: к RAM относить виды, в которых информация часто меняется в процессе работы, а к ROM - предназначенные для хранения относительно неизменных данных.

Энергозависимость.

·Энергонезависимая память (англ. nonvolatile storage) - память, реализованная ЗУ, записи в которых не стираются при снятии электропитания. К этому типу памяти относятся все виды памяти на ПЗУ и ППЗУ;

·Энергозависимая память (англ. volatile storage) - память, реализованная ЗУ, записи в которых стираются при снятии электропитания. К этому типу памяти относятся память на ОЗУ, кэш-память.

·Статическая память (англ. static storage) - энергозависимая память, которой для хранения информации достаточно сохранения питающего напряжения;

·Динамическая память (англ. dynamic storage) - энергозависимая памяти, в которой информация со временем разрушается (деградирует), и, кроме подачи электропитания, необходимо производить её периодическое восстановление (регенерацию).

Метод доступа.

·Последовательный доступ (англ. sequential access memory, SAM) - ячейки памяти выбираются (считываются) последовательно, одна за другой, в очерёдности их расположения. Вариант такой памяти - стековая память.

·Произвольный доступ (англ. random access memory, RAM) - вычислительное устройство может обратиться к произвольной ячейке памяти по любому адресу.

Назначение.

·Буферная память (англ. buffer storage) - память, предназначенная для временного хранения данных при обмене ими между различными устройствами или программами.

·Временная (промежуточная) память (англ. temporary (intermediate) storage) - память для хранения промежуточных результатов обработки.

·Кэш-память (англ. cache memory) - часть архитектуры устройства или программного обеспечения, осуществляющая хранение часто используемых данных для предоставления их в более быстрый доступ, нежели кэшируемая память.

·Корректирующая память (англ. patch memory) - часть памяти ЭВМ, предназначенная для хранения адресов неисправных ячеек основной памяти. Также используются термины «relocation table» и «remap table».

·Управляющая память (англ. control storage) - память, содержащая управляющие программы или микропрограммы. Обычно реализуется в виде ПЗУ.

·Разделяемая память или память коллективного доступа (англ. shared memory, shared access memory) - память, доступная одновременно нескольким пользователям, процессам или процессорам и др.

Организация адресного пространства.

·Реальная или физическая память (англ. real (physical) memory) - память, способ адресации которой соответствует физическому расположению её данных;

·Виртуальная память (англ. virtual memory) - память, способ адресации которой не отражает физического расположения её данных;

·Оверлейная память (англ. overlayable storage) - память, в которой присутствует несколько областей с одинаковыми адресами, из которых в каждый момент доступна только одна.

Удалённость и доступность для процессора.

·Первичная память доступна процессору без какого-либо обращения к внешним устройствам. Это регистры процессора (Процессорная или регистровая память) и кэш процессора (если есть);

·Вторичная память доступна процессору путём прямой адресацией через шину адреса (Адресуемая память) или через другие выводы. Таким образом, доступна основная память (память, предназначенная для хранения текущих данных и выполняемых программ) и порты ввода-вывода (специальные адреса, через обращение к которым реализовано взаимодействие с прочей аппаратурой);

·Третичная память доступна только путём нетривиальной последовательности действий. Сюда входят все виды внешней памяти - доступной через устройства ввода-вывода. Взаимодействие с третичной памятью ведётся по определённым правилам (протоколам) и требует присутствия в памяти соответствующих программ. Программы, обеспечивающие минимально необходимое взаимодействие, помещаются в ПЗУ, входящее во вторичную память (у PC-совместимых ПК - это ПЗУ BIOS);

Положение структур данных, расположенных в основной памяти, в этой классификации неоднозначно. Как правило, их вообще в неё не включают, выполняя классификацию с привязкой к традиционно используемым видам ЗУ.

Управление процессором.

·Непосредственно управляемая (оперативно доступная) память (англ. on-line storage) - память, непосредственно доступная в данный момент времени центральному процессору.

·Автономная память (англ. off-line storage) - вид памяти (ЗУ), не допускающий прямого доступа к ней, а также управление центрального процессора: обращение к ней, а также управление ею производится вводом в систему специальных команд и через посредство оперативной памяти;

Организация хранения данных и алгоритмы доступа к ним.

·Адресуемая память - адресация осуществляется по местоположению данных.

·Ассоциативная память (англ. associative memory, content-addressable memory, CAM) - адресация осуществляется по содержанию данных, а не по их местоположению.

·Магазинная (стековая) память (англ. pushdown storage) - реализация стека.

·Матричная память (англ. matrix storage) - ячейки памяти расположены так, что доступ к ним осуществляется по двум или более координатам.

·Объектная память (англ. object storage) - память, система управления которой ориентирована на хранение объектов. При этом каждый объект характеризуется типом и размером записи.

·Семантическая память (англ. semantic storage) - данные размещаются и списываются в соответствии с некоторой структурой понятийных признаков и др.


. Классификация запоминающих устройств


На сегодняшний день человечество изобрело огромное множество различных ЗУ. Ниже мы проследим их историю создания и развития.

Накопители на гибких магнитных дисках (НГМД).

Накопители на гибких магнитных дисках (НГМД) были одними из первых переносных запоминающих устройств. Они позволяют переносить документы и программы с одного компьютера на другой, хранить информацию, не используемую постоянно на компьютере, делать архивные копии программных продуктов, содержащихся на жестком диске. Наибольшее распространение получили дискеты размером 5,25 и 3,5 дюйма, то есть 133 и 89 мм в диаметре.

НГМД размером 5,25 дюйма чаще всего имеют емкость размером 1,2 Мбайта и 360 Кбайт. Встречаются дискеты прежних лет выпуска, имеющие меньшую емкость либо рассчитанные на использование в дисководах с одной головкой (односторонние дискеты) . Для записи и чтения дискет емкостью 1,2 Мбайта предназначены специальные накопители, которые устанавливаются на компьютерах моделей IBM PC AT, и PS/2. Существуют также специальные дисководы на 360 Кбайт. Техника записи на данных дискетах различна. В дисководах емкостью 1,2 Мбайта используются головки для чтения / записи, обеспечивающие более узкую дорожку информации. С этой целью на 5,25 дюймовых дискетах применяется специальное магнитное покрытие, которое позволяет осуществлять более плотную запись. Это магнитное покрытие труднее намагнитить и размагнитить, чем обычное, поэтому такие накопители не могут быть использованы в дисководах емкостью 360 Кбайт.

НГМД размером 3,5 дюйма , в отличие от 5,25 дюймовых, заключены в жесткие пластмассовый конверт, что значительно повышает их надежность и долговечность, а также создает значительные удобства при транспортировке, хранении и использовании.

Составляющими магнитного диска размером 3,5 дюйма и емкостью 1,44 Мбайта (далее рассматривается только он) являются:

.крышка защитная металлическая;

.пружина для крышки металлическая;

.конверт пластмассовый (верхняя и нижнияя стороны) ;

.две прокладки из мягкой бумаги;

.задвижка защиты от записи пластмассовая;

.стабилизатор положения диска металлический;

.сердцевина диска металлическая;

.круглая запоминающая поверхность диска пластмассовая, покрытая магнитным слоем.

Одной из главных проблем, связанных с использованием дискет, была их недолговечность. Наиболее уязвимым элементом конструкции дискеты был жестяной или пластиковый кожух, закрывающий собственно гибкий диск: его края могли отгибаться, что приводило к застреванию дискеты в дисководе, возвращавшая кожух в исходное положение пружина могла смещаться, в результате кожух дискеты отделялся от корпуса и больше не возвращался в исходное положение. Сам пластиковый корпус дискеты не служил достаточной защитой гибкого диска от механических повреждений (например, при падении дискеты на пол), которые выводили магнитный носитель из строя. В щели между корпусом дискеты и кожухом могла проникать пыль. А сам гибкий диск мог относительно легко размагнититься от воздействия металлических намагниченных поверхностей, природных магнитов, электромагнитных полей вблизи высокочастотных приборов, что делало хранение информации на дискетах крайне ненадежным.

Массовое вытеснение дискет из обихода началось с появлением перезаписываемых компакт-дисков, и особенно, носителей на основе флэш-памяти, обладающих гораздо меньшей удельной стоимостью, на порядки большей ёмкостью, большим фактическим числом циклов перезаписи и долговечностью и большей скоростью обмена данными. О них будет говориться немного позже.

Накопители на жестких магнитных дисках (НЖМД).

Накопитель на жёстких магнитных дисках или НЖМД (англ. Hard Magnetic Disk Drive, HMDD и HDD), жёсткий диск, винчестер. В компьютерном сленге «винт», хард, харддиск. Это устройство хранения информации, основанное на принципе магнитной записи. Является основным накопителем данных в большинстве компьютеров.

В отличие от «гибкого» диска (дискеты), информация в НЖМД записывается на жёсткие (алюминиевые, керамические или стеклянные) пластины, покрытые слоем ферромагнитного материала, чаще всего двуокиси хрома. В НЖМД используется от одной до нескольких пластин на одной оси. Считывающие головки в рабочем режиме не касаются поверхности пластин благодаря прослойке набегающего потока воздуха, образующейся у поверхности при быстром вращении. Расстояние между головкой и диском составляет несколько нанометров (в современных дисках около 10 нм), а отсутствие механического контакта обеспечивает долгий срок службы устройства. При отсутствии вращения дисков головки находятся у шпинделя или за пределами диска в безопасной зоне, где исключён их нештатный контакт с поверхностью дисков.

Накопители на жестких дисках объединяют в одном корпусе носитель (носители) и устройство чтения/записи, а также, нередко, и интерфейсную часть, называемую собственно контроллером жесткого диска. Информация заносится на концентрические дорожки, равномерно распределенные по всему носителю. В случае большего, чем один диск, числа носителей все дорожки, находящиеся одна под другой, называются цилиндром. Операции чтения/записи производятся подряд над всеми дорожками цилиндра, после чего головки перемещаются на новую позицию.

Герметичная камера предохраняет носители не только от проникновения механических частиц пыли, но и от воздействия электромагнитных полей. Необходимо заметить, что камера не является абсолютно герметичной т.к. соединяется с окружающей атмосферой при помощи специального фильтра, уравнивающего давление внутри и снаружи камеры. Однако, воздух внутри камеры максимально очищен от пыли, т.к. малейшие частички могут привести к порче магнитного покрытия дисков и потере данных и работоспособности устройства.

Диски вращаются постоянно, а скорость вращения носителей довольно высокая (от 4500 до 10000 об/мин), что обеспечивает высокую скорость чтения/записи. По величине диаметра носителя чаще других производятся 5.25, 3.14, 2.3 дюймовые диски. На диаметр носителей несменных жестких дисков не накладывается никакого ограничения со стороны совместимости и переносимости носителя, за исключением форм-факторов корпуса ПК, поэтому, производители выбирают его согласно собственным соображениям.

Накопители на магнитной ленте.

В ЭВМ, выпускавшихся до момента появления и широкого распространения жестких дисков, накопители на магнитной ленте (НМЛ), аналогичные стримерам, использовались как основной постоянный носитель информации (ПЗУ). В дальнейшем, в мейнфреймах НМЛ стали использоваться в системах иерархического управления носителями для хранения редко используемых данных. Некоторое время они достаточно широко применялись в качестве съёмного ЗУ при переносе большого количества информации.

Стример (англ. streamer), также ленточный накопитель - запоминающее устройство на принципе магнитной записи на ленточном носителе, с последовательным доступом к данным, по принципу действия аналогичен бытовому магнитофону. Основное назначение: запись и воспроизведение информации, архивация и резервное копирование данных.

Достоинства и недостатки.

Технология хранения данных на магнитной ленте в ходе развития вычислительной техники претерпела значительные изменения, и в разные периоды характеризовалась различными потребительскими свойствами. Использование стримеров имеет следующие отличительные черты.

Достоинства:

.большая ёмкость;

.низкая стоимость и широкие условия хранения информационного носителя;

.стабильность работы;

.надёжность;

.низкое энергопотребление у ленточной библиотеки большого объёма.

Недостатки:

.низкая скорость произвольного доступа к данным из-за последовательного доступа (лента должна прокрутиться к нужному месту);

.сравнительно высокая стоимость накопителя.

Хоть НМЛ и были по-своему хорошо, однако время и технический прогресс сыграли не в их пользу. НЖМД вытеснили их как постоянное запоминающее устройство. А CD, DVD-диски и flash-устройства, о которых будет говориться позже, полностью заменили в качестве переносных ЗУ. Причём не только в сфере информатики, а, так же, и в повседневном быту.

CD-ROM, CD-RW, DVD компакт-диски.

CD-диски.

Компакт-диск (англ. Compact Disc) - оптический носитель информации в виде пластикового диска с отверстием в центре. Процесс записи/считывания информации на который или с которого осуществляется при помощи лазера. Дальнейшим развитием CD-дисков стали DVD-диски.

Изначально компакт-диск был создан для хранения аудиозаписей в цифровом виде (известен как CD-Audio), однако в дальнейшем стал широко использоваться как носитель для хранения любых данных (файлов) в двоичном виде, CD-ROM - англ. Compact Disc Read Only Memory, компакт-диск только с возможностью чтения, или КД-ПЗУ - «Компакт-диск, постоянное запоминающее устройство». В дальнейшем появились компакт-диски не только с возможностью чтения однократно занесённой на них информации, но и с возможностью их записи и перезаписи (CD-R, CD-RW).

Формат файлов на CD-ROM отличается от формата записи аудио компакт-дисков, и потому обычный проигрыватель аудио компакт-дисков не может воспроизвести хранимую на них информацию, для этого требуется специальный привод (устройство) для чтения таких дисков (сейчас имеются практически в каждом компьютере).

Компакт-диск (CD-ROM) стал основным носителем для переноса информации между компьютерами (вытеснив с этой роли флоппи-диск). Сейчас он уступает эту роль более перспективным твердотельным носителям (flash-устройства).

Компакт-диск был разработан в 1979 году компаниями Philips и Sony. На Philips разработали общий процесс производства, основываясь на своей более ранней технологии лазерных дисков. Sony, в свою очередь, использовала собственный метод кодирования сигнала PCM - Pulse Code Modulation, использовавшийся ранее в цифровых профессиональных магнитофонах. В 1982 году началось массовое производство компакт-дисков, на заводе в городе Лангенхагене под Ганновером, в Германии. Выпуск первого коммерческого музыкального CD был анонсирован 20 июня 1982 года. История гласит, что на нём был записан альбом «The Visitors» группы ABBA.

Значительный вклад в популяризацию компакт-дисков внесли Microsoft и Apple Computer. Джон Скалли, тогдашний CEO Apple Computer, в 1987 году сказал, что компакт-диски произведут революцию в мире персональных компьютеров. Один из первых массовых мультимедийных компьютеров/развлекательных центров использующих CD диски была Amiga CDTV (Commodore Dynamic Total Vision), позже CD диски стали использовать в игровых приставках Panasonic 3DO и Amiga CD32.

Информационная структура.

Информация на диске записывается в виде спиральной дорожки из питов (англ. pit - углубление), выдавленных в поликарбонатной основе. Каждый пит имеет примерно 100 нм в глубину и 500 нм в ширину. Длина пита варьируется от 850 нм до 3,5 мкм. Промежутки между питами называются лендом (англ. land - пространство, основа). Шаг дорожек в спирали составляет 1,6 мкм.

Существуют и диски, предназначенные для записи в домашних условиях: CD-R (Compact Disc Recordable) для однократной и CD-RW (Compact Disc ReWritable) для многократной записи. В таких дисках используется специальный активный материал, позволяющий производить запись/перезапись информации. Различают диски с органическим (в основном диски CD-R-типа) и неорганическим (в основном CD-RW-диски) активным материалом.

При использовании органического активного материала запись осуществляется путём разрушения химических связей материала, что приводит к его потемнению (изменению коэффициента отражения материала). При использовании неорганического активного материала запись осуществляется изменением коэффициента отражения материала в результате его перехода из аморфного агрегатного состояния в кристаллическое и наоборот. И в том и в другом случае запись производится модуляцией мощности лазера.

В просторечии такие записываемые диски называются «болванками» и записываются на специальных пишущих приводах для компакт-дисков (широко сегодня распространённых), на сленге именуемыми «резаками». Процесс записи называется «прожигом» (от англ. to burn) или «нарезкой» диска. В некоторых CD-плеерах и музыкальных центрах такие диски могут не воспроизводиться. В последнее время все производители бытовых музыкальных центров и CD-плееров включают в свои устройства поддержку чтения CD-R/RW.

Объём хранимых данных.

Компакт-диски имеют в диаметре 12 см и изначально вмещали до 650 Мбайт информации (или 74 минуты звукозаписи). Согласно одной из легенд, разработчики рассчитывали объём так, чтобы на диске полностью поместилась девятая симфония Бетховена (самое популярное музыкальное произведение в Японии в 1979 году согласно специально проведённому опросу), длящаяся (в самом длинном из известных исполнений) именно 74 минуты. Однако, начиная приблизительно с 2000 года, всё большее распространение получали диски объёмом 700 Мбайт, которые позволяют записать 80 минут аудио, впоследствии полностью вытеснившие диск объёмом 650 Мбайт. Встречаются и носители объёмом 800 мегабайт (90 минут) и даже больше, однако они могут не читаться на некоторых приводах компакт-дисков.

DVD-диски.

DVD (англ. Digital Versatile Disc) - цифровой многоцелевой диск; (также англ. Digital Video Disc - цифровой видеодиск) - носитель информации, выполненный в виде диска, внешне схожий с компакт-диском, однако имеющий возможность хранить больший объём информации за счёт использования лазера с меньшей длиной волны, чем для обычных компакт-дисков. DVD-привод - устройство чтения (и записи) таких носителей.

Первые диски и проигрыватели DVD появились в ноябре 1996 года в Японии и в марте 1997 года в США. Официально DVD был анонсирован в сентябре 1995 года. Первая версия спецификаций DVD была опубликована в сентябре 1996 года. Изменения и дополнения в спецификации вносит организация DVD Forum (ранее называвшаяся DVD Consortium). Первый привод, поддерживающий запись DVD-R, выпущен Pioneer в октябре 1997 года. Стоимость этого привода, поддерживающего спецификацию DVD-R версии 1.0, составляла 17 000 долл. Болванки объёмом 3,95 Гб стоили по 50 долл. каждая.по структуре данных бывают четырёх типов:

.DVD-Video - содержат фильмы (видео и звук);

.DVD-Audio - содержат аудиоданные высокого качества (гораздо выше, чем на аудио-компакт-дисках);

.DVD-Data - содержат любые данные;

.смешанное содержимое.

В отличие от компакт-дисков, в которых структура аудиодиска фундаментально отличается от диска с данными, в DVD всегда используется файловая система UDF (для данных может быть использована ISO 9660). Любой из типов носителей DVD может нести любую из четырёх структур данных (см. выше). Физически DVD может иметь одну или две рабочие стороны и один или два рабочих слоя на каждой стороне. От их количества зависит ёмкость диска (из-за чего они получили также названия DVD-5, -9, -10, -14, -18, по принципу округления ёмкости диска в Гб до ближайшего сверху целого числа).

Форматы DVD±R и их совместимость

Стандарт записи DVD-R(W) был разработан в 1997 году группой компаний, входящих в DVD Forum, как официальная спецификация записываемых (впоследствии и перезаписываемых) дисков. Однако цена лицензии на эту технологию была слишком высока, и поэтому несколько производителей пишущих приводов и носителей для записи объединились в DVD+RW Alliance (англ.), который и разработал в середине 2002 года стандарт DVD+R(W), стоимость лицензии на который была ниже. Поначалу болванки (чистые диски для записи) DVD+R(W) были дороже, чем болванки DVD-R(W), но теперь цены сравнялись.

Все современные приводы для DVD могут читать оба формата дисков, и большинство пишущих приводов также могут записывать оба типа болванок. Среди остальных приводов форматы «+» и «-» одинаково популярны - половина производителей поддерживает один стандарт, половина - другой. Идут споры, вытеснит ли один из этих форматов своего конкурента или они продолжат мирно сосуществовать. Однако, поскольку формат DVD-R(W) появился почти на 5 лет раньше DVD+R(W), многие старые или дешёвые плееры вероятнее всего поддерживают лишь DVD-R(W). Это следует учитывать, особенно при записи дисков для распространения, когда тип читающего устройства (плеера или DVD-привода) заранее неизвестен.

Запоминающие flash-устройства.

Флеш-память (англ. Flash-Memory) - разновидность твердотельной полупроводниковой энергонезависимой перезаписываемой памяти.

Она может быть прочитана сколько угодно раз, но писать в такую память можно лишь ограниченное число раз (максимально - около миллиона циклов). Распространена флеш-память, выдерживающая около 100 тысяч циклов перезаписи - намного больше, чем способна выдержать дискета или CD-RW.

Не содержит подвижных частей, так что, в отличие от жёстких дисков, более надёжна и компактна. Благодаря своей компактности, дешевизне и низкому энергопотреблению флеш-память широко используется в цифровых портативных устройствах - фото- и видеокамерах, диктофонах, MP3-плеерах, КПК, мобильных телефонах, а также смартфонах и коммуникаторах. Кроме того, она используется для хранения встроенного программного обеспечения в различных устройствах (маршрутизаторах, мини-АТС, принтерах, сканерах, модемax), различных контроллерах.

Также в последнее время широкое распространение получили USB флеш-накопители («флешка», USB-драйв, USB-диск), практически вытеснившие дискеты и CD. Одним из первых флешки JetFlash в 2002 году начал выпускать тайваньский концерн Transcend.

На конец 2008 года основным недостатком, не позволяющим устройствам на базе флеш-памяти вытеснить с рынка жёсткие диски, является высокое соотношение цена/объём, превышающее этот параметр у жестких дисков в 2-3 раза. В связи с этим и объёмы флеш-накопителей не так велики. Хотя работы в этих направлениях ведутся. Удешевляется технологический процесс, усиливается конкуренция. Многие фирмы уже заявили о выпуске SSD-накопителей объёмом 256 Гб и более. Например в ноябре 2009 года компания OCZ предложила SSD-накопитель ёмкостью 1 Тб и 1,5 млн. циклов перезаписи.

Ещё один недостаток устройств на базе флеш-памяти по сравнению с жёсткими дисками - как ни странно, меньшая скорость. Несмотря на то, что производители SSD-накопителей заверяют, что скорость этих устройств выше скорости винчестеров, в реальности она оказывается ощутимо ниже. Конечно, SSD-накопитель не тратит подобно винчестеру время на разгон, позиционирование головок и т. п. Но время чтения, а тем более записи, ячеек флеш-памяти, используемой в современных SSD-накопителях, больше. Что и приводит к значительному снижению общей производительности. Справедливости ради следует отметить, что последние модели SSD-накопителей и по этому параметру уже вплотную приблизились к винчестерам. Однако, эти модели пока слишком дороги.

Характеристики.

Скорость некоторых устройств с флеш-памятью может доходить до 100 Мб/с. В основном флеш-карты имеют большой разброс скоростей и обычно маркируются в скоростях стандартного CD-привода (150 килобайт/с). Так, указанная скорость в 100× означает 100 × 150 килобайт/с = 14,65 мегабайт/с.

В основном объём чипа флеш-памяти измеряется от килобайт до нескольких гигабайт.

В 2005 году Toshiba и SanDisk представили NAND-чипы объёмом 1 Гбайт, выполненные по технологии многоуровневых ячеек, где один транзистор может хранить несколько бит, используя разный уровень электрического заряда на плавающем затворе.

Компания Samsung в сентябре 2006 года представила 8-гигабайтный чип, выполненный по 40-нм технологическому процессу.

В конце 2007 года Samsung сообщила о создании первого в мире MLC (multi-level cell) чипа флеш-памяти типа NAND, выполненного по 30-нм технологическому процессу с ёмкостью чипа 8 Гбайт. В декабре 2009 году компанией начато производство этой памяти, но объёмом 4 Гбайт (32 Гбит).

В то же время, в декабре 2009 года, Toshiba заявила, что 64 Гбайт NAND память уже поставляется заказчикам, а массовый выпуск начнётся в первом квартале 2010 года.

Для увеличения объёма в устройствах часто применяется массив из нескольких чипов. К 2007 году USB устройства и карты памяти имели объём от 512 Мбайт до 64 Гбайт. Самый большой объём USB-устройств составлял 4 терабайта.

Применение.

Флеш-память наиболее известна применением в USB флеш-накопителях (англ. USB flash drive). В основном применяется NAND-тип памяти, которая подключается через USB по интерфейсу USB mass storage device (USB MSC). Данный интерфейс поддерживается всеми современными операционными системами.

Благодаря большой скорости, объёму и компактным размерам USB флеш-накопители полностью вытеснили с рынка дискеты. Например, компания Dell с 2003 года перестала выпускать компьютеры с дисководом гибких дисков.

В данный момент выпускается широкий ассортимент USB флеш-накопителей, разных форм и цветов. На рынке присутствуют флешки с автоматическим шифрованием записываемых на них данных. Японская компания Solid Alliance даже выпускает флешки в виде еды.

Есть специальные дистрибутивы GNU/Linux и версии программ, которые могут работать прямо с USB носителей, например, чтобы пользоваться своими приложениями в интернет-кафе.

Технология ReadyBoost в Windows Vista способна использовать USB флеш-накопитель или специальную флеш-память, встроенную в компьютер, для увеличения быстродействия.

На флеш-памяти также основываются карты памяти, такие как Secure Digital (SD) и Memory Stick, которые активно применяются в портативной технике (фотоаппараты, мобильные телефоны). Флеш-память занимает большую часть рынка переносных носителей данных.

Сейчас активно рассматривается возможность замены жёстких дисков на флеш-память. В результате увеличится скорость включения компьютера, а отсутствие движущихся деталей увеличит срок службы. Вполне возможно что в скором будущем самым распространенном, а, возможно, и единственным ЗУ будут устройтства флеш-памяти.


Глава III. Кодирование информации. Методы и средства кодирования информации на сегодняшний день


. Понятие «кодирование информации» и его смысл

запоминающий устройство кодировка компьютер

Современный компьютер может обрабатывать числовую, текстовую, графическую, звуковую и видео информацию. Все эти виды информации в компьютере представлены в двоичном коде, т. е. используется алфавит мощностью два (всего два символа 0 и 1). Связано это с тем, что удобно представлять информацию в виде последовательности электрических импульсов: импульс отсутствует (0), импульс есть (1). Такое кодирование принято называть двоичным, а сами логические последовательности нулей и единиц - машинным языком.

Каждая цифра машинного двоичного кода несет количество информации равное одному биту. Данный вывод можно сделать, рассматривая цифры машинного алфавита, как равновероятные события. При записи двоичной цифры можно реализовать выбор только одного из двух возможных состояний, а, значит, она несет количество информации равное 1 бит. Следовательно, две цифры несут информацию 2 бита, четыре разряда - 4 бита и т. д. Чтобы определить количество информации в битах, достаточно определить количество цифр в двоичном машинном коде.

Кодирование информации - процесс преобразования сигнала из формы, удобной для непосредственного использования информации, в форму, удобную для передачи, хранения или автоматической переработки.


2. Способы кодирования


Двоичное кодирование текстовой информации

Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время большая часть ПК в мире занято обработкой именно текстовой информации.

Традиционно для кодирования одного символа используется количество информации равное 1 байту (1 байт = 8 битов). Для кодирования одного символа требуется один байт информации.

Учитывая, что каждый бит принимает значение 1 или 0, получаем, что с помощью 1 байта можно закодировать 256 различных символов. (28=256)

Кодирование заключается в том, что каждому символу ставиться в соответствие уникальный двоичный код от 00000000 до 11111111 (или десятичный код от 0 до 255). Важно, что присвоение символу конкретного кода - это вопрос соглашения, которое фиксируется кодовой таблицей (например, ASCII). Обратите внимание! Цифры кодируются по стандарту ASCII в двух случаях - при вводе-выводе и когда они встречаются в тексте. Если они участвуют в вычислениях, то осуществляется их преобразование в другой двоичных код.

Возьмем число 57. При использовании в тексте каждая цифра будет представлена своим кодом в соответствии с таблицей ASCII. В двоичной системе это - 00110101 и 00110111. При использовании в вычислениях код этого числа будет получен по правилам перевода в двоичную систему и получим - 00111001.

Кодирование графической информации

Под графической информацией можно понимать рисунок, чертеж, фотографию, картинку в книге, изображения на экране телевизора или в кинозале и т. д. Для обсуждения общих принципов кодирования графической информации в качестве конкретного, достаточно общего случая графического объекта выберем изображение на экране телевизора. Это изображение состоит из некоторого количества горизонтальных линий - строк. А каждая строка в свою очередь состоит из элементарных мельчайших единиц изображения - точек, которые принято называть пикселами (picsel - PICture'S ELement - элемент картинки). Весь массив элементарных единиц изображения называют растром (лат. rastrum - грабли). Степень четкости изображения зависит от количества строк на весь экран и количества точек в строке, которые представляют разрешающую способность экрана или просто разрешение. Чем больше строк и точек, тем четче и лучше изображение. Достаточно хорошим считается разрешение 640x480, то есть 640 точек на строку и 480 строчек на экран.

Строки, из которых состоит изображение, можно просматривать сверху вниз друг за другом, как бы составив из них одну сплошную линию. После полного просмотра первой строки просматривается вторая, за ней третья, потом четвертая и т. д. до последней строки экрана. Так как каждая из строк представляет собой последовательность пикселей, то все изображение, вытянутое в линию, также можно считать линейной последовательностью элементарных точек. В рассматриваемом случае эта последовательность состоит из 640x480=307200 пикселей. Вначале рассмотрим принципы кодирования монохромного изображения, то есть изображения, состоящего из любых двух контрастных цветов - черного и белого, зеленого и белого, коричневого и белого и т. д. Для простоты обсуждения будем считать, что один из цветов - черный, а второй - белый. Тогда каждый пиксель изображения может иметь либо черный, либо белый цвет. Поставив в соответствие черному цвету двоичный код 0, а белому - код 1 (либо наоборот), мы сможем закодировать в одном бите состояние одного пикселя монохромного изображения. А так как байт состоит из 8 бит, то на строчку, состоящую из 640 точек, потребуется 80 байтов памяти, а на все изображение - 38 400 байтов.

Однако полученное таким образом изображение будет чрезмерно контрастным. Реальное черно-белое изображение состоит не только из белого и черного цветов. В него входят множество различных промежуточных оттенков - серый, светло-серый, темно-серый и т. д. Если кроме белого и черного цветов использовать только две дополнительные градации, скажем светло-серый и темно-серый, то для того чтобы закодировать цветовое состояние одного пикселя, потребуется уже два бита. При этом кодировка может быть, например, такой: черный цвет - 002, темно-серый - 012, светло-серый - 102, белый - 112.

Общепринятым на сегодняшний день, дающим достаточно реалистичные монохромные изображения, считается кодирование состояния одного пикселя с помощью одного байта, которое позволяет передавать 256 различных оттенков серого цвета от полностью белого до полностью черного. В этом случае для передачи всего растра из 640x480 пикселей потребуется уже не 38 400, а все 307 200 байтов.

Цветное изображение может формироваться различными способами. Один из них - метод RGB (от слов Red, Green, Blue - красный, зеленый, синий), который опирается на то, что глаз человека воспринимает все цвета как сумму трех основных цветов - красного, зеленого и синего. Например, сиреневый цвет - это сумма красного и синего, желтый цвет - сумма красного и зеленого и т. д. Для получения цветного пикселя в одно и то же место экрана направляется не один, а сразу три цветных луча. Опять упрощая ситуацию, будем считать, что для кодирования каждого из цветов достаточно одного бита. Нуль в бите будет означать, что в суммарном цвете данный основной отсутствует, а единица - присутствует. Следовательно, для кодирования одного цветного пикселя потребуется 3 бита - по одному на каждый цвет. Пусть первый бит соответствует красному цвету, второй - зеленому и третий - синему. Тогда код 101(2) обозначает сиреневый цвет - красный есть, зеленого нет, синий есть, а код 110(2) - желтый цвет - красный есть, зеленый есть, синего нет. При такой схеме кодирования каждый пиксель может иметь один из восьми возможных цветов. Если же каждый из цветов кодировать с помощью одного байта, как это принято для реалистического монохромного изображения, то появится возможность передавать по 256 оттенков каждого из основных цветов. А всего в этом случае обеспечивается передача 256x256x256=16 777 216 различных цветов, что достаточно близко к реальной чувствительности человеческого глаза. Таким образом, при данной схеме кодирования цвета на изображение одного пикселя требуется 3 байта, или 24 бита, памяти. Этот способ представления цветной графики принято называть режимом True Color (true color - истинный цвет) или полноцветным режимом.

Следует упомянуть еще один часто используемый метод представления цвета, в котором вместо основного цвета используется его дополнение до белого. Если три цвета: красный, зеленый и синий вместе дают белый, то дополнением для красного, очевидно, является сочетание зеленого и синего, то есть голубой цвет. Аналогичным образом дополнением для зеленого является сочетание красного и синего, то есть пурпурный, а для синего - сочетание красного и зеленого, то есть желтый цвет. Эти три цвета - голубой, пурпурный и желтый с добавлением черного образуют основные цвета в системе кодирования, которая называется CMYK (от Cyan - голубой, Magenta - пурпурный, Yellow - желтый и blacK - черный). Этот режим также относится к полноцветным, но для передачи состояния одного пикселя в этом случае требуется 32 бита, или четыре байта, памяти, и может быть передано 4 294 967 295 различных цветов.

Полноцветные режимы требуют очень много памяти. Так, для обсуждавшегося выше растра 640x480 при использовании метода RGB требуется 921 600, а для режима CMYK - 1 228 800 байтов памяти. В целях экономии памяти разрабатываются различные режимы и графические форматы, которые немного хуже передают цвет, но требуют гораздо меньше памяти. В частности, можно упомянуть режим High Color (high color - богатый цвет), в котором для передачи цвета одного пикселя используется 16 битов и, следовательно, можно передать 65 535 цветовых оттенков, а также индексный режим, который базируется на заранее созданной таблице цветовых оттенков. Нужный цвет выбирается из этой таблицы с помощью номера - индекса, который занимает всего один байт памяти.

При записи изображения в память компьютера кроме цвета отдельных точек необходимо фиксировать много дополнительной информации - размеры рисунка, яркость точек и т. д. Конкретный способ кодирования всей требуемой при записи изображения информации образует графический формат. Форматы кодирования графической информации, основанные на передаче цвета каждого отдельного пикселя, из которого состоит изображение, относят к группе растровых или BitMap форматов (bit map - битовая карта).

Кодирование растровых изображений.

Наиболее известными растровыми форматами являются BMP, GIF и JPEG форматы. В формате BMP (от BitMaP) задается цветность всех пикселей изображения. При этом можно выбрать монохромный режим с 256 градациями или цветной с 16 256 или 16 777 216 цветами. Этот формат требует много памяти. В формате GIF (Graphics Interchange Format - графический формат обмена) используются специальные методы сжатия кода, причем поддерживается только 256 цветов. Качество изображения немного хуже, чем в формате BMP, зато код занимает в десятки раз меньше памяти. Формат JPEG (Goint Photographic Experts Group -Уединенная группа экспертов по фотографии) использует методы сжатия, приводящие к потерям некоторых деталей. Однако поддержка 16 777 216 цветов все-таки обеспечивает высокое качество изображения. По требованиям к памяти формат JPEG занимает промежуточное положение между форматами BMP и GIF.

Кодирование чисел.

Для вывода чисел на экран используется двоично-десятичное представление чисел. В упакованном формате для каждой десятичной цифры отводится по 4 двоичных разряда (полбайта), при этом знак числа кодируется в крайнем правом полубайте числа (1100 - знак и 1101 - знак ).

При выполнении сложения и вычитания двоично-десятичных чисел используется упакованный формат: Цифра | Цифра | Цифра | ... Цифра | Знак. Упакованный формат используется обычно в ПК при выполнении операций сложения и вычитания двоично - десятичных чисел. В распакованном формате для каждой десятичной цифры отводится по целому байту, при этом старшие полубайты (зона) каждого байта (кроме самого младшего) в ЭВМ заполняются кодом 0011, а в младших (левых) полубайтах обычным образом кодируются десятичные цифры. Старший полубайт (зона) самого младшего (правого) байта используется для кодирования знака числа.

Структура поля распакованного формата:

Зона | Цифра | Зона | ...| Знак | Цифра

Распакованный формат используется при вводе - выводе информации, а также при выполнении операций умножения и деления двоично-десятичных чисел.

Кодирование фильмов.

Фильм представляет собой последовательность быстро сменяющих друг друга кадров, на которых изображены последовательные фазы движения. Поскольку известны принципы кодирования отдельных кадров, то закодировать фильм как последовательность таких кадров ничего не стоит. Звук записывают независимо от изображения. При демонстрации фильма важно только добиться синхронизации звука и изображения (в кино для этого используют хлопушку - по щелчку хлопушки совмещаются звук и изображение).

Закодированный фильм несёт в себе информацию о размере кадра в пикселях и количество используемых цветов; частоте и разрешении для звука; способе записи звука (покадровый или непрерывный для всего фильма). После этого следует последовательность закодированных картинок и звуковых фрагментов.

Кодирование векторных изображений.

Векторное изображение представляет собой совокупность графических примитивов (точка, отрезок, эллипс…). Каждый примитив описывается математическими формулами. Кодирование зависти от прикладной среды.

Растровая графика обладает существенным недостатком - изображение, закодированное в одном из растровых форматов, очень плохо переносит увеличение или уменьшение его размеров - масштабирование. Для решения задач, в которых приходится часто выполнять эту операцию, были разработаны методы так называемой векторной графики. В векторной графике, в отличие от основанной на точке - пикселе - растровой графики, базовым объектом является линия. При этом изображение формируется из описываемых математическим, векторным способом отдельных отрезков прямых или кривых линий, а также геометрических фигур - прямоугольников, окружностей и т. д., которые могут быть из них получены. Фирма Adobe разработала специальный язык PostScript (от poster script - сценарий плакатов, объявлений, афиш), служащий для описания изображений на базе указанных методов. Этот язык является основой для нескольких векторных графических форматов. В частности, можно указать форматы PS (PostScript) и EPS, которые используются для описания как векторных, так и растровых изображений, а также разнообразных текстовых шрифтов. Изображения и тексты, записанные в этих форматах, большинством популярных программ не воспринимаются, они могут просматриваться и печататься только с помощью специализированных аппаратных и программных средств.

Кроме растровой и векторной графики существует еще и фрактальная графика, в которой формирование изображений целиком основано на математических формулах, уравнениях, описывающих те или иные фигуры, поверхности, тела. При этом само изображение в памяти компьютера фактически не хранится - оно получается как результат обработки некоторых данных. Таким способом могут быть получены даже довольно реалистичные изображения природных ландшафтов.

Двоичное кодирование звука.

Развитие способов кодирования звуковой информации, а также движущихся изображений - анимации и видеозаписей - происходило с запаздыванием относительно рассмотренных выше разновидностей информации. Заметим, что под анимацией понимается похожее на мультипликацию оживление изображений, но выполняемое с помощь средств компьютерной графики. Анимация представляет собой последовательность незначительно отличающихся друг от друга, полученных с помощью компьютера картинок, которые фиксируют близкие по времени состояния движения какого-либо объекта или группы объектов. Приемлемые способы хранения и воспроизведения с помощью компьютера звуковых и видеозаписей появились только в девяностых годах двадцатого века. Эти способы работы со звуком и видео получили название мультимедийных технологий. Звук представляет собой достаточно сложное непрерывное колебание воздуха. Оказывается, что такие непрерывные сигналы можно с достаточной точностью представлять в виде суммы некоторого числа простейших синусоидальных колебаний. Причем каждое слагаемое, то есть каждая синусоида, может быть точно задана некоторым набором числовых параметров - амплитуды, фазы и частоты, которые можно рассматривать как код звука в некоторый момент времени. Такой подход к записи звука называется преобразованием в цифровую форму, оцифровыванием или дискретизацией, так как непрерывный звуковой сигнал заменяется дискретным (то есть состоящим из раздельных элементов) набором значений сигнала в некоторые моменты времени. Количество отсчетов сигнала в единицу времени называется частотой дискретизации. В настоящее время при записи звука в мультимедийных технологиях применяются частоты 8, 11, 22 и 44 кГц. Так, частота дискретизации 44 килогерца означает, что одна секунда непрерывного звучания заменяется набором из сорокачетырех тысяч отдельных отсчетов сигнала. Чем выше частота дискретизации, тем лучше качество оцифрованного звука. К наиболее распространённым звуковым кодировкам относятся такие форматы, как: MP3, WAV, MPEG, AVI.


3. Таблицы кодировок


В человеческом мире информация представляется последовательностями символов. Каждый символ имеет каноническое изображение, которое позволяет однозначно идентифицировать данный символ. Варианты начертания символов задают разные шрифты.

В вычислительных машинах для представления информации используются цепочки байтов. Поэтому для перевода информации из машинного представления в человеческий, необходимы таблицы кодировки символов - таблицы соответствия между символами определенного языка и кодами символов. Их еще называют кодовыми страницами или применяют английский термин character set (который иногда сокращают до charset).

Самой известной таблицей кодировки является код ASCII (Американский стандартный код для обмена информацией). Первоначально он был разработан для передачи текстов по телеграфу, причем в то время он был 7-битовым, то есть для кодирования символов английского языка, служебных и управляющих символов использовались только 128 7-битовых комбинаций. При этом первые 32 комбинации (кода) служили для кодирования управляющих сигналов (начало текста, конец строки, перевод каретки, звонок, конец текста и т.д.). При разработке первых компьютеров фирмы IBM этот код был использован для представления символов в компьютере. Поскольку в исходном коде ASCII было всего 128 символов, для их кодирования хватило значений байта, у которых 8-ой бит равен 0. Значения байта с 8-ым битом, равным 1, стали использовать для представления символов псевдографики, математических знаков и некоторых символов из языков, отличных от английского (греческого, немецких умляутов, французских диакритических знаков и т.п.).

Когда стали приспосабливать компьютеры для других стран и языков, места для новых символов уже не стало хватать. Для того, чтобы полноценно поддерживать помимо английского и другие языки, фирма IBM ввела в употребление несколько кодовых таблиц, ориентированных на конкретные страны. Так для скандинавских стран была предложена таблица 865 (Nordic), для арабских стран - таблица 864 (Arabic), для Израиля - таблица 862 (Israel) и так далее. В этих таблицах часть кодов из второй половины кодовой таблицы использовалась для представления символов национальных алфавитов (за счет исключения некоторых символов псевдографики).

С русским языком ситуация развивалась особым образом. Очевидно, что замену символов во второй половине кодовой таблицы можно произвести разными способами. Вот и появились для русского языка несколько разных таблиц кодировки символов кириллицы: KOI8-R, IBM-866, CP-1251, ISO-8551-5. Все они одинаково изображают символы первой половины таблицы (от 0 до 127) и различаются представлением символов русского алфавита и псевдографики.

Для таких же языков, как китайский или японский, вообще 256 символов недостаточно. Кроме того, всегда существует проблема вывода или сохранения в одном файле одновременно текстов на разных языках (например, при цитировании). Поэтому была разработана универсальная кодовая таблица UNICODE, содержащая символы, применяемые в языках всех народов мира, а также различные служебные и вспомогательные символы (знаки препинания, математические и технические символы, стрелки, диакритические знаки и т.д.). Очевидно, что одного байта недостаточно для кодирования такого большого множества символов. Поэтому в UNICODE используются 16-битовые (2-байтовые) коды, что позволяет представить 65 536 символов. К настоящему времени задействовано около 49 000 кодов (последнее значительное изменение - введение символа валюты EURO в сентябре 1998 г.).

Для совместимости с предыдущими кодировками первые 256 кодов совпадают со стандартом ASCII.

В стандарте UNICODE кроме определенного двоичного кода (эти коды принято обозначать буквой U, после которой следуют знак + и собственно код в шестнадцатеричном представлении) каждому символу присвоено определенное имя.

Еще одним компонентом стандарта UNICODE являются алгоритмы для взаимно-однозначного преобразования кодов UNICODE в последовательности байтов переменной длины. Необходимость таких алгоритмов обусловлена тем, что не все приложения умеют работать с UNICODE. Некоторые приложения понимают только 7-битовые ASCII-коды, другие приложения - 8-битовые ASCII-коды. Такие приложения используют для представления символов, не поместившихся, соответственно, в 128-символьный или 256-символьный набор, так называемые расширенные ASCII-коды, когда символы кодируются цепочками байтов переменной длины. Алгоритм UTF-7 служит для обратимого преобразования кодов UNICODE в расширенные 7-битовые ASCII-коды, а UTF-8 - для обратимого преобразования кодов UNICODE в расширенные 8-битовые ASCII-коды.

Отметим, что и ASCII и UNICODE и другие стандарты кодировки символов не определяют изображения символов, а только состав набора символов и способ его представления в компьютере. Кроме того (что, может быть, не сразу очевидно), очень важен порядок перечисления символов в наборе, так как он влияет самым существенным образом на алгоритмы сортировки. Именно таблицу соответствия символов из какого-то определенного набора (скажем, символов, применяемых для представления информации на английском языке, или на разных языках, как в случае с UNICODE) и обозначают термином таблица кодировки символов или charset. Каждая стандартная кодировка имеет имя, например, KOI8-R, ISO_8859-1, ASCII. К сожалению, стандарта на имена кодировок не существует.


Заключение


Для современного периода характерно новое соотношение двух сторон информационного общества - информационных ресурсов и информационных потребностей. На основе анализа этих сторон показана динамика и возможные сценарии дальнейшего развития общества в период информационного взрыва.

Сделан вывод, что инерционное саморазвитие информационных ресурсов должно быть уравновешенно научно-обоснованной информатизацией образования, направляющей информационное общество на стабильный путь.

Рост количества информации и повышение ее значения во всех сторонах жизнедеятельности человека привел к вложению огромных средств и сил в развитие возможностей информационно-компьютерных инфраструктур в обществе.

Научный поиск дал стимул техническому перевооружению этой сферы и привел к столь стремительному возрастанию информационно-компьютерных возможностей и к новому витку роста количества информации, что подавляющее большинство из них остается не востребованным.

Множество информационных структур, пронизывая систему образования составляет единую информационно-компьютерную и научную инфраструктуру системы образования, которая в настоящее время активно развивается.

Интенсивный рост возможностей компьютерной техники и явное запаздывание ее теоретического осмысления в педагогике привели к тому, что преобладание бытового понимания и использования информационно-компьютерных систем в настоящее время вызвало стихийный перекос основ информационного общества, опасную однобокость и извращение самой идеи информатизации. Выравнивание сложившейся ситуации должно осуществляться на прочном научно-обоснованном фундаменте информационно-компьютерной подготовки современного человека.


Используемая литература


1. Кирилова Г.И. Информационные технологии и компьютерные средства в образовании // Educational technology & Society., 2001

. Львовский М.Б. Методическое пособие BOOK по информатике для 7-11 классов., Москва. 2008

. Каплунова Н.В., Шарыхин В.В., Хмельницкий С.В. Концепция развития информационных ресурсов. // Под ред. С.В.Хмельницкого. - СПб.: Европейский университет в Санкт-Петербурге, 2001.

. Кайлин В.А. Информатика. Учебник. - М.: ИНФА-М.,2003-285с.

. Смирнов Алексей, Марциновский Иван. Состояние и ближайшие перспективы компьютерного рынка. Магнитные и магнитооптические накопители / Компьютер Price, 2003 - 3,10-13с.

. Шафрин Ю.А. "Основы компьютерной технологии". М., 1998

7. <http://ru.wikipedia.org>


План Введение І. Информационные ресурсы . Понятие «Информационный ресурс» . Возникновение информационных ресурсов . Возникновение и

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2017 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ