previous down next index search
Previous: Предисловие Down: 1.1 Предметный указатель
    Next: 2 Преобразование, кодировка и передача информации

1 Введение. Общие принципы построения каналов передачи данных и сетей

Семенов Ю.А. (ИТЭФ-МФТИ)
Yu. Semenov (ITEP-MIPT)

Номер раздела Название раздела Объем в страницах Объем в кбайт
1.1 Предметный указатель 19 169
1.2 Депозитарий статей-первоисточников (на английском языке) 2 21
1.3 Проблемы в ИТ 8 197
1.4 История становления ИТ 9 12
Итого 00


Создатель снабдил людей неплохими системами коммуникаций. Это, прежде всего органы зрения, слуха и голосовой аппарат. Наиболее важные из них задублированы - мы имеем два уха и два глаза, что создает предпосылки стерео восприятия и пространственной локации источника звука или оптического объекта. Определенную информацию об окружающей среде мы получаем от органов вкуса, обоняния и осязания. Эти информационные каналы весьма важны для сохранения жизни, но с точки зрения потоков данных они достаточно узкополосны. Самым широкополосным нашим каналом является визуальный. В оптической области люди могут воспринимать волны с длиной волны от 380 до 740нм, что в принципе может обеспечить потоки данных масштаба ~60Тбит/c. Проблема в том, что человек способен воспринимать <<10Мбит/с, обрабатывая эти данные лишь частично (речь идет о восприятии движущегося изображения). В акустическом диапазоне наши уши чувствительны для частот от 20 Гц до 20 кГц. Наш акустический канал принципиально асимметричен. Передачу данных мы осуществляем голосом (полоса 600 Гц - 6кГц), а восприятие слухом, который имеет более чем в два раза большую полосу пропускания. Уместен вопрос, зачем Природа или Создатель сформировали столь асимметричный канал? Отказать в рациональности такого решения нельзя. Ведь в реальной жизни хотя бы с точки зрения безопасности через уши мы получаем данные о шорохе листвы, по которой подползает к вам змея или о подлетающем комаре. Частотные диапазоны этих шумов находятся вне области воспроизведения нашим голосом. Это же касается раскатов грома или звука выстрела. Отсюда следует, что мудр тот, кто больше слушает, чем говорит, так он способствует накоплению информации в своей памяти.

Огромен динамический диапазон воспринимаемых нами звуков > 1:20000. К счастью имеющийся у нас аппарат преобразования звука в нервный (электрический) сигнал является нелинейным. В противном случае при близком грозовом разряде или выстреле мы могли бы погибнуть от шока - из-за слишком большого импульса возбуждения. Устройство преобразования звука у человека имеет логарифмическую характеристику, что спасает нашу нервную систему от перегрузок. Это позволяет нам воспринимать и шорох листвы и выживать, когда сосед слушает тяжелый рок при 300Вт звуковой мощности или пытается завести свой мотоцикл на балконе. Частотный диапазон восприятия у нас настроен так, чтобы воспринимать жизненно важные звуковые сигналы. Наш голосовой аппарат способен воспроизводить самые разнообразные звуки, это позволило человечеству сформировать языковую систему коммуникации.

Человеческий голос состоит из гласных и согласных звуков. Гласные звуки генерируются, когда голосовой тракт открыт и определяются резонансом, основная частота которого зависит от размера и формы голосовой системы, от положения языка и челюстей говорящего. Эти звуки для интервалов порядка 30 мсек являются почти периодическими. Согласные звуки формируются, когда голосовой тракт частично перекрыт, эти звуки являются менее регулярными по сравнению с гласными. Некоторые современные системы генерации и передачи голоса используют модели голосовой системы с ограниченным числом параметров (например, размер и форма различных полостей), а не простое стробирование формы голосового сигнала. Вполне возможно, что успешное использование звуков для сигнальных целей в свою очередь стимулировало развитие гибкости голосового аппарата.


Акустическое общение (да и вообще любая передача сигналов) предполагает соглашение между источником и приемником относительно значения сигналов или их комбинаций. Многообразие таких сигналов (акустический язык) определяется уровнем развития отношений в данном конкретном сообществе. Если следовать Ветхому завету, то человек владел акустическим языком с момента сотворения, иначе как бы он узнал, что нельзя вкушать плоды с дерева познания.

Следующим шагом на пути цивилизации было создание письменности. Сегодня трудно точно сказать, когда это произошло. Ясно, что попытки такого рода производились многие тысячи лет до рождества Христова. Все началось с наскальных рисунков. Позднее они стали формализоваться, привязываться к фонетике голосовой речи, письменность ведь вначале рождалась, как средство удаленной коммуникации, расширяющее возможности устной речи. Был бы уже тогда телефон, и появление письменности вполне могло задержаться на многие века.

Наконец был создан символьный язык для описания не только объектов реального мира, но и абстрактных понятий. Достаточно вспомнить скрижали, которые Бог передал Моисею. Об этом говорится в Ветхом завете, и было это задолго до рождества Христова. Но сами эти камни с письменами предполагали, что народ или хотя бы священнослужители были способны прочесть то, что на них написано. Письменность предполагает соглашение между пишущим и будущими читателями относительно значения графических символов.


Письменность открыла возможность передавать информацию от умерших к живым, позволила накапливать технологические знания, сделала возможным развитие науки и технологий.

В начале письменность была уделом избранных и являлась криптографической системой. Читать и писать могли только священнослужители. Чтобы убедиться в этом, достаточно заглянуть в Ветхий завет. Кстати, это свидетельствует о том, что письменность существует уже многие тысячи лет.

Изустные знания ненадежны, легко искажаются. Впрочем, это было свойственно и первым письменным источникам, ведь первые книги просто переписывались вручную. В качестве носителя использовались специально обработанные шкуры животных - пергамент, или прототип бумаги - папирусы (древнейшие египетские папирусы относятся к 25-му веку до нашей эры) и, наконец, во втором веке нашей эры бумага (Китай). В начале 11-го века в Китае начали печатать книги с использованием подвижных литер, выполненных из глины или дерева. В 14-ом веке в Корее стали применяться для печати подвижные металлические литеры (чем не прототип пишущей машинки?). Практически с самого начала в рукописях и “полиграфии” использовалось несколько цветов.

Сначала записанная информация имела вид свитков. Позднее они стали объединяться, такие блоки листов стали называться кодексами. Известные древнейшие библиотеки относятся ко 2-3 тысячелетиям до нашей эры, создавались они героическими усилиями переписчиков. Переписчик часто заботливо “исправлял” непонятные ему места, внося неизбежные субъективные искажения. Иногда такие искажения вводились сознательно в угоду политическим, идеологическим или религиозным воззрениям.

Книгопечатание в Европе появилось сравнительно недавно - в середине 15-го века в Германии благодаря усилиям Гуттенберга (литеры из глины). Каменные скрижали долговечны (не беспредельно), но неудобны для переноса и изготовления. Люди, правда, научились писать на глиняных пластинках, которые потом обжигались на солнце, но и это не решало проблемы. Надписям на камне мы обязаны своим знаниям о самых древних периодах человеческой цивилизации. Бумага и пергаменты хорошо горят (и гниют), именно это послужило причиной потери многих ценных манускриптов. Пожары же преследовали человечество с самого начала, с момента освоения технологии обогрева и приготовления пищи на очаге. До нашего времени дожили лишь небольшие фрагменты некоторых древних библиотек (вспомним хотя бы судьбы Александрийской библиотеки или библиотеки Ивана Грозного). Бумажные книги существуют уже более 800 лет. И только в конце 20-го века благодаря развитию вычислительной техники у них появился конкурент - CD- и DVD-диски (с объемом данных 750, 4700 Мбайт и более и это не предел). На данной странице около 3,5 килобайт информации. Один такой диск может содержать тексты нескольких книг. Объемная плотность информации в CD превосходит книжную на порядки. В принципе технология CD при определенных условиях может обеспечить длительность хранения на уровне многих сотен, а может быть и тысяч лет.

Наш голосовой канал, прежде всего, предназначен для общения с себе подобными. Часть предыдущей фразы до запятой содержит 19 букв (в кодовом представлении 19 байт). В норме она произносится примерно за одну секунду, что создает поток данных в 152 бит/сек. Хорошо тренированный оператор за полторы-две секунды может напечатать эту часть фразы.

Так говорящий произносит "да", но то, как он это говорит, может означать - нет. Сюда можно отнести эмоциональную окраску, выбор слов, интонацию, логические ударения, акцент, по которому можно иногда определить даже место рождения человека. При разговоре согласно некоторым оценкам мы передаем 5-60 бит в секунду. Но это оценка лишь смысловой информации, извлекаемой из записи сказанных слов. При беседе мы можем передавать важные данные мимикой, жестами и другими средствами, причем эти данные могут иной раз противоречить информации, содержащихся в произносимых словах. Грубые оценки указывают, что устная речь с точки зрения энтропии имеет 50 процентную избыточность.


Отсюда видно, что наши собственные возможности передачи данных, сопряженные с движениями пальцев рук или языка весьма ограничены и никогда не превышают 100 бит/сек.

Можно предположить, что это связано с особенностями структуры нашей нервной и мышечной системы (задержками в цепи обратных связей). Следует иметь в виду, что эта активность сопряжена с необходимостью распознавания образов - важным свойством всего живого.

Нашу нервную систему вполне можно рассматривать, как локальную сеть, внешние же коммуникации человека могут служить аналогом Интернет. По внутренним нервным магистралям распространяются сигналы от различных рецепторов, сообщая данные о состоянии окружающей среды и самого организма, аналогично, но в противоположном направлении передаются управляющие сигналы. Обратные связи являются основой жизни и способом адаптации к окружающей среде. Я не являюсь тонким знатоком физиологии человека, но, тем не менее, позволю предположить, что в нашей нервной системе используется, как “проводные” соединения, так и адресная система доставки сообщений.

Мне трудно представить, например, чтобы тактильные и температурные датчики транспортировали в мозг сигналы по разным каналам, такое решение представляется неэффективным, хотя вполне может оказаться, что я ошибаюсь. Использование общего канала для передачи данных от разных датчиков предполагает, что в передаваемом сигнале будет как-то зашифрован идентификатор датчика, иначе сигнал может быть неправильно интерпретирован.

Для построения систем, непосредственно контактирующих с органами чувств человека, крайне важно точно знать параметры внутренних каналов передачи сигналов. Такие данные помогут корректно спроектировать интерфейсы, оптимизировать и заметно удешевить технические решения.

Наш визуальный канал принято справедливо считать быстродействующим. Быстродействие, тем не менее, здесь не столь велико, как это можно предположить. Во-первых, быстродействие ограничивает инерциальность датчиков в глазу, которая характеризуется постоянной времени ~0,04 сек (вспомним частоту кадров в кино). Во-вторых, это скорость обработки и распознавания образов в головном мозге. Оценить эту составляющую быстродействия сложнее. Попытаемся все же это сделать. За сколько секунд вы можете прочесть эту страницу? Это у вас занимает 1-1,5 минуты? Тренированные люди способны читать до 1000 слов в минуту. Будем считать среднюю длину слова равной 8 букв, тогда получим скорость восприятия 135 байт/c.


Таким образом, максимальная скорость обработки текстовых данных составит <150байт/сек. Всего в 10 раз больше, чем на слух!

Мне могут возразить, что, смотря телевизор, мы обрабатываем большие потоки. Возможно это так. Но в любом случае это не больше 200кбайт/сек (вспомним предельную скорость передачи данных в каналах цифрового ТВ).


Бессмысленно для человека передавать потоки данных в форматах и при скоростях не согласованных с возможностями его восприятия.

Об этом должны задуматься режиссеры телефильмов, дизайнеры WEB-страниц, создатели рекламы и т.д. С другой стороны следует помнить, что, обладай человек более скоростным визуальным каналом (если бы наши глаза не имели инерциальности запоминания видео изображения), не было бы современного кино и телевидения, так как люди воспринимали бы это как мелькание картинок, а не как имитацию реальных образов. Кино и телевидение по своей природе не являются зеркальным отражением того, что оказывается в фокусе входного объектива киноаппарата или телевизионной камеры. Обе эти технологии успешно используют особенности нашего зрения и мозга. Эти соображения лишний раз показывают насколько важно учиться у природы.

Мы еще очень мало знаем об особенностях работы нашей аналитической системы. Очевидно, что значительная часть ее мощности используется для нормального функционирования нашего организма (переработка пищи, борьба за выживание во враждебной среде и т.д.). Полагаю, что те, кто писал программы для человекоподобных роботов, со мною согласятся. Просто удерживать тело в вертикальном состоянии задача не из простых. Вы знаете, что происходит с человеком, чей мозг частично отравлен алкоголем. Все мы знаем также, что происходит с нашим телом, которое существовало десятки лет, после смерти. Оно разлагаться присутствующими бактериями за несколько дней. Другой важной функцией нашего аналитического аппарата является обслуживание наших органов чувств (обработка поступающих данных и выработка ответных реакций). И лишь остаток ресурса остается для управления интеллектуальной сферой. Может быть, из-за большого запаса аналитического потенциала многие великие ученые прожили долгую жизнь (например, Леонардо да-Винчи, Л.Н.Толстой).

Можно с уверенностью сказать, что наши болезни - это сбои системы управления организмом.

При разговоре мы можем управлять интонацией, эмоциональной окраской, а при личном контакте и жестами. Иной раз мы одним междометием способны передать своему партнеру больше, чем иной политик в часовой речи. Но эта информационная составляющая доступна и высокоразвитым животным, например собаке. Важно заметить, что такие данные пока трудно факторизуемы и по этой причине пока не доступны для компьютерного анализа. При обработке данных человеком следует различать работу с текстами и голосом. В первом случае человек распознает буквы, во втором - звуки (фонемы). Но и при анализе текстов следует иметь в виду, что при чтении человек не анализирует каждую букву, а воспринимает отдельные слова, иногда даже их сочетания. Текст на любом языке имеет достаточно большую избыточность. Учет этих фактов приведет к дальнейшему занижению скорости восприятия данных человеком. Хотя энтропия устной речи несколько выше энтропии письменных текстов, именно повторы и слова паразиты заметно понижают энтропию разговорной речи.

Если попытаться проанализировать полезность или эффективность получаемой информации (то, что изучает ветвь семиотики, называемая прагматикой), то результат будет во многих случаях вообще печальным. При разговоре мы часто повторяем одни и те же фразы, мысли и факты, произносим огромное число слов-паразитов. Я уже не говорю о пустой болтовне по телефону, уведомляющей собеседника о количестве выпитого накануне или о покрое юбки жены соседа. Люди по какой-то причине не могут без этого. Нам приходится слушать речи высоких политиков или читать статьи или книги, смысл которых ничтожен, а содержащаяся в них информация может быть охарактеризована несколькими битами, уведомляющими слушателя или читателя об честолюбивых амбициях автора. Многоточие в конце романа классика во много раз информативнее.

Трудно представить, чтобы ЭВМ Центра управления полетом, прежде чем передать управляющую информацию бортовой машине, перешлет ей сначала анекдот, найденный только что в Интернет. Впрочем, это относится скорее к области информатики, чем телекоммуникаций. Хотя от умения компактно передавать наиболее существенные данные зависит эффективная работа информационных систем будущего.

Мы привыкли характеризовать переданные объемы данных в байтах. Но правильно ли это? Ведь терабайт логических 1 не в 1000 раз больше по информационной емкости гигабайта этих самых единиц. Правильнее было бы характеризовать объем переданных данных с привлечением информационной энтропии. Среднее количество информации Е на один произвольный символ (или сообщение) равно:

где pi – вероятность появления i-го символа (или сообщения). Log2(1/pi) определяет число бит, характеризующих данную информацию (сколько бит мы должны послать, чтобы передать эту информацию). Отсюда следует, что сообщение, которые имеют большую вероятность, несут в себе меньше информации.

Пожалуй, интерес людей к сенсациям диктуется интуитивным стремлением получить информационно более емкий материал.

Если бы мы научились корректно определять истинное количество и качество информации в научной статье, то присуждение нобелевской премии превратилось бы в простую формальность.

Так как на практике отдельные символы встречаются с разной вероятностью, то кодирование с постоянной длиной кодовых слов (например, один байт на символ) является избыточным. Так все стандартные 8-битовые кодировки русского алфавита являются избыточными. Значение энтропии для русского языка ≤ 4,35.

Энтропия является мерой неопределенности реализации того или иного случайного события. Классическое определение информационной энтропии (H) выглядит как:

где pi - вероятность того, что реализуется конкретное значение хi (i может принимать значения от 1 до n. I(x) - целочисленная случайная функция (информационное содержимое Х).

Обычный способ определения энтропии текста базируется на модели Маркова для текста. При этом вероятность появления очередного символа предполагается независимой от предыдущего символа (что, разумеется, не всегда верно).

Энтропия указывает предельный уровень сжатия данных программами-архиваторами. Написать программу, которая бы обеспечила более высокий уровень сжатия теоретически невозможно. Эффективный текстовый архиватор должен разбираться в грамматике языка, на котором написан текст.

Если энтропию отдельных букв и даже слов достаточно легко оценить по частоте их использования, то расчет энтропии сообщения представляет определенную проблему (из-за огромного их многообразия), а оценку накопленных знаний человечества можно рассматривать как серьезную проблему на будущее. Куда проще оценивать объем информации в гигабайтах или петабайтах, как это делается сегодня, в частности, если оперировать архивированными файлами. Следует только помнить, что такая оценка с реальным объемом информации практически имеет мало общего.

Разумеется, если мы знаем реальный объем информации в системе до и после получения некоторого сообщения, то информация, содержащаяся в сообщении определяется разностью значений информационной энтропии до и после получения этого сообщения, смотри http://book.itep.ru/10/shennon.htm.

Здесь мы прикасаемся к проблеме издержек, связанных с заголовками пакетов данных, пересылаемых по сетям. Так при удаленном доступе (протоколы Telnet, SSH и пр.) на один переданный байт, характеризующий нажатую клавишу терминала, приходится более 50 байт заголовков и другой вспомогательной информации.


Эффективность удаленного ввода с консоли, как видите, меньше коэффициента полезного действия паровоза. Но современные телекоммуникационные технологии пока не могут предложить ничего лучшего.

Способность передачи определенных данных посредством мимики и поз роднит человека с представителями животного мира. Животные этим методом общения пользуются более активно, отчасти компенсируя таким способом отсутствие речевого канала. Недостаточное развитие звукового информационного общения у животных возможно связано с малым объемом данных, которые им нужно передавать в отсутствии непосредственного визуального контакта. Звуковая сигнальная система более развита у стадных животных (например, у дельфинов или волков), к которым с этой позиции можно отнести и человека.

К сожалению, Создатель не предусмотрел передающего канала, образующего пару для нашего зрения. То ли он столкнулся с какими-то технологическими трудностями, то ли в силу своей мудрости увидел в этом истоки серьезных бедствий в будущем. Оптическая пара приемо-передатчиков могла бы дать нам несравненно более мощный канал общения. Не ясно только, смог бы наш мозг сформировать и обработать такой поток данных. Мозг наш достаточно мощное аналитическое устройство, но и его возможности ограничены. Ведь время распространение возбуждения по нервным волокнам от мозга к периферийным мышцам исчисляется миллисекундами или даже десятками миллисекунд. Может быть, именно по этой причине наши глаза и уши размещены рядом с головным мозгом.

Если бы глаза размещались, например, на запястьях (иногда неплохо было бы иметь там и уши), мы могли бы, разведя руки, с высокой точностью определять расстояние до любого объекта (разрешающая способность возросла бы более чем в 20 раз; кстати, эта идея реализована мадагаскарскими тараканами, у которых уши размещены в области локтевых суставов). Но время доступа к данным при этом неизбежно увеличилось бы, возросло бы и время отклика на сигналы опасности, что создало серьезные угрозы безопасности из-за замедления реакции. Следует иметь в виду, что скорость распространения сигнала по синапсам и аксонам нейронов составляет около 120 метров в сек. Кроме того, для кистей рук велика вероятность повреждений, ведь они у нас являются одним из главных исследовательских инструментов. Да и размеры человеческого тела с учетом того, что главным его инструментом выживания является мозг, полагаю, определяются, среди прочего, скоростью распространения сигналов возбуждения по нервным волокнам.

Различие возможностей зрения и слуха объясняется также числом обслуживающих нервных волокон. 30000 - для слуха и примерно 800000-900000 - для зрения. Эксперименты показали, что в случаях, когда требуется переработка данных и последующий отклик, скорость обработки составляет 30-40 бит/сек вне зависимости от используемого человеком канала связи (слух/зрение). Ясно, что многие методики из области проблем, сопряженных с физическими каналами связи, применимы и для исследования органов чувств человека и методов переработки информации.

Кто знает, не является ли наблюдающаяся в последние годы акселерация (увеличение размеров человеческого тела от поколения к поколению) свидетельством вырождения человеческого рода.


Возможно, из-за больших задержек в цепях обратных связей вымерли все гигантские животные.

Мы хорошо и быстро решаем задачи распознавания видео и аудио образов, но затрудняемся при перемножении двух 10-значных чисел, в то время как современная ЭВМ с такой задачей справится за микросекунду или даже быстрее.

Вообще для живых существ характерна высокая эффективность процесса распознавания на самых разных уровнях (распознавание голоса, лиц собеседников или чужих молекул в крови), так как это крайне важно для выживания во враждебной среде.

Наши органы чувств и аналитический аппарат не совершенны. Осознание и количественное определение этого позволило существенно усовершенствовать создаваемые человеком средства коммуникаций. В процессе распознавания наш глаз останавливает свое внимание на определенных характерных точках изучаемого объекта.


Полагаю, что использование фиксации внимания на определенном, ограниченном числе узловых точек изображения позволит существенно сжать данные, так как другие менее существенные детали картинки могут быть переданы менее подробно (с меньшей разрешающей способностью).

Человечество постоянно стремилось расширить возможности своих органов чувств (каналы коммуникаций с окружающей средой). Так были созданы подзорная труба и микроскоп, термометр и газоанализаторы, высокочувствительные микрофоны и радиолокаторы, а также многое другое. Подзорная труба может рассматриваться как аналоговое однонаправленное телекоммуникационное устройство.

Рассмотрим, какие искусственные каналы коммуникаций создал сам человек за последние тысячелетия своего существования. Представьте себе следующую сцену, возможно имевшую место много столетий тому назад.

На горизонте поднялось легкое облачко, которое начало расти и шириться. Постепенно становилось ясно, что это облако пыли, поднятого множеством лошадиных копыт. На вершине холма дозорные настороженно следили за приближением этого отряда и, когда стало ясно, что это большой отряд противника, старший дал команду разжигать сигнальный костер. Из небольшого очага, где огонь поддерживался круглые сутки, специальным захватом, была извлечена пылающая головня и помещена в основание большого сигнального костра. Сначала огонь разгорался медленно, но уже через несколько минут столб дыма и огонь поднялись на многие метры. Тогда его заметил другой сигнальный отряд, размещенный в нескольких верстах от первого, и там также зажгли сигнальный костер.

Такая техника позволяла передать 1 бит информации (логический нуль или логическая единица) на расстояние до 100 км менее чем за один час (время сильно варьировалось в зависимости от рельефа местности и погоды). Скорость такого метода передачи данных в дневное время можно было удвоить, используя черный или белый дым. Костры часто размещались на специально построенных вышках для увеличения расстояния между ними. Здесь нечего говорить о надежности, проливной дождь (или вьюга) мог помешать разжечь костер, да и видимость при этом могла оказаться весьма ограниченной. Здесь надо заметить, что строго говоря, в вышепредставленном примере передавался не один бит. Ведь только сигнал с определенного направления имел определенный смысл, а дым или огонь, появивишийся в другом месте, ничего не значил. Фактически это был код с одной единицей и определенным количеством нулей. Вопрос о том, сколько здесь должно быть нулей, совсем не прост. Дым или огонь в точке, близкой к одной из сигнальных вышек, может создать ложную тревогу, и такие сигналы можно рассматривать в качестве шума.

Альтернативный метод посылки депеши с всадником позволял передать несравненно больший объем информации, но почти на порядок с меньшей скоростью, ведь прямых дорог тогда не было, да и водные преграды или горы могли существенно замедлить движение. В море сходный метод, использовавший сигнальный масляный фонарь, служил для передачи коротких сообщений для координации действий кораблей в пределах прямой видимости.

Но даже такой технологии было достаточно для длительного существования гигантских государственных образований (от империи Александра Македонского до Римской империи). Именно со скоростью лошади или деревянного гребного или парусного бескилевого судна передавались сообщения с периферии в центр, а оттуда в обратном направлении посылались руководящие инструкции или решения. Задержка достигала многих месяцев. Удивительно, но этого было вполне достаточно для стабильного существования государства. Вероятно, чиновники были вынуждены обдуманно принимать решения, так как быстро исправить ошибку было нельзя. Решение проблемы здесь лежит в предоставлении определенной самостоятельности властям провинции (приближение центра принятия решения к объекту управления). Еще одним средством решения проблемы большой задержки в цепи принятия решения (RTT в сетевой терминологии) является выработка набора унифицированных правил реагирования на стандартные ситуации (в случае сетей такие правила называются протоколами). Даже применение самых мощных информационных и телекоммуникационных технологий не позволят эффективно управлять из Москвы автомобилем во Владивостоке.

Когда императоры Римской империи попытались в долговременном плане построить жесткую вертикаль власти, империя распалась сначала на две части, а позднее на большое число независимых государств.


Техника телекоммуникаций с временем RTT (Round Trip Time), равным 2-6 месяцам, просуществовала без существенных изменений более 1500 лет.

Мы привыкли считать, что то что мы видим соответствует состоянию на момент наблюдения. Но это не так. Мы видим не глазами, а мозгом, а ему требуется время на обработку видеоданных. Так то, что мы видим, соответствует состоянию нескольких десятков миллисекунд в прошлом. Аналогично, послав запрос о состоянии какого-то объекта в Интернет и получив отклик, мы узнаем о состоянии, которое имел объект > RTT/2 миллисекунд тому назад.

Современные технологии позволяют передавать несравненно большие объемы данных, чем в прошлом. Вместо одного бита в час сегодня можно передавать более 100 гигабит в секунду. Но если из точки А в точку B передано 1000000 бит вместо одного, можно ли утвержать, что при этом получено больше информации?

Ответ только на первый взгляд может показаться очевидным. Например, если весь миллион бит составляют одни логические единицы, будет ли такое послание сильно отличаться от одной единицы?

Таким образом, ясно, что бит не является мерой реального объема информации. Очевидность этого факта подтолкнула математиков к формулировкам принципов измерения объемов информации, базирующимся на понятии информационной энтропии, смотри "Базовые определения теории информации".

Начало ускорения технического прогресса в сфере телекоммуникаций

Только в 19-ом веке стали появляться железные дороги, пароходы и, что особенно важно, электрический телеграф и телефон. Связь с применением азбуки Морзе в 1840-ых годах позволяла передать до 10 бит/сек на расстояние десятки и сотни километров. Азбука Морзе, пожалуй, была первым широко распространенным телекоммуникационным кодом (см. таблицу 1.1, придумана американским художником в 1840 году). Коды здесь представляют собой последовательности точек и тире. Отличие точки от тире определяется длительностью сигнала (точке соответствует более короткий сигнал). Возможны варианты, когда точке и тире соответствуют импульсы тока или напряжения разной полярности. Такая схема исключает зависимость идентификации символа от длительности импульса. Максимальная скорость передачи классического телеграфа может составлять 950-1100 слов в час. В 1884 году начала функционировать телеграфная линия Вашингтон - Балтимор. Для линий связи в ту пору использовалась стальная проволока диаметром ~5мм. В качестве источников электроэнергии применялись батареи на напряжение 40-120 В. Импульсы тока имели амплитуду 10-25мА. Сама система являлась электромеханической и предполагала использование контактного ключа (вспомните шпионские фильмы периода второй мировой войны). Позднее ключ был заменен клавиатурой. Нажатие на определенную клавишу вызывало формирование последовательности сигналов, соответствующей определенной букве, что позволяло в несколько раз ускорить процедуру передачи. Такое устройство, получившее название телетайп, было предложено Кляйшмидтом и Моркрамом в 1915 году в США. На первых порах использовались электромеханические приемные устройства, которые печатали точки и тире, что было крайне неудобно. Позднее стали применяться устройства, которые могли дешифровать коды Морзе (или Бодо) и печатать на ленте буквы. Люди старшего поколения, возможно, еще помнят бланки телеграмм, на которые наклеены куски ленты с текстом, полученные от таких устройств.


Таблица 1.1. Коды Морзе

Код МорзеБуквы  Код МорзеБуквы и символы
РусскиеЛатинскиеРусскиеЛатинские
•– AAa•–•–ЯÄä
–•••БBb •–•–•–ЙJj
•–•–ВWw – •–ЪЬXx
– –•ГGg •–••ЭÈè
–••ДDd•–•–•–•–1 
ЕEe•–•–•–2 
•••–ЖVv••–•–3 
–•–••ЗZz••••–4 
••ИIi•••••5 
–•–КKk–••••6 
•–••ЛLl–•–•••7 
––МMm–•–•–••8 
–•НNn–•–•–•–•9 
–•–•–ООо–•–•–•–•–0 
•–•–•ПPp••••••. (точка) 
•–•РRr•– – –, (запятая) 
•••CSs– –•–•; 
ТTt– •–•–•••: 
••–УUu•–•••? 
••–•ФFf–•–•–•–! 
••••ХHh–•–•–•–•–•– / 
–•–•ЦСс•–•–•– – _ 
–•–•–•ЧÖö•– – • + (конец) 
–•–•–•–ШCh–••• – - 
–•–•–ЩQq–••• – Знак раздела 
–•–•–ЫYy•– – –•– Начало действия 
••–•–ЮÜü•••••••Исправление ошибки 

Телекоммуникационный канал содержал два провода, по одному ток течет в одном направлении, по второму - в обратном. Понятно, что железо в качестве проводника не идеально (удельное сопротивление 8,8×10-6 Ом*см, да и склонность к ржавлению чего стоит), зато дешево. Лучше была бы медь или алюминий (1,56×10-6 и 2,45×10-6 Ом*см, соответственно). Еще лучше серебро - 1,51×10-6 Ом•см. Золото по своим электрическим свойствам занимает положение между медью и алюминием. Полагаю, не нужно пояснять, почему каналы коммуникаций никогда не делали из серебра и тем более из золота (и с медью мороки не оберешься…). Омическое сопротивление является причиной ослабления сигнала, что ограничивает предельное расстояние передачи по проводной линии. Это вынуждает на определенных расстояниях ставить станции ретрансляции. А наличие таких станций часто приводит к появление случайных или намеренных ошибок. Вспомним роман "Граф Монте-Кристо", где главный герой фальсифицирует телеграмму на испано-французской границе и тем самым разоряет банкира (чем не сетевая атака "человек-по-середине").

Рассматривая таблицу кодов Морзе, следует обратить внимание на то, что наиболее часто используемые буквы имеют более короткие коды (это, прежде всего е, т, а, и, н и м). Это очень важный принцип, позволяющий увеличить среднюю скорость передачи данных. Он используется достаточно широко, можно, например, вспомнить принцип распределения символов на клавиатуре ЭВМ, в центре размещаются наиболее часто используемые буквы. Посмотрите на клавиатуру вашей ЭВМ, в центре и ближе к клавише пробела размещаются именно указанные в начале абзаца буквы. Используется эта техника и при архивировании данных (алгоритм Хафмана). Кроме того, весьма важными являются паузы между буквами. Если пауза окажется малой, то трудно будет отличить НН от Ц, АА от Я и т.д. Распределение частот (вероятностей P) использования букв русского алфавита представлено в таблице 1.2.

БукваPБукваP
пробел0.175я0.018
о0.09ы0.016
е,ё0.072з0.016
а0.062ь,ъ0.014
и0.062б0.014
т0.053г0.013
н0.053ч0.012
с0.045й0.01
р0.04х0.009
в0.038ж0.007
л0.035ю0.006
к0.028ш0.006
м0.026ц0.004
д0.025щ0.003
п0.023э0.003
у0.021ф0.002

Аналогичные принципы лежат в основе морских флажковых семафоров, где каждой букве соответствует определенное положение рук сигнальщика. Здесь можно также вспомнить французский семафор, изобретенный в 1830 году. Но это также как и сигнальные костры можно считать первыми приложениями, использующими передачу данных по оптическим каналам связи.

Надо сразу сказать по экономности кодирования русский язык заметно уступает английскому. В этом легко убедиться. Достаточно попытаться перевести произвольный отрывок английского текста на русский язык. Практически всегда перевод будет на 20-30% длиннее оригинала.

Позднее было создано много других типов кодов (например, код Бодо для буквопечатающих аппаратов, ASCII или КОИ-8), в них, как правило, каждому символу или сигналу соответствует 5-8 бит (в действительности это 5-битовые коды, использующие два регистра). Сигналами отмечается, например, начало/конец передачи или исправление ошибки. Характерной особенностью ранних систем было отсутствие кодов для строчных букв. В мире много национальных алфавитов. Многие из них содержат специфические символы, достаточно вспомнить символьные набор китайского языка (в детстве меня занимал вопрос - как устроена китайская пишущая машинка?). Чтобы решить проблемы кодирования национальных алфавитов был придуман уникод, где каждому символу ставится в соответствие два октета (байта). Это позволяет расширить многообразие символов с 256 до 65536.

Коды Морзе использовались вплоть до второй половины двадцатого века. Их привлекательность была связана с ограниченностью требуемой полосы пропускания канала, а также с тем фактом что, для передачи были пригодны старые, довольно низкокачественные каналы.

Введя модуляцию на частоте 1500Гц (1936г), удалось получить до 24 телексных каналов по одному телефонному каналу с полосой 4 кГц (50бод). Позднее телексная сеть обрела самостоятельность и была окончательно вытеснена современными средствами связи лишь в конце 20-го века.

Состояние телекоммуникаций в конце 20-го - начале 21-го века

К 1950 годам большинство стран использовало три типа общедоступных сетей:

  1. Телеграфная сеть, которая просуществовала до конца 20-го века.
  2. Телефонная сеть (аналоговая), имеющая полосу 4 кГц и почти не менявшаяся по принципам работы с 1880 годов. Импульсная сигнальная система практически не изменялась с 1910 года.
  3. Телексная сеть, которая применялась в основном для делового обмена.

Рассмотрим причины того, что проводные системы связи, оставшиеся в наследство от телеграфа, мало пригодны для современных систем телекоммуникаций. Двухпроводные структуры, применявшиеся там, как правило, навешивались на телеграфные столбы или укладывались в виде кабелей в подземные каналы. Среднегеометрическое расстояние между проводами не было постоянным, более того, оно могло изменяться со временем, например, под действием ветра. Это приводило к тому, что волновые свойства такой структуры варьировались, а это с неизбежностью приводило к искажениям формы сигнала для длинных участков канала. Такие искажения ограничивали предельно возможную скорость передачи и длину канала без промежуточных ретрансляторов.

На первый взгляд прогресс в области электроники может снять проблему ослабления сигнала из-за омического сопротивления проводов, и исключить необходимость использования амплитуд сигналов порядка 40-100 вольт. Казалось бы, ставя промежуточные усилители, можно поддерживать амплитуду полезного сигнала в заданных пределах. Идеальным примером такого решения могут служить трансокеанские телефонные кабели.


Беда в том, что ослабление сигнала из-за резистивных потерь не сопровождается ослаблением шума в канале. Усилители же увеличивают уровень шума пропорционально своему коэффициенту передачи. По этой причине рано или поздно средние значения амплитуд сигнала и шума могут сравняться.

Конечно, по пути транспортировки данных и на принимающей стороне предпринимаются усилия по фильтрации шума. Так как тепловые шумы достаточно высокочастотны в случае телеграфии или телефонии можно существенно улучшить отношение сигнал/шум простым подавлением высокочастотной составляющей сигнала.

Передача данных по протяженным каналам через пустынные области, например, по дну океана, как было отмечено выше, требуют наличия усилителей, а усилители нуждаются в питании. Обычно питание передается по тому же кабелю, и здесь также вмешиваются омические потери.

Известно, что в оптоволокне сигнал подвергается меньшему погонному ослаблению, чем в медном проводе. Было бы замечательно, если бы был найден способ, передавать энергию для опто-электрических усилителей по оптическому волокну. К счастью найдены методы передачи данных по оптоволокну без промежуточных усилителей на расстояния более 10000 км.

Принцип Ландауэра

Американский физик Рольф Ландауэр (родои из Германии, 1927-1999) описал (в 1961г) принцип, соласно которому при любой логически необратимой операции, которая работает с информацией и приводит к потере бита, энтропия системы увеличивается и связанное с этим количество энергии E рассеивается в виде тепла.

E=kBT ln 2, где kB - постоянная Больцмана, Т -абсоютная температкра в кельвинах

Выражением Шеннона — фон Неймана — Ландауэра (Shannon—von Neumann—Landauer, SNL) называют минимальную энергию Ebit, необходимую для обработки 1 бита (либо — минимальную высоту барьера, необходимую для разделения двух состояний электрона ESNL) [2].

Несмотря на то, что увеличение энтропии при стирании одного бита чрезвычайно невелико, современные микросхемы имеют в себе миллиарды транзисторов, переключающихся на частотах до нескольких гигагерц (миллиардов раз в секунду), что увеличивает количество теплоты от стирания информации до измеримых величин.

В начале XXI века компьютеры при обработке одного бита рассеивали примерно в миллион раз больше тепла, чем предсказано принципом. Однако на начало 2010-х разница снизилась до нескольких тысяч [3] [4], и предсказывается дальнейшее приближение к пределу Ландауэра в течение ближайших десятилетий. Несмотря на то, что увеличение энтропии при стирании одного бита чрезвычайно невелико, современные микросхемы имеют в себе миллиарды транзисторов, переключающихся на частотах до нескольких гигагерц (миллиардов раз в секунду), что увеличивает количество теплоты от стирания информации до измеримых величин.

В начале XXI века компьютеры при обработке одного бита рассеивали примерно в миллион раз больше тепла, чем предсказано принципом. Однако на начало 2010-х разница снизилась до нескольких тысяч [3] [4], и предсказывается дальнейшее приближение к пределу Ландауэра в течение ближайших десятилетий.

Ограничения накладываемые принципом Ландауэра можно обойти путём реализации обратимых вычислений, при этом возрастают требования к объёму памяти и количеству вычислений. Иногда также высказываются предположения, что обратимые вычисления будут медленнее.

Тенденции в ИТ

Ряд тенденций в сфере ИТ уже сформировались. Это, прежде всего интеграция услуг: Интернет, цифровое телевидение, телефония, электронная торговля, информационные услуги и т.д. Развитие мобильных технологий обмена, где мобильная телефония объединяется с Интернет и услугами абсолютного позиционирования. К этому классу можно отнести и переход хакерства от любительства к профессионализму и сращение с криминалитетом, разработка ведущими странами мира кибероружия (см. Eddy Schwartz, Computer Fraud & Security. September 2010, Winning the Cyberwar of 2010, а также http://www.caci.com/Contracts/ITES/ArcSightWhitepaperCyberWar.pdf - Cyberwar: Sabotaging the System. Managing Network-Centric Risks and Regulations (ArcSight)). Надеюсь, что разрабатывая кибероружие, страны позаботятся и о средствах защиты. Одним из видов кибервойн является кибершпионаж, как экономический, так и политический. Появление киберсредств войны отражает общую тенденцию к дистанционному нанесению ущерба безлюдными средствами (беспилотные самолеты, ракеты и пр.)

Формируются и другие тенденции, например, переход от обычного к криптообмену данными, широкое внедрение оптоволоконики. Скандал с WikiLeaks (2010г) заставил думать об информационной безопасности и политиков.

Виртуальная реальность находит все более широкое распространение. Интернет этому только способствует. Но кто бы мог подумать, что предмет из виртуального мира может наносить вполне реальный ущерб? WEB-страница содержит много такого, что не видно при просмотре. Именно по этой причине WEB-страницы и браузеры образуют цепочку, через которую в машины внедряются различные вредоносные программы. Если учесть, что прогнозируется установка автопилота на каждый автомобитиль к 2040-году и систем мониторинга состояния здоровья человека с постоянной связью с лечебным учреждением, масштаб угроз становится более понятным.

Новые технологии обычно сложнее старых и по этой причине уязвимее. Интернет становится все менее безопасным местом. В результате все более широко внедряется многофакторная аутентификация.

Для целей идентификации и для платежных систем внедряется технология NFC (Near Front Communication). Появились первые коммерческие квантовые компьютеры. Продолжаются попытки создания искусственного интеллекта (семантические сети и машина Watson). Мобильные устройства приближаются по вычислительной мощности и функциональности к персональным машинам.

Начаты работы в сфере когнетивных вычислений (ЭВМ Watson, IBM). Огромные объемы информации, накопленные в разных областях науки, могут позволить при аналитическом сопоставлении получить знания нового уровня.

Все шире внедряются приложения, использующие большое числа портов: файлообменные сети, Skype и т.д.. В настоящее время только компания Google предлагает около 20 таких приложений. Внедряются системы управления человеческим голосом IVR (Interactive Voice Response). IVR подразумевает также применение дикторо-независимого распознавания речи. На основе таких технологий создаются специализированные call-центры, обслуживающие клиентов, включая безоператорские справочные голосовые системы.

В последние годы быстро развивается новое направление ИТ - Интернет вещей. Интернет вещей – глобально связанная система приборов, объектов и предметов, базирующаяся на технологии RFID. Термин Интернет вещей был предложен Кевином Эштоном (Kevin Ashton) в 2009 году. Интернет вещей предполагает формирование среды, где все объекты окружающего мира - от транспортных самолетов до авторучек имеют выход в Интернет.

За последние годы реализован потрясающий прогресс в информационных технологиях. За 20 лет увеличилось быстродействие вычислительной техники в 1000 раз, пропускная способность каналов возросла в 10000 раз, уже более 30 лет действует закон Мура (удвоение плотности активных элементов на кристалле каждые полтора года). Уместно задать вопрос – можно ли ожидать аналогичный темп развития в дальнейшем?

К сожалению, ответ на эторос будет, скорее всего, отрицательным, если ориентироваться на существующие технологии. Прогресс в области цифрового ТВ и DVD-видео был связан с повышением эффективности сжатия информации. Алгоритмы сжатия данных без потерь вышли на энтропийный предел еще более 10 лет назад. Используемая технология на кремнии, позволяет работать с разрешением ~15 нм (2011г). На подходе мемристоры и графеновые транзисторы (5 нм), но постоянная кристаллической решетки кремния ~0,54нм. Да и совместить технологию на кремнии с графитом будет не просто. Понятно, что запас повышения разрешения менее 10, и это ограничение не технологии, а физики. На рис. 1 показана ситуация с возможностями нанотехнологии на сегодняшний день (2009-2011) и прогноз на будущее в предположении справедливости закона Мура.

Рис. 1. Нанотехнология. Состояние и прогноз.

На разрешение порядка 5 нм технология выйдет к 2020-му году (флэшки на мемристорах или графене не в счет, так как там высокая однородность структуры). Но для размеров ~5 нм возникнут проблемы отношения сигнал-шум. Недаром первые квантовые компьютеры работали при температуре 0,01 кельвина. Разрешение пордядка 5-10 нм в ближайшие годы будет достигнуто и для жестких дисков. Понятно, выходом из этого тупика будет уход из плоскости в объем. Первые многослойные чипы для флэшек появились пару лет назад (2012г).

На рис. 1А показан прогноз для размеров активных элемкнтов процессора до 2030 года.

Рис. 1A. Прогноз для размеров активных элементов до 2030 года.

Конкурентная борьба между компаниями Intel и AMD продолжается (см. "10nm Intel CPUs not coming to desktops until at least 2022, amid manufacturing issues", James Sanders, April 26, 2019). Intel анонсирует создание процессора Ryzen на основе 10-нанометровой технологии, в то время как AMD намерена выпустить в 2019 году ЦПУ Zen на основе 7-нанометровой технологии. Независимые эксперты прогнозируют появление нового ЦПУ Intel лишь в 2021 году. Несмотря на существенные трудности Intel намерена начать выпуск CPU 9-го поколения i9-9980HK (10нм) в текущем году (2,4 ГГц и 5ГГц турбо).

Исследователи из Стэнфордского университета разработали технологию создания многослойных чипов, которые смогут превзойти по параметрам все существующие (см. "Stanford 'high-rise' chip takes on IoT and big data", Sharon Gaudin, Computerworld, Dec 16, 2014). Предполагается, что эта технология будет прежде всего использована для Интернета вещей и для обработки больших объемов данных. В настоящее время разработан 4-слойный чип, разработчики считают, что точно также можно создать и 100-слойный.

Рис. 1Б. Первые многослойные чипы

Кремниевые монокристаллы уже сегодня могут иметь диаметр 25см. можно делать чипы с размером в несколько см (сейчас их размер ~5мм). Это может дать прирост числа элементов на кристалле в 100 раз. Серьезных проблем с отводом тепла при этом не возникнет. В области систем памяти пора переходить с числа бит на квадратный дюйм к числу бит в кубическом дюйме. Но на этом пути следует ожидать больших трудностей с отводом тепла.

Наиболее скоростные каналы передачи данных (оптоволоконные) работают на скорости 1011 бит/c (используется 16 потоков в одном волокне). Обсуждается создание каналов на 1 Тбит/c, а постоянная поляризации диэлектрика составляет 10-13 сек (запас на 5 лет развития с тем же темпом). За счет λ-коммутации можно увеличить скорость передачи еще в 5-10 раз.

Рост тактовых частот процессоров замедлился и уже в 2004 году производители перешли на многоядерную схему процессоров. Компания Tilera объявила о выпуске 100-ядерного процессора в середине 2011 года (при тактовой частоте 1,5ГГц он сможет обеспечить быстродействие 750×109 операций в сек, процессор не совместим с х86 и предназначен для облачных вычислений и задач сетевой безопасности). При обмене между ядрами обеспечивается скорость передачи 200 Тбит/с, а при обмене с памятью более 500 Гбит/c). Но и здесь ресурсы не беспредельны – уже сегодня на кристалле около 70% поверхности занимают проводные соединения между активными элементами, да и делать кристаллы размером с книгу вряд ли можно считать целесообразным. Кроме того, производительность вычислений растет в среднем пропорционально логарифму числа процессоров. Ярким примером сложившейся ситуации может служить супер-ЭВМ рекордсмен (Япония; 10 петафлоп/c или "Титан" более 17 петафлоп/c США; энергопотребление более 8МВт; ноябрь 2012), которая занимает 800 стоек и требует для своего питания и охлаждения отдельной электростанции (5 МВт = мощности первой АЭС в Обнинске; см. рис. 2). А это одна из самых энергоэффективных машин на сегодняшний день (2,2 Гфлопс/Вт). Что ждать от супер-ЭВМ следующего поколения – машина размером с небольшой город?

Следует учитывать, что большая часть потребляемой мощности расходуется на перезарядку паразитных емкостей в кристалле и соединительных проводников.

Любопытно, что Эрих Штромайер (Erich Strohmaier) разработчик списка Top500, в 1993 году сказал, что он не ожидает увидеть машину петафлопного класса. 15 лет назад трудно было сказать, будут ли 500 самых мощных машин иметь суммарную мощность 1 терафлоп.

Вычислительные машины в 2005 году потребляли 1,2-1,5% производимой энергии (в США), большая часть из этой доли приходится на настольные машины и небольшие серверы. Известно, что полезная мощность составляет примерно половину всех энергозатрат. Вторая часть представляет собой потребление вспомогательных структур вычислительного центра, включая системы питания и охлаждения. В США было принято решение сократить потребление в 2 раза. Эта задача была решена, что дало толчок к формированию направления green computing.

Предполагается, что критических значений технологии достигнут в 2020-25 годах. Число машин, подключенных к Интернет, превысило 1,5 млрд. Вместе с iPhone, iPad и пр. это число достигает 4 млрд. Человечество уже не может жить без машин и сетей. Машины управляют потенциально опасными технологиями, авиалайнерами, энергетическими системами, проектируют новые лекарства, на очереди встраивание чипов в организм человека и т.д. Но ведь машины и используемые ими каналы передачи данных имеют конечную надежность. Среднее число ошибок на 1000 строк кода равно 15-50. Для Linux это число равно 7. Продукты Microsoft после отладки характеризуются цифрой 0,5 ошибок на 1000 строк кода. Рекордное значения имеют программные продукты NASA JPL (навигационные программы для космических объектов) - 0.003 ошибки на 1000 строк кода. В программном обеспечении любой современной машины содержится до 50000 ошибок. По этой причине жизненно важным становится поиск решений, которые бы гарантировали приемлемый результат даже на ненадежной машине с ошибками в программном обеспечении. Согласно существующим оценкам в дистрибутиве Debian содержится около 3 миллионов ошибок (на 350 млн. строк кода)!

Быстро растет объем информации. Журнал Economist оценивает, что объем данных каждый год увеличивается на 60%. Эта точка зрения подтверждается аналитиком компании IDC, который предсказывает, что ‘цифровая вселенная’ достигнет 1.8 зеттабайт (1021байт) в 2011 г, на 47% по отношению к 2010 г, и превысит 7 ZB к 2015 г. 1 зеттабайт эквивалентен содержимому 50 библиотек конгресса США. На рис. 3 показан рост информационных объемов и доступной памяти. Зазор между потребностями и возможностями со временем только увеличивается (200 петабайт в год). Причин здесь много. Это оцифровка библиотек и архивов, создание разнообразных баз данных, видеозапись мониторинга (банкоматы, эскалаторы метро, банки), частные аудио и видеотеки и т.д.

Марк Либерман оценил объем памяти, которая нужна, чтобы записать все, что было когда-либо сказано людьми. Для этого нужно 42 зеттабайт, если оцифровка выполняется с частотой 16 кГц с разрешением 16-бит.

Только в одном Twitter формируется почти 100 млн. коротких сообщений в сутки. Специалисты из исследовательской компании IDC полагают, что до 2020, объемы информации цифровой вселенной увеличится на 35 триллионов гигабайт. В 2011 объем цифровых данных генерируемых и копируемых превысит 1.8 триллиона гигабайт – темп роста 9 раз за пять лет. Компания Google обрабатывает более одного петабайта в час.

Типовой пассажирский лайнер генерирует 20 терабайт данных на каждый из двигателей в час. За один полет из Нью-Йорка в Лос Анжелес Боинг 737 генерирует 240 терабайт данных. Если принять во внимание что в день осуществляется около 30,000 полетов (США), объемы данных быстро стремятся к петабайтам.

Мы привыкли к тому, что мы окружены материальными объектами. Но можно также сказать, что мы окружены информацией. Все объекты материального мира состоят из молекул и атомов определенного типа, имеющих определенные координаты. Сегодня мы этими данными не владеем. Тысячелетия люди жили, не имея этих данных. Может возникнуть вопрос, а так ли уж нужна нам эта информация? Предположим, что у нас появилась возможность всегда знать, каков состав воздуха, которым мы дышим. Мне возразят, что состав воздуха достаточно стабилен и эта информация избыточна и, следовательно, бесполезна. Но мы из ТВ-передач узнаем, что почти каждый месяц взрываются дома из-за утечек бытового газа, влекущих человеческие жертвы. Следовательно, знание состава воздуха, во всяком случае, для домов с газовым снабжением совсем небесполезно и может сохранить человеческие жизни. Это же можно сказать и о многих других видах информации.

История становления Интернет

Интернет является сетью виртуальных сетей. В 1990-91 годах у нас (тогда еще в СССР) о нем знали несколько десятков человек, которые только что освоили электронную почту (через RELCOM) и попробовали, что такое FidoNet. Первое сообщение по электронной почте было послано президентом США Биллом Клинтоном 2 марта 1993 года. Первая новелла Стивена Кинга была опубликована по каналам Интернет 19 сентября 1993 года (до появления печатной копии), к тому же году относится начало синхронной передачи радио-программ по сетям Интернет. В конце 1993 года заработала первая очередь оптоволоконной опорной сети Москвы, полностью профинансированная Джорджем Соросом. В 1994 году НАТО организовало первую конференцию по Интернет в России (в Голицыно под Москвой). С помощью DFN (Deutsche Forschung Naetze), а затем Дж. Сороса и RELARN круг любителей Интернет расширился до сотен и тысяч, а после включения программ Минвуза и Министерства науки РФ счет пошел на десятки тысяч. Это произошло прежде всего потому, что созрели условия - в различных учреждениях (сначала научных, а затем коммерческих и государственных) и у частных лиц оказались сотни тысяч персональных ЭВМ. К этому же времени (1992-93 годы) в мире стала формироваться сеть депозитариев, доступных через анонимный доступ (FTP), а несколько позднее и WWW-серверов. На рис. 1.1 показан рост числа ЭВМ, подключенных к Интернет по годам с 1989 по 1998 годы. Видно, что рост числа узлов сети имеет экспоненциальный характер. Можно смело утверждать, что протоколы Интернет, созданные для осуществления связи в случае нанесения десятков ядерных ударов по США со стороны СССР, явились одним из немногих (возможно единственным) положительным результатом холодной войны.

Рис. 1.1. Рост числа ЭВМ, подключенных к Интернет в период 1989-98 годы (по вертикальной оси отложено число ЭВМ в миллионах)

Сегодня, когда Интернетом заинтересовались широкие массы трудящихся, и определенная часть их подключилась к расширению этой сети, стала актуальной проблема оптимального проектирования сетей и их подключения к общенациональной и международной сети Интернет. К концу 2005 года число узлов, подключенных к Интернет превысило миллиард. В 2011 году число машин в Интернет достигло полутора миллиардов (что составит ~22% населения Земли). Если сюда добавить iPhone и ipad, то число объектов в Интернет приблизится к 4 млрд.

Современные сети Интернет объединяют в единое целое многие десятки (а может быть уже и сотни) тысяч локальных сетей по всему миру, построенных на базе самых разных физических и логических протоколов (Ethernet, Token Ring, ISDN, X.25, Frame Relay, ATM и т.д.). Эти сети объединяются друг с другом с помощью последовательных каналов (протоколы SLIP, PPP), сетей ATM, SDH (Sonet), Fibre Channel и многих других. В самих сетях используются протоколы TCP/IP (Интернет), IPX/SPX (Novell), Appletalk, Netbios и бесконечное множество других, признанных международными, являющихся фирменными и т.д. Картина будет неполной, если не отметить многообразие сетевых программных продуктов. На следующем уровне представлены разнообразные внутренние (RIP, IGRP, OSPF) и внешние (BGP и т.д.) протоколы маршрутизации и маршрутной политики, конфигурация сети и задание огромного числа параметров, проблемы диагностики и сетевой безопасности. Немалую трудность может вызвать и выбор прикладных программных средств (Netscape, MS Internet Explorer и пр.). В последнее время сети внедряются в управление (CAN), сферу развлечений, торговлю, происходит соединение сетей Интернет и кабельного телевидения.

Что явилось причиной стремительного роста сети Интернет? Создатели базовых протоколов (TCP/IP) заложили в них несколько простых и эффективных принципов: инкапсуляцию пакетов, фрагментацию/дефрагментацию сообщений и динамическую маршрутизацию путей доставки. Именно эти идеи позволили объединить сети, базирующиеся на самых разных операционных системах (Windows, Unix, Sunos/Solaris и пр.), использующих различное оборудование (Ethernet, Token Ring, FDDI, ISDN, ATM, SDH и т.д.) и сделать сеть нечувствительной к локальным отказам аппаратуры. Огромный размер современной сети порождает ряд серьезных проблем. Любое усовершенствование протоколов должно проводиться так, чтобы это не приводило к замене оборудования или программ во всей или даже части сети. Достигается это за счет того, что при установлении связи стороны автоматически выясняют сначала, какие протоколы они поддерживают, и связь реализуется на общем для обеих сторон наиболее современном протоколе (примером может служить использование расширения протокола SMTP - MIME). В кабельном сегменте современной локальной сети можно обнаружить пакеты TCP/IP, IPX/SPX (Novell), Appletalk, которые успешно сосуществуют.

Тот факт, что полтора миллиарда людей могут использовать одни и те же прикладные программы и услуги (вспомним cloud computing), делает Интернет самым большим, уникальным рынком товаров и услуг. В 21-ом веке информация становится одним из основных и самых высокотехнологичных товаров (книги, фильмы, программы, музыкальные произведения, описания технологий, сетевые развлечения и другие сервисы). Интернет создает и новые проблемы. Так если вы покупаете коробку с ОС Windows-7, за этот товар заплачен таможенный сбор. А если вы с помощью кредитной карты оплатите этот продукт в США? и вам его пришлют через Интернет? Где здесь место для таможни? А если человек написал программу и продал ее через Интернет, а ему провели оплату на его счет в Женеве, где здесь место налоговой службы? Я не говорю об эмиссии денег через кредиты в Интернет, ограничивающей функцию центробанка. Понятно, что без международного сотрудничества эти проблемы решить нельзя.

Проектировщикам и создателям сетей приходится учитывать многие десятки факторов при выборе того или иного типа сети, сетевого оборудования, операционной системы (UNIX, MS-DOS, IRIS, Windows-NT/XP/VISTA, SOLARIS или что-то еще), программного обеспечения, внешних каналов связи (выделенный канал, коммутируемая телефонная сеть, цифровая сеть, радио или спутниковый канал) и в конце концов сервис-провайдера. За всем этим стоят как технологические проблемы, так и финансовые трудности, тяжелый выбор между дешевой и хорошей сетью.

Если вас интересуют оригинальные тексты протоколов Интернет, вы можете получить их, например, по адресу http://www.rfc-editor.org/rfc-index2.html. Эти документы можно найти и в других депозитариях. А также RFC-документы на зеркальном серевере в ИТЭФ, обновляемом раз в месяц.

Документы RFC (Request For Cmment) делятся на стандарты, проекты стандартов, временные (экспериментальные) регламентации и предложения. Чем больше номер RFC, тем более поздней дате этот документ соответствует. О статусе тех или иных RFC можно узнать из RFC-1500 и -1780 (см. также файл std-inde.txt из того же депозитария, что и rfc-index.txt). Если вы хотите найти какой-то RFC-документ, начните с просмотра индексного файла (напр. rfc-index.txt). Первый документ RFC был выпущен в 1969 году около 40 лет тому назад. Далее темп публикаций варьировался в довольно широких пределах, в 1997-99 годах наблюдается заметный всплеск активности, связанный с потребностями мультимедиа (RTP, RSVP, PIM и т.д.), безопасностью и IPv6. Вариация публикаций документов RFC по годам представлена на рис 1.2.

Рис. 1.2. Распределение публикаций документов RFC по годам с 1969 по 2010

Из этого распределения видно, что к 1979 году окончательно сформировался стек базовых протоколов и начался экстенсивный рост сети Интернет. По мере выявления недостатков протоколов и новых потребностей после 1989 года началась активная разработка новых направлений и приложений в Интернет. В журнале The Internet Protocol Journal, v18, N4, p. 25 опубликована статья редактора Heather Flanagan "The RFC Series – Beyond ASCII", где обсуждается проблема форматов для документов RFC. В начале все они были текстовыми в формате ASCII. Потом появились версии HTML и PDF. Сейчас обсуждается возможность использования кодировок UTF-8 и форматов на основе XML. Окончательное решение по этому вопросу ожидается в 2016-17 годах.

Но все по порядку. Начнем с того, как устроен Интернет. На рис. 1.3 показана общая схема, которая облегчит дальнейшее обсуждение данной проблематики (буквами R отмечены маршрутизаторы-порты локальных сетей).

Каждая из сетей, составляющих Интернет, может быть реализована на разных принципах, это может быть Ethernet (наиболее популярное оборудование), Token Ring (вторая по популярности сеть), ISDN, X.25, FDDI или ATM. Все внешние связи локальной сети осуществляются через порты-маршрутизаторы (R). Если в локальной сети использованы сети с разными протоколами на физическом уровне, они объединяются через специальные шлюзы (например, Ethernet-Fast_Ethernet, Ethernet-Arcnet, Ethernet-FDDI и т.д.). Выбор топологии связей определяется многими факторами, не последнюю роль играет надежность. Использование современных динамических внешних протоколов маршрутизации, например BGP-4, позволяет автоматически переключаться на один из альтернативных маршрутов, если основной внешний канал отказал. Поэтому для обеспечения надежности желательно иметь не менее двух внешних связей. Сеть LAN-6 (см. рис. 1.3) при выходе из строя канала R2-R6 окажется изолированной, а узел LAN-7 останется в сети Интернет даже после отказа трех внешних каналов.

Хотя Интернет был создан как альтернатива телефонной сети (из-за ее уязвимости), нельзя утверждать, что архитектуры типа телефонной сети в Интернет невозможны. Здесь следует вспомнить об технике IP-туннелей, которая все чаще используется в сетях Интернет (например, в семействе протоколов MOLS).

Широкому распространению Интернет способствует возможность интегрировать самые разные сети, при построении которых использованы разные аппаратные и программные принципы. Достигается это за счет того, что для подключения к Интернет не требуется какого-либо специального оборудования (маршрутизаторы не в счет, ведь это ЭВМ, где программа маршрутизации реализована аппаратно). Некоторые протоколы из набора TCP/IP (ARP, SNMP) стали универсальными и используются в сетях, построенных по совершенно иным принципам. Впрочем в последние годы стали появляться все чаще устройства, где программные средства TCP/IP реализуются аппаратным образом.

Рис. 1.3. Схема построения сети Интернет

В некотором смысле Интернет возник эволюционно - в начале был Bitnet, fidonet, usenet и т.д. Со временем стало ясно, что конкуренция сетей должна быть заменена их объединением, так как от этого выигрывают все и пользователи и сервис-провайдеры. Ведь объединенная сеть имеет большие информационные ресурсы, может предложить более широкий список услуг и становится по этой причине привлекательной для еще большего числа клиентов.

Технология WWW-серверов сделала Интернет важной средой для целевой рекламы, приближенной к конечному потребителю. Стремительный рост числа узлов www продемонстрирован на рис. 1.4. Здесь также наблюдается экспоненциальный рост. Число активных узлов примерно в два раза меньше числа зарегистрированных (это же мы наблюдаем в нашей локальной сети). Сам факт использования Интернет для обливания грязью кандидатов во время предвыборной компании, говорит о том, что эта технология освоена и признана эффективной нашими политиками. Наше общество с удивительным упорством сначала осваивают все негативное, оставляя, очевидно, позитивное на десерт. Компания Netcraft начала мониторинг WEB-серверов в 1995 году. Тогда было зарегистрировано 18,957 сайтов, за последующие два года (к апрелю 1997) число сайтов достигло миллиона.

Рис. 1.4. Рост числа узлов WWW в период 1994-2022 годы
(получено по подписке из announce@beta.netcraft.com)

В сентябре 2014 число -сайтов в мире достигло 1.022.954.603, впервые число WEB-сайтов в мире превысило миллиард! (в ноябре 2014 заргистрировано 947.029.805 WEB-сайтов, в декабре - 915.780.262, в феврале 2015г - 883.419.935, а в марте - 878.346.052 - падение на 5 млн. WEB-сайтов за месяц). Если раньше наблюдался стабильный рост этого числа, то в последние месяцы бывают и спады, что свидетельствует о наступлении периода стабилизации. В мае 2015 получены отклики от 857.927.160 сайтов и 5.281.889 компьютеров. 24-го февраля 2016 года это число составляет 933.892.520, в марте 2016 года число WEB-серверов достигло 1.003.887.790, а в апреле - 1.083.252.900. Начиная с 2015 года, вертикальная шкала на рисунке имеет 10 миллиардов узлов. В августе 2016 года число зарегистрированных WEB-серверов составило 1.045.534.808, а в конце июня 2017г детектировано 1.766.926.408 WEB-сайтов, в конце октября 2017г - 1.815.237.491, в феврале 2018г - 1.838.596.056, в августе 2018 - 1.661.467,123 и в октябре -1,673,535,333. Похоже, что в 2018 году произошла стабилизация численности сайтов. В январе 2019 года зарегистрировано 1.518.207.412 сайтов, что подтверждает стабилизацию (отмечается даже падение числа сайтов на 138 миллионов), несмотря на рост числа пользователей, подключенных к Интернет. В феврале 2019 г зарегистрировано 1,477,803,927 сайтов. В конце марта 2019г число WEB-сайтов составило 1.462.021.378 (продолжается постепенный спад). В середине апреля 2019г количество WEB-сайтов сократилось до 1,445,266,139. В мае 2019г зарегистрировано 1.326.664.693 WEB-сайтов (тенденция снижения числа сайтов продолжается). Число уникальных доменных имен равно 235.011.143. Большинство WEB-сайтов теперь используют технологию nginx. Во второй половине июля 2019 года зарегистрировано 1.395.897.118 WEB-сайтов. Небольшой рост, который говорит скорее о статистичекой флуктуации. В конце сентября 2019 года обнаружено 1,291,178,101 сайтов, в октябре 2019г - 1,300,884,420, в ноябре 2019г - 1,308,343,327, в декабре 2019г - 1,268,289,402, в феврале 2020 года 1,260,909,305, в апреле 2020 года составило 1,246,121,153, в конце мая 2020 года число зарегистрированных WEV-серверов составило 1,238,024,212, в конце июля - 1.234.228.567, через масяц - 24 сентября 2020 - 1,196,298,727, в ноябре 2020г - 1,229,948,224, в декабре - 1,228,111,563, в августе 2021г - 1,211,444,849, в сентябре 1.188.038.392, в октябре - 1.179.448.021, в январе 2022 года - 1,167,715,133, а в начале марта - 1,173,621,471, в начале апреля - 1,169,621,187, в июле - 1,146,976,964, в начале августа - 1,139,467,659, вначале сентября 1,135,075,578, в середине ноября - 1,135,089,912? в начале апреля 2023г - 1,116,018,952, к концу месяца - 1,115,422,029, в августе 2024 года 1,107,785,375, в сентябре 2024г - 1,119,023,272, в октябре 2024г - 1,131,068,688 - что говорит о продолжении медленного спада относительно равновесного значения в присутствии небольших флуктуаций как вниз, так и вверх. Все это вместе свидетельствует о долговременной стабизизации числа WEB-серверов, что удивительно в условиях достаточно быстрого роста общего числа объектов Интернет в мире.

Число пользователей Интернет увеличивается достаточно монотонно (см. рис. 1.4A)

Рис. 1.4A. Рост числа пользователей Интернет (Chip 02/2017, стр. 11)

Рис. 1.4Б. Рост числа пользователей Интернет в РФ

В перспективе Интернет может стать и всемирной ярмаркой товаров и услуг. Ведь клиент может не только увидеть изображение товара и ознакомиться с условиями поставки, но и в диалоговом режиме получить ответы на интересующие его вопросы, а затем одним нажатием на клавишу мышки сделать заказ на понравившийся ему товар или услугу. В принципе для этого не нужен даже номер кредитной карточки, его заменит зашифрованный соответствующим образом идентификатор пользователя (сертификат) или его IP-адрес (если он работает на своей домашней машине, а машина имеет GPS-привязку). Таким образом, можно будет заказывать билеты на самолет или в театр, планировать программу своего телевизора на неделю вперед и т. д.

Современные системы мультимедиа позволяют совместить телевизор, видеомагнитофон, факс и видеотелефон, причем это не фантазия на тему далекого будущего - это услуги доступные уже сегодня (при наличии широкополосного канала связи (64-2000 Кбит/с)). Если вы имеете доступ к Интернет, вам уже не нужно платить за международные телефонные переговоры, вы можете сделать это с помощью ip-phone, skype или другого аналогичного продукта, при условии что ваш партнер также имеет доступ к Интернет (данное требование в ближайшем будущем перестанет быть обязательным). Все более широкий круг услуг предлагает Интернет и в сфере развлечений. Здесь имеются игровые серверы, аренда обычных и сетевых компьютерных игр, различные конкурсы и соревнования.

Теперь рассмотрим, как строятся каналы связи (стрелки на рис. 1.5). В простейшем случае связь можно организовать через городскую коммутируемую телефонную сеть, для этого нужны модемы - по одному на каждой из сторон канала (Рис. 1.5a). Традиционные модемы могут обеспечить при хорошем качестве коммутируемой аналоговой телефонной сети пропускную способность до 56 Кбит/с (кабельные широкополосные модемы при длине соединения порядка 2км могут обеспечить 2 Мбит/с). Привлекательность такого решения заключается в возможности подключения к любому узлу, имеющему модемный вход. Наиболее широко указанный метод связи используется для подключения к узлам Интернет домашних ЭВМ. Недостатком такого решения является низкая надежность канала (особенно в России), малая пропускная способность и необходимость большого числа входных телефонных каналов и модемов.

Использование выделенной 2- или 4-проводной линии (рис. 1.5Б) обеспечивает большую надежность и пропускную способность (до 256 кбит/с при длинах канала < 10 км). Но и здесь на каждый вход требуется отдельный модем, да и скоростные модемы, работающие на выделенную линию, относительно дороги. Выделенные линии чаще служат для межсетевого соединения (рис. 1.5В). Функциональным аналогом выделенных линий являются оптоволоконные, спутниковые и радио-релейные каналы. Этот вариант позволяет строить сети с пропускной способностью 1-100 Мбит/с и более.

Привлекательные возможности предлагают цифровые сети ISDN. Здесь можно использовать групповые телефонные номера, когда пара модемов обслуживает 10 и более пользователей (ведь они работают, как правило, не все одновременно). Кроме того, ISDN предлагает пользователям каналы с пропускной способностью не ниже 64кбит/c, а при необходимости возможно формирование и более широкополосных каналов. ISDN позволяет делить один и тот же канал между многими пользователями для передачи данных, факсов и телефонных переговоров. ISDN органично стыкуется с внешними каналами X.25. К недостаткам системы следует отнести ограниченность ширины окна (число переданных пакетов без получения подтверждения приема), что делает неэффективным использование широкополосных и особенно спутниковых каналов. В области межсетевых связей свою нишу занимает Frame Relay. Этот протокол имеет контроль перегрузок, работающий на аппаратном уровне

Рис. 1.5. Схемы каналов, использующих городскую телефонную сеть

На рис. 1.5 показана схема построения сети с использованием исключительно соединений типа точка-точка. Это наиболее часто встречающийся, но не единственный вариант. Дорога 'от околицы до околицы' прокладывается там, где она нужна и теми, кому она нужна непосредственно, но, согласитесь, построить так магистраль Москва Санкт-Петербург нельзя. При построении крупных общенациональных и интернациональных сетей применяются сверхширокополосные каналы и схемы типа опорной сети (backbone). Узлы такой сети могут располагаться в каких-то крупных организациях или быть самостоятельными (принадлежать государственным PTT). Такие сети обычно базируются на протоколах SDH (Sonet). Информация в этих сетях передается в виде больших блоков (виртуальных контейнеров). Использование опорной сети обычно оправдано при организации интернациональных связей, но бывают и исключения. Примером такого исключения является Московская опорная сеть, построенная на основе FDDI (100Мбит/с) и объединяющая более десяти научных организаций (длина первой очереди около 30 км). Московская сеть выполнена по схеме с 'прозрачными' IP-мостами, обычно же более мощные опорные сети маршрутизируемы, то есть блоки данных адресуются конкретным узлам, где они разбираются и сортируются. Контейнер может содержать сообщения, адресованные разным получателям, что несколько противоречит идеологии протоколов TCP/IP. IP-пакеты могут вкладываться в эти контейнеры и транспортироваться до заданного узла опорной сети. Классическим примером опорной сети является E-bone (Европейская опорная сеть). Эта сеть объединяет 27 стран (России в этом списке нет) и более 60 сервис-провайдеров, пропускная способность для различных участков лежит в пределах 2-34Мбит/с. Опорная сеть подобна международной автомагистрали, по ней добираются до ближайшего к точке назначения узла, а далее по 'проселочным' каналам до конечного адресата.

Телевидение и тенденция к интеграции услуг

Первые попытки передачи и воспроизведения изображения с помощью диска Нипкова (Германия) относятся к 1884 году. В 1907 году Б. Г. Розингом было предложено использовать для приема изображения электронно-лучевую трубку (ЭЛТ), прототип видиконов и ортиконов. Устройство отображения на принимающей стороне также предполагало применение ЭЛТ. Электронное телевидение возникло в 30-х годах двадцатого века (усилиями В. К. Зворыкина и Ф. Франсуорта). Число элементов N в одном кадре, на которое разлагается изображение в действующем в РФ стандарте (625 строк и 25 кадров/сек) определяется по формуле:

N=4/3×S2

где S – число строк, а 4/3 – отношение ширины кадра к его высоте (для широкоформатного варианта отношение будет иным). Отсюда следует, что верхняя частота видеосигнала.

F=(N×K}/2=(2×S2×K)/3=6,5МГц

где K – число кадров в сек. Здесь следует немного добавить полосы для звукового сопровождения, передачи цвета и различных служебных целей, например, для синхронизации передатчика и приемника. Именно это определяет необходимую полосу для каждого из телевизионных каналов, число которых может достигать уже сегодня 20-60, что требует полосу при традиционной схеме более 130-390 мегагерц.

Частота строчной развертки при этом составляет 625×25=15,625 КГц. Несущая частота должна быть в раз 8-10 больше 6,5 МГц, то есть превышать 48 МГц. Реально большинство каналов работают на частотах от 100 до 900 МГц. Радиоволны в этом диапазоне не способны огибать препятствия и по этой причине гарантируют надежный прием лишь при непосредственной видимости между антеннами передатчика и приемника. Кривизна земли является естественным ограничителем максимального радиуса надежного приема телевизионного сигнала. Телевидение высокого разрешения, идущее на смену традиционному, требует еще большей полосы и частот. На подходе также и стерео телевидение. Телевидения стало основой и видео-телефонии. В городах телевизионный сигнал чаще передается по оптоволоконным кабелям.

Уже более десятилетия существует система стерео телевидения с проектированием изображения непосредственно на глазное дно человека. Эта система используется в шлемах устройств виртуальной реальности.

В последние годы в качестве приемного устройства ортиконы, суперортиконы и кремниконы вытесняются приборами с зарядовой связью (ПЗС), которые не требуют высоковольтных источников питания, во много раз более компактны и существенно дешевле. В качестве приемников помимо традиционных ЭЛТ в последнее время находят широкое применение жидкокристаллические устройства отображения, плазменные панели и различные системы проекционного телевидения.

В 50-х годах прошлого века началось развитие вычислительной техники и микроэлектроники, качественно поменявших все направления телекоммуникаций. Чтобы увеличить пропускную способность канала связи можно расширять его полосу или улучшать отношение сигнала к шуму (см. выше теорему Шеннона). Первое, что приходит в голову, это увеличение амплитуды сигнала (вспомните 40-120 вольтные сигналы в первых телеграфах). Пока в электронике царили вакуумные лампы такие и даже большие амплитуды были с технической точки зрения вполне возможны, хотя вряд ли рациональны. Но после внедрения полупроводниковых приборов такие уровни сигналов стали совершенно недопустимы. Это можно понять из вольтамперной характеристики такого прибора (см. рис. 1.5a).

Рис. 1.5а. Вольтамперная характеристика n-p перехода для кремния

Большие амплитуды нежелательны, из-за пробивного напряжения (Vпр) при обратном смещении перехода. Можно конечно увеличить толщину перехода или сделать переход многослойным, но это ухудшит быстродействие прибора. Уровни сигнала выбраны по этой причине равными ~ ±2,5 В.

Сфера телекоммуникаций всегда сильно зависела от уровня развития технологий. Начиналось все с электромеханических устройств, но современное цифровое телевидение и Интернет немыслимы без использования новейших достижений микроэлектроники.

Резкое увеличение передаваемых объемов информации в локальных и региональных сетях привело к исчерпанию имеющихся ресурсов, а реальные прогнозы потребностей указывают на продолжение роста потоков в десятки и сотни раз. Единственной технологией, которая способна удовлетворить эти потребности, являются оптоволоконные сети (Ethernet, Sonet, SDH, ATM, GPON, Fiber Channel). Каналы этих сетей уже сегодня способны обеспечить пропускную способность 155-622 Мбит/с, ведутся разработки и испытания каналов с пропускной способностью в 2-20 раз больше, например, гигабитного Ethernet. Осваивается техника мультиплексирования частот в оптоволокне (WDM), что позволяет поднять его широкополосность в 32 раза и в перспективе довести быстродействие каналов до 80 Гбит/с и более. По мере роста пропускной способности возрастают проблемы управления, синхронизации и надежности. Практически все сети строятся сегодня с использованием последовательных каналов. Это связано прежде всего со стоимостью кабелей, хотя и здесь существуют исключения (например, HIPPI). Разные сетевые услуги предъявляют разные требования к широкополосности канала. На рис. 1.6 представлены частотные диапазоны для основных видов телекоммуникационных услуг. В Интернет практически все перечисленные услуги доступны уже сегодня (кроме ТВ высокого разрешения). Стремительно развиваются распределенные системы вычислений (например, проект GRID), управления и информационного обслуживания. Современная технология микропроцессоров предполагает достижение быстродействия в 5 Гбит/с к 2003-4 годам (технология с характеристическим размером объектов на кристалле 80-130 нм). В 2008 году освоена технология с разрешением 40нм, а в 2009 - 22нм.

Объем информации, хранящейся в Интернет, лавинообразно растет. Увеличение составляет примерно 30% в год (2007г) и к настоящему времени суммарный объем превысил 8 миллиардов страниц текстов и рисунков (когда вы будете читать этот текст, цифры объема устареют). Одна страница простого текста содержит примерно 3 килобайт информации. Журнал Economist (2011г) оценивает, что объем данных каждый год растет на 60%. Эта точка зрения подтверждается аналитиком компании IDC, который предсказывает, что ‘цифровая вселенная’ вырастит до 1.8 зеттабайт (1021байт) в 2011, на 47% по отношению к 2010, и превысит 7 ZB к 2015. (1 зеттабайт = 50 библиотекам конгресса США).

Сеть Интернет может рассматриваться как распределенная супер-ЭВМ с мощностью, превосходящей любую отдельную машину. Такие возможности уже использовались для рассшифровки генома человека и проверки криптографической прочности современных шифров.

Рис. 1.6. Требования к пропускной способности канала для различных видов сервиса.

Рассмотрев диаграмму, можно сделать определенные прогнозы на ближайшее будущее сетей. Через несколько лет можно ожидать слияния функций телевизора и ЭВМ, а это потребует пропускных способностей от магистральных каналов на уровне 1-100 Гбит/с. Широкополосность каналов, приходящих в каждый семейный дом составит 2-10 Мбит/с, что позволит реализовать видео-телефонию, цифровое телевидение высокого разрешения, доступ к централизованным информационным службам и многое другое. Уже существующие оптоволоконные системы обеспечивают и в 10 раз большую пропускную способность. Можно предположить и появление локальных сетей внутри жилища. Такие сети способны взять под контроль кондиционирование воздуха, безопасность дома в самом широком смысле этого слова, например, оповещение о нежелательном вторжении, пожаре или возможном землетрясении (в сейсмически опасных районах), появление вредных примесей в воздухе. Такая система разбудит хозяина в указанное время, подогреет завтрак, напомнит о предстоящих делах на день, запросит и предоставит хозяину свежий прогноз погоды и справку о состоянии дорог, своевременно сделает заказ на авиабилет и т.д. Все это технологически возможно уже сегодня, пока относительно дорого, но цены весьма быстро падают. Примером может служить сеть CAN, разработанная для сбора данных и управления автомобилем. Стремительное расширение сети Интернет не имеет аналогов в истории, так что любой самый фантастический прогноз в этой области может сбыться.

Для целей идентификации и для платежных систем внедряется технология NFC (Near Front Communication). Появились первые коммерческие квантовые компьютеры. Продолжаются попытки создания искусственного интеллекта (семантические сети и машина Watson). Мобильные устройства приближаются по мощности и функциональности к персональным машинам.

Все шире внедряются приложения, использующие большое числа портов: файлообменные сети, Skype и т.д.. В настоящее время только компания Google предлагает около 20 таких приложений. Внедряются системы управления человеческим голосом IVR (Interactive Voice Response). IVR подразумевает также применение дикторо-независимого распознавания речи. На основе таких технологий создаются специализированные call-центры, обслуживающие клиентов, включая безоператорские справочные голосовые системы.

Может возникнуть вопрос, зачем так много сетевых технологий? Почему не выбрать наилучшую сетевую технологию, наилучшую ОС и не использовать их повсеместно? Ведь такая унификация может дать существенный экономический выигрыш.

Если какой-либо упорный чиновник добьется тотальной унификации (а в России такое вполне возможно). То спустя какое-то время все сети и серверы рухнут под воздействием первого же червя или вируса. Это потребует не более получаса. Таких катастроф пока не было, так как у нас использовалось широкое многообразие ОС и приложений. Господь Бог создал нас не случайно с разными генными наборами, иначе чума или испанка могли бы покончить с человечеством.

Протоколы Интернет (TCP/IP) существуют уже более 35 лет. Требования к телекоммуникационным каналам и услугам выросли, и этот набор протоколов не удовлетворяет современным требованиям. Появляются новые протоколы Delta-t (для управления соединением), NetBLT (для передачи больших объемов данных), VMTP (для транзакций; RFC-1045) и различные обновленные версии ТСР для повышения эффективности передачи данных , блоки протоколов для работы с мультимедиа (RTP, RSVP, PIM, ST-II и пр.), MPLS, VPLS, GMPLS, но, безусловно, наиболее революционные преобразования вызовет всеобщее внедрение IPv6.

Последние события в Египте поставили на повестку дня проблемы доступности Интернет в условиях, когда правительство (как в случае Египта) или злоумышленники блокировали работу базовых маршрутизаторов, переключателей или шлюзов. Вспомним события 1991 года в России (ГКЧП). Власть перекрыла традиционные для того времени средства связи, но справиться с Интернетом не смогла. Интернет в то время базировался на модемах и выделенных линиях и отследить эту систему связи было тяжело (да и опыта еще не было), что дало возможность узнать о событиях друзьям и родственникам за рубежом. В США ставится вопрос о создании сети коммуникаций резервной по отношению к скоростному Интернет , которая может базироваться на технологии Р2Р, а также каналы Wi-Fi. Они считают, что любой избиратель должен иметь возможность довести свое мнение до своего конгресcмена, какая бы ситуация не сложилась с системой коммуникаций.

В последнее время широкое распространение получили lifejournals, блоги и социальные сети Facebook, Twitter, MySpace и LinkedIn, эти приложения формируют новую среду общения, которая начинает играть все большую роль и в формировании общественного мнения.

С 1990 года емкости жестких дисков возрасли в 10000 раз, быстродействие процессора увеличилось более чем в 250 раз, при этом стоимости этих приборов упали почти в 10 раз. Появились принципиально новые устройства CD, DVD, диски blue-ray, флэш-память, беспроводные средства межкомпьютерных связей и т.д.

В настоящее время разработаны замечательные технологии λ-коммутации пакетов, исключающие их буферизацию (схема end-to-end; смотри Оптоволоконные каналы). Но эти методы не применимы для полномасштабной маршрутизации, так как просмотр маршрутных таблиц занимает слишком много времени. Таким образом проблема реактивности (протокол ТСР) с повестки дня по-прежнему не снята, и для молодых читателей есть еще много нерешенных проблем.

Киберугрозы и кибервойны

Компьютерные программы стали не только средством, облегчающим жизнь, но и средством войны. Кибероружие разрабатывается во многих странах. К информационным войнам, которым уже более 100 лет, добавились кибервойны. В 2007 году состоялась массированная сетевая атака на Государственный департамент США, министерство экономики, обороны, энергетики, NASA и некоторые другие правительственные структуры США. Это событие некоторые американцы называют информационным Пирл-Харбором. По оценкам экспертов украденный объем данных составил терабайты (сравнимо с суммарным объемом информации в библиотеке Конгресса США). В 2010 году президент Б.Обама объявил защиту от кибероружия приоритетной государственной задачей.

“It is now clear this cyber threat is one [of] the most serious economic and national security challenges we face as a nation,” (Сейчас ясно, что киберугроза является одной из наиболее серьезных экономических и национальных вызовов, с которым столкнулись мы, как нация.) Б.Обама. См. Cyberwar: Sabotaging the System Managing Network-Centric Risks and Regulations

Представители разведки США считают, что основной угрозой для США сегодня являются кибер атаки (James Clapper, руководитель национальной безопасности администрации Обамы и Robert Mueller, директор ФБР).

Так как все большие сферы жизни человека и государства зависят от эффективной работы компьютерных сетей, именно такие объекты могут стать объектами атаки террористов. Такие атаки могут дезорганизовать работу транспорта, энергетических сетей, банковскую систему и пр. (атаки против банков в связи со скандалом с WikiLeaks на практике показали эффективность таких атак).

Одним из видов кибервойн является кибершпионаж, как экономический, так и политический. Этим делом занялись практически все развитые страны. Речь уже идет о подготовке кибервойн. Сообщений о разработках кибероружия становится все больше (см. http://www.smartplanet.com/blog/thinking-tech/report-suggests-that-us-helped-create-super-cyber-weapon/5988 - Report suggests that U.S. helped create super cyber weapon, а также http://www.reuters.com/article/2010/09/24/security-cyber-iran-idUSLDE68N1OI20100924 - UPDATE 2-Cyber attack appears to target Iran-tech firms). Эти сообщения связаны с американо-израильской разработкой нового вида кибероружия (сетевой червь Stuxnet – типичный представитель атак APT - Advanced persistent threat), поражающего контроллеры технологического оборудования, в частности суперцентрифуг для разделения изотопов урана в Иране. Сообщение New York Times официальными источниками в США не подтверждается. Иранский президент Махмуд Ахмадинежад подтвердил проблемы с технологическим оборудованием на обогатительных заводах. Разработка червя заняла около 2-х лет. Эта программа достаточно универсальна и пригодна для нарушения работы, например, энергетических предприятий. Данный программный продукт не годится для получения какой-либо материальной выгоды. Заразиться червем компьютер может при загрузке USB-памяти, при этом ни одна существующая на сегодня антивирусная защита его не обнаружит. Таким образом, промышленная инфраструктура государства может пострадать не только от бомб. Одним из наиболее распространенных видов атак, используемых в кибервойнах, являются DDoS-атаки.

По данным департамента обороны США возможны достаточно забавные атаки. Атакер изготовляет специальные USB-флэши, загружает в них специальное программное обеспечение и разбрасывает такие устройства в местах, где их могут найти сотрудники интересующих его организаций (например, на автостоянке Пентагона). Найденное устройство будет рано или поздно вставлено в компьютер дома или на службе и станет источником заражения сети, поставляя атакеру ценные сведения. Главная особенность атаки - практически полная безопасность атакера. Ведь даже если жертва отследит адрес, куда отсылаются данные, можно всегда утверждать, что организатора подставили, а доказать обратное будет проблематично.

В области технологического и государственного управления роль вычислительной техники и сетей быстро расширяется. Это открывает большие возможности для хакеров и создателей кибероружия.

Но атаковать могут не только производственные или оборонные структуры, но и, например, банковскую систему государства, дезорганизуя работу экономики.

Начало января 2012 ознаменовалось серией атак хакеров на ближнем востоке. Сначала хакер 0xOmar из ОАЭ опубликовал данные более 20000 кредитных карт израильтян. 9-го января хакеры взломали сайт зам. министра иностранных дел Израиля, обещавшего найти и наказать 0xOmar. Затем была предпринята атака на сайты авиакомпании El Al и финансовой биржи Тель-Авива. Кроме того была предпринята попытка проникнуть в базу данных одного из крупных банков Израиля. Арабские сетевые партизаны получили поддержку мусульманского проповедника Тарика Ас-Сувейдана, призвавшего начать кибер джихад против Израиля. 10-го января последовал ответ израильских хакеров. Сначала хакер под именем 0xOmer опубликовал данные сотен клиентов интернет-магазинов в Саудовской Аравии. Затем хакер с именем Ганнибал 17-го января опубликовал данные 30000 (или даже 100000) арабских пользователей социальной сети Facebook. Тогда же хакеры заявили, что им удалось нарушить работу саудовской фондовой биржи и биржи ценных бумаг Абу Даби. В армии Израиля сформирована группа в 300 хакеров. Но осознание губительности эскалации взаимных атак привело к тому, что в настоящее время они прекращены.

В условиях войны важно уметь надежно и быстро распознавать своего врага. Именно это стимулирует разработчиков кибероружия сделать его невидимым (атаки нулевого дня). В таких условиях враг становится невидимкой и по этой причине особенно опасным.

Проблема ошибок в программном обеспечении

Все мы используем огромное число программ на работе и дома. Сфера использования программ становится все шире. От программ зависит наше благосостояние (кредитные банковские карты) и даже сама жизнь (истории болезней, а на очереди проектирование лекарств, индивидуально подогнанные под генный набор пациента). Но насколько эти программы корректны? Все ли программные ошибки устранены при отладке, да и безупречен ли алгоритм программы? Если в программе имеется ошибка, она может "повиснуть", мы нажимаем кнопку Reset и теряем пару минут жизни, ожидая перезагрузки. Ну а если программная ошибка в программе расчета индивидуального лекарства или в системе реанимации...

Из практики известно, что примерно 20-100 строк кода содержат по крайней мере одну ошибку (по завершении отладки). В ядре любой операционной системы содержится 5-100 миллионов строк кода. А еще имеется оболочка и прикладные программы. Таким образом, на любой машине работает 10-200 миллионов строк кода (дистрибутив Debian содержит даже 350 миллионов строк кода). Это означает, что в программах, работающих на вашей машине, присутствует до 100000 ошибочных строк кода. Вы можете сказать, моя машина работает. Но разве вы не сталкивались с ситуациями зависания программ, из которых вы выходили перезапустив программу или перезагрузив компьютер? Большинство таких ошибок находятся на редко посещаемых ветвях программ или, например, в комментариях. Основные ошибки удалены из программ при отладке. Другие - при доводке (вспомним альфа, бета-версии программ). Число ошибок может быть минимизировано, если разработчики следуют жестким правилам, например, Правилам Хольцмана.

Но даже при самых жестких критериях число ошибок на 1000 строк кода не равно нулю. Именно по этой причине все шире используются codechecker'ы, которые ищут ошибки не синтаксиса, как это делают традиционные отладчики, а алгоритма. Но даже они не гарантируют отсутствия ошибок. Разработка программ, которые даже при наличии ошибок, гарантируют устойчивую работу или хотя бы достаточно надежный результат - дело будущего. А программные ошибки, например, в коде управления пассажирским лайнером могут иметь печальные последствия. Следует также иметь в виду, что хакеры для вторжения используют именно ошибки в кодах. Получение надежной программы сегодня результат компромиса между трудоемкостью и безопасностью.

В прессе часто проскакивают сообщения о создании искусственного интеллекта, практически с начала 21-го века ведутся исследования в сфере семантических сетей. Но реальные успехи в этой области не столь впечатляющи. Память современных ЭВМ измеряется уже терабайтами (~1013 бит). Это уже сравнимо с памятью человека. Можно ожидать в ближайшие годы дальнейшего роста объемов памяти. Прогресс очевиден. Но сравнимы ли современные машины по интеллекту с человеком? ЭВМ выигрывает в шахматы у чемпиона мира, а ведь еще 20-25 лет назад многие ученые утверждали, что машина не сможет никогда играть в шахматы даже на уровне мастера спорта... ЭВМ сегодня производит вычисления с огромной скоростью (быстрее любого человека), но умней ли она человека? Судя по всему - нет. На эту тему рекомендую прочитать книгу американского математика Р. Пенроуза "Новый ум короля", (это чудесное чтение для любого, кто увлечен наукой), где автор осторожно подводит читателя к мысли, что машина, построенная на современных принципах (модель Тюринга), решить эту задачу вообще не может. В США создана машина Watson, способная работать с текстами на естественном языке (английском, можно предположить, что она понимает контекст). Но названные трудности делают проблему создания искусственного интеллекта еще интереснее...

Возможно со временем удастся создать метаязык описания проблем, а интерпретатор будет искать и реализовать нужный алгоритм, минимизируя участие человека в процессе программирования. Ведь обучить человека не делать ошибок при программировании не реально .

Что может стать следующим этапом развития ИТ? Сказать это достаточно сложно. Возможно будут разработаны инженерные методы имплантирования знаний в мозг человека. Впрочем нужда в этом может отпасть, если людям удастся разработать компактные средства искусственного интеллекта высокой мощности.

Интернет вещей

Интернет вещей – глобально связанная система приборов, объектов и предметов, базирующаяся на технологии RFID.

Термин Интернет вещей был предложен Кевином Эштоном (Kevin Ashton) в 2009 году.

Интернет вещей предполагает формирование среды, где все объекта окружающего мира - от транспортных самолетов до авторучек имели выход в Интернет. Появляется возможность взаимодействия людей с этими предметами, а также общения этих предметов между собой.

На сегодняшнем этапе Интернет вещей предполагант следующее:

Можно себе представить ситуацию, когда дежурный инженер подходит к некоторой установке и кладет свой планшет у определенной радиометки. Планшет распознает метку, загружает нужную программу, считывает по bluetooth текущие параметры установки, сравнивает их с ожидаемыми и передает результат на центральный пульт системы. Этот планшет может быть также снабжен датчиками, например, измерения амплитуды и спектра вибраций (вспомним случай на Красноярской ГЭС).

Согласно прогнозам компании ABI Research более 30 млрд. устройств будут беспроводным способом подключены к Интернету вещей к 2020 году.

В сетевом журнале InfoWorld появилась заметка, где утверждается, что Интернет вещей еще не будет масштабно работать в 2014 году (см. "The Internet of things will not arrive in 2014", Bill Snyder, InfoWorld, December 12, 2013). Это объясняется нерешенностью проблем безопасности, питания и управления сетью. Предполагается, что Интернет вещей будет способствовать росту энергопотребления в мире. В этой среде каждый пользователь станет администратором, что не будет способствовать ее безопасности.

Окружающий мир быстро изменяется, он стал тотально связанным, см. "Realising the benefits of a totally connected world", Cliff Saran. Появляется Интернет вещей, который еще более изменит среду жизни. Контроллеры управления отоплением жилых помещений (200 фунтов стерлингов) уже поступили в продажу. Компания Ксерокс разработала систему автоматизации управления городским трафиком в Лос Анжелесе (7000 датчиков). Эта система контролирует даже занятость парковочных мест и динамически меняет расценки за парковку. Революционные преобразования ждут систему управления аэропортами и доками (Лондон). Компания Coca-Cola надеется с помощью этой технологии лучше учитывать вкусы потребителей для своих питейных автоматов.

После широкого внедрения интернета вещей радикально поменяются условия жизни. Например, дома эта система, может контролировать утечки бытового газа, детектировать задымление и вызывать пожарную службу, фиксировать несанкционированные попытки проникновения в жилище и вызывать полицию, выключать освешение в помещении, если там нет людей. Мониторировать состояние здоровья хозяев и вызывать врача, если это требуется, отслеживать поведение домашних животных и детей. Но прежде чем все это станет реальностью, нужно решить много самых разных проблем, например, обеспечение бесперебойного питания удаленных датчиков.


Previous: Предисловие Down: 1.1 Предметный указатель
    Next: 2 Преобразование, кодировка и передача информации