Документация Oracle на русском языке





Сайт посвящен разработке информационных систем с использованием технологий Oracle. На сайте можно найти полезную литературу и документацию на русском языке по программированию и администрированию Oracle.Программирование баз данных на Oracle, техническая документация, литература, статьи и публикации.

Главная :: Карта


Oracle Database или Oracle RDBMS — объектно-реляционная система управления базами данных компании Oracle.



 

DeepEdit!

Программирование баз данных на Oracle, техническая документация, литература, статьи и публикации

  • Увеличить размер шрифта
  • Размер шрифта по умолчанию
  • Уменьшить размер шрифта

Технологии IBM для управления неструктурированными данными


М Ривкин   IBM


       Введение

       Все данные с которыми работают наши информационные системы можно разделить на две группы: структурированные данные и неструктурированные данные. Структурированные данные – это числа, строки символов, дата. Для работы с ними имеется множество программных пакетов. В частности все СУБД ориентированы на работу со структурированными данными.
       А вот все остальные типы данных не имеют четкой структуры и называются неструктурированными (иногда их еще называют мультимедиа или контент). Примерами неструктурированных данных являются: книги, фильмы, печатные документы, электронные документы, файлы, письма (простые и электронные), презентации, электронные таблицы, изображения, рентгеновские снимки, отпечатки пальцев, фотографии, музыкальные клипы, новости, контракты, видео ролики, информация с камер наблюдения и т д  и т п.
       Неструктурированные данные нам всем хорошо знакомы, мы с ними работаем ежедневно и их объемы огромны. Причем лавина документов, фильмов, рисунков и т д нарастает ежедневно. И вручную работать с этими объемами становится невозможно. Человечество скоро захлебнется в этих объемах. Кроме того, бумажные или видео архивы занимают огромное пространство в организациях. И найти нужный документ часто становится невозможно.
       Мечты человечества о безбумажной информатике (их у нас широко пропагандировал еще академик Глушков), только отчасти могут решить эту проблему. Они до сих пор не реализованы полностью, но даже оцифровка всей неструктурированных данных – это еще не выход. Надо эффективно хранить эти терабайты данных, обеспечить безопасность, надежность, быстрый поиск и доступ и т д.
       Поэтому для работы с неструктурированными данными организации появился новый класс информационных систем, называемый ECM – Enterprise Content Management (система управления неструктурированными данными предприятия). Следует здесь обратить внимание на слово Enterprise (предприятие). Поскольку системы класса ECM предназначены не только для решения одной локальной задачи работы с документами, не только для небольших объемов информации, но могут быть платформой для автоматизации всех задач обработки контента в рамках и мелких и огромных территориально распределенных организаций.
       Неструктурированная информация есть у всех и поэтому объем продаж систем класса ECM непрерывно растет. В 2003 г он составил 1,6 биллиона долларов, к 2006 г планируется его удвоение до 3,3 биллионов долларов.
       Кроме роста объема неструктурированной информации рост потребности в ECM системах стимулируется реалиями и новыми требованиями бизнеса. Все более важно обеспечить долговременное хранение и своевременное предоставление корпоративной отчетности, увеличивается ответственность за преждевременное уничтожение или потерю документов. Появились строгие регламенты, управляющие сроками хранения документов. Широко развиваются портальные технологии, которые основаны на работе с контентом. Быстрота поиска и предоставления нужных документов определяет конкурентные преимущества организации, от нее зависит качество обслуживания клиентов. Игроков на рынке серьезных ECM систем не так уж много. Основными на сегодня являются IBM (Content Manager), FileNet, EMC(Documentum).
       Компания IBM со своим продуктом Content Manager (CM) является сегодня лидером рынка и ее доля быстро растет. Так по самым свежим данным Гартнер Групп (июнь 2004 г) картина выглядит следующим образом:




Рис 1.  Продажи CM и DM ПО в 2003 г



Т. е. IBM лидирует с большим отрывом и отрыв продолжает увеличиваться.  Кстати, эта картинка для мирового ECM рынка, а в России половина из этих компаний не представлена. Существует множество обзоров независимых аналитиков, таких как Gartner, Forst&Sullivan, GIGA Information и т д за 2003 г, где признается, что компания IBM является сегодня бесспорным лидером в области ECM. Подтверждением этого являются и сотни информационных систем, работающих на основе IBM Content Manager. Еще одним доказательством этого является всем известный гартнеровский квадрант за 2003 г (рис. 2).


Когда нужна система класса ECM?

       Обычно в России когда говорят о системе для работы с неструктурированной информацией в первую очередь подразумевают систему документооборота. Действительно, на основе Content Manager можно построить такую систему. Однако сейчас на рынке есть огромное число самых разных готовых, коробочных систем документооборота. И наверное для решения этой частной задачи можно просто купить и внедрить такую готовую систему. А вот если в организации необходимо создать несколько систем для работы с неструктурированной информацией, например, нужна система документооборота, электронная библиотека, архив документов, порталы, работающие с контентом, система долгосрочного хранения  контента электронной почты и документов пакетных приложений (SAP, Sibel), система видео по требованию, система совместной работы с документами и т д, то более разумно не внедрять множество разнородных несвязанных систем, а построить их все на единой платформе управления неструктурированной информацией. Т е если две и более задач из этого списка для Вас актуальны, то следует задуматься об использовании Content Manager. Кстати, для отдельной задачи создания большого электронного архива документов или фильмов, Content Manager тоже незаменим. 

Рис 2. Гартнеровский квадрант за 2003 г в области ECM



       Почему же нужна такая единая платформа для работы с неструктурированной информацией? Наиболее просто это можно объяснить на примере истории становления коммерческих СУБД. Когда-то на заре программирования каждый программист создавал свою собственную информационную систему (кадры, зарплата и т д) с нуля. Придумывал структуру файлов, пытался встроить средства обеспечения мультидоступа и защиты данных, оптимизировал работу системы и т д. Каждый программист делал это заново, по-своему и конечно качество реализации было невысоким. Затем люди поняли, что любая информационно управляющая система должна иметь стандартные функции для работы с данными, обеспечивать масштабируемость, гибкость, защиту данных, производительность, мультидоступ и т д. И были разработаны коммерческие СУБД, которые и реализуют этот функционал. Наврядли кто-то сегодня начнет писать информационно управляющую систему с нуля. Берется коммерческая СУБД, такая как Oracle, DB2, MS SQL Server и уже на ее базе создается конкретная информационно управляющая система. Такой подход обеспечивает высокое качество системы и сокращение сроков разработки.
       В области систем для работы с неструктурированной информацией мы сейчас проходим тот же путь, т е пытаемся от множества доморощенных разнородных систем перейти к единой коммерческой платформе для работы с неструктурированной информацией. 
       Для решения каких же задач пригодится IBM Content Manager? Вот несколько типичных примеров, когда его использование может снять проблемы и увеличить доходы предприятия.

       Пример 1.  Центр обработки телефонных звонков заказчиков. Звонит заказчик, пытаясь получить ответы на свои вопросы и купить продукт или сервис. Для ответа на вопрос надо найти необходимые документы, которых под рукой нет. Оператор просит перезвонить через пол часа, т к ему нужно время, чтобы найти необходимые документы. В большинстве случаев заказчик больше не перезванивает, клиент потерян, убытки налицо.
       Пример 2.  Коллектив авторов составлял сложный документ, готовил несколько версий различных частей документа. Наконец работа закончена, документ передан начальству. Один из авторов уехал, уволился, заболел и т д., и вдруг, неожиданно, понадобилась предыдущая редакция документа. Наврядли без Content manager ее удастся восстановить.
       Пример 3. Всем известный скандал с американской компанией Enron. Документы, для которых по закону был установлен срок хранения несколько лет, были случайно или намеренно уничтожены. В результате руководство компании попало под суд. Если бы использовался IBM Content manager с системой обеспечения регламентов хранения/уничтожения документов, то этого бы не произошло.
       Пример 4.  Все мы работаем с электронной почтой (Lotus Notes, MS Exchange). Во-первых наши почтовые ящики постоянно переполняются и их надо чистить, из-за этого система часто недоступна. При большом объеме писем она работает медленно.
       Во-вторых у нас почему-то считается, что корпоративная почта – это собственность и личное дело владельца почтового ящика. А в переписке содержится много полезной для разных сотрудников информации, которая может пригодиться в будущем. Поэтому во многих западных компаниях  электронная почта – это корпоративное имущество, т е либо вся почта, либо ее часть автоматически помещается на хранение в IBM Content manager и в будущем при поиске информации на некоторую тему будут найдены и документы и письма и, возможно, результаты чатов и т д. Кстати, можно помещать письма в IBM Content manager не автоматически, а по воле владельца почтового ящика. При этом письмо остается доступным, а проблема переполнения ящиков снимается.
       Пример 5. В организации создается несколько порталов, например внутренний, внешний, тематический и т д. Часть информации они разделяют. Если нет единой системы управления контентом, то у каждого портала будет свое хранилище контента и мы столкнемся с дублированием информации, несогласованностью информации в разных порталах, несвоевременной корректировкой информации в одном из порталов и т д. IBM Content manager позволяет снять эту проблему.

       Список этих проблем можно продолжать и продолжать, но если хотя бы одна из перечисленных ситуаций для Вас актуальна, то IBM Content manager Вам необходим.


IBM Content Manager

Теперь поговорим подробнее о продукте  Content manager, предлагаемом компанией IBM. Он выполняет три основные функции для работы с неструктурированными данными (контентом): ввод или захват данных, хранение данных, поиск и предоставление неструктурированных данных. С какими же данными умеет работать IBM Content manager?
Во-первых это типичные документы и файлы, используемые для совместной работы: документы MS Office (Word, Excel, PowerPoint и т д), текстовые файлы, подготовленные в любых текстовых редакторах, письма и прикрепления Lotus Notes и MS Exchange, переговоры в Instant Messaging системах (например, Lotus SameTime) и другие файлы.
Во-вторых можно захватывать и загружать изображения различных форматов (фотографии, картинки, рентгеновские снимки и т д), аудио и видео информацию. С аудио/видео информацией можно работать как с файлами, а можно как с потоком, т е брать ее прямо с устройств ввода, например видеокамер, и потоком грузить в IBM Content manager. 
В-третьих это так называемые computer outputs, т е стандартные документы, выводимые в большом количестве  на печать, например чеки, накладные, счета, отчеты и т д. IBM Content manager умеет их перехватывать в огромном количестве и эффективно хранить.
И, наконец, все что связано с Интернет/интранет – вэб контент, странички, все что мы получаем через порталы и вэб сайты.
Далее для простоты все эти виды неструктурированной информации будем называть документами.
Прежде чем вводить эту информацию в IBM Content manager, надо спроектировать типы документов. В типе документа описывается сам документ (он может быть и составным) и его атрибуты, которые используются при поиске. Структура атрибутов может быть достаточно сложной, можно создавать групповые атрибуты, задавать отношение атрибутов типа один ко многим, задавать атрибуты со многими значениями и т д. Проектирование типа документа осуществляется с использованием графического рабочего места администратора и не представляет большого труда.
Ввод/захват документов зависит от их типа, операционной системы, формата файлов. Так файлы MS Office можно сохранить в IBM Content manager не выходя из приложения. После создания/редактирования документов Вы входите в меню File/Save As и система спрашивает Вас, куда Вы хотите сохранить  документ – в файл операционной системы или в Content manager. Все приложения, поддерживающие протоколы ODMA, OLE могут сохранять документы в IBM Content manager.
Если Вы сканируете изображения или документы, то IBM Content manager умеет работать практически со всеми промышленными сканерами. В состав IBM Content manager входит множество драйверов для различных сканеров. Можно выполнять индивидуальное и потоковое сканирование, подключать программы распознавания текстов (OCR), извлекать из текста атрибуты.
Видео и аудио информация, как уже говорилось выше, может загружаться не только из файлов, но и в потоковом режиме.
Компьютерные распечатки, факсовые сообщения, почта, документы SAP, журналы Instant Messaging систем могут перехватываться и загружаться в IBM Content manager. Отдельные письма или прикрепления пользователь почты может помещать в IBM Content manager нажатием кнопки в панели инструментов почты. Ну и конечно любые файлы могут загружаться через Windows или Web интерфейс, при этом атрибуты можно задавать вручную.
IBM Content manager хорошо интегрирован с высокопроизводительными системами сканирования (например, Kofax Ascent, Captive InputAccel). Так, используя Kofax Вы можете на отсканированном изображении типового документа выделить отдельные поля и поставить их в соответствие с атрибутами документа. После этого при сканировании документов система сама определит тип документа, автоматически выберет, преобразует и сформирует значения атрибутов, распознает текст для текстовых документов и загрузит все это в IBM Content manager. Загружаться может как изображение документа, так и распознанный текст и pdf формат. Естественно поддерживается работа с русскоязычными документами.
При вводе распознанных текстов они индексируются средствами IBM Content manager, поэтому поиск можно осуществлять не только по значениям атрибутов. Но и по содержанию документа.
Кроме эффективного хранения введенных документов, IBM Content manager обеспечивает поддержку check in/check out (т е если кто-то запросил документ для изменений, остальные пользователи смогут его только читать). Поддерживается контроль версий документов и их частей. Т е если Вы хотите хранить пять версий документа, то только при вводе шестой модификации система удалит первую версию. И Вы всегда можете запросить любую из этих пяти версий. IBM Content manager обеспечивает аудит действий, выполняемых с документом и возможность репликации данных в другие CM.
Очень важной особенностью IBM Content manager является встроенная поддержка системы иерархического хранения на основе Tivoli Storage Manager (TSM). Дело в том, что неструктурированных данных всегда очень много, особенно если это видео, аудио, изображения или архив большой организации. Это гигабайты и терабайты информации. Как правило, ни при создании СУБД, ни при создании систем для работы с неструктурированными данными никто не задумывается о том, как хранить эти данные и сколько это будет стоить. Просто создаются файлы на дисках и в них хранятся данные. А вопрос использования устройств хранения остается за бортом.  Встроенная в IBM Content manager система иерархического хранения позволяет решить эту задачу в рамках системы  Content manager. 
Допустим  Вы хотите, чтобы введенные в IBM Content manager документы вначале были легко доступны и хранились на дорогих быстрых дисковых устройствах. Через некоторое время, когда эти данные нужны не так часто, или когда частота их использования падает ниже установленного значения, Вы хотите, чтобы эти документы автоматически переместились на более дешевые устройства хранения. Позднее они передвинуться на дешевые ленточные устройства и т д. Т. е. документы будут доступны всегда, но время доступа для старых или редко используемых документов увеличится.  За счет этого можно использовать более дешевые устройства хранения, что при больших объемах данных немаловажно. Перемещение документов производится автоматически в соответствии с политиками хранения, заданными в IBM Content manager, при этом  Content manager сам взаимодействует с TSM для реализации этих политик.
В состав IBM Content manager входит очень большое число драйверов к самым разным устройствам хранения (дисковым, ленточным, CD и т д). Поэтому можно гибко подбирать устройства хранения данных.
В IBM Content manager реализован механизм WorkFlow (поток документов). Проектировщик системы может описать путь движения документа и IBM Content manager будет реализовывать это движение. Например, отсканированный документ сначала поступает на узел проверки качества сканирования. Если качество плохое, он уходит на повторное сканирование. Если же образ хороший, то он идет на утверждение, затем публикуется и т д. Это очень удобно, например,  для создания систем документооборота. Каждый пользователь системы, входя со своим именем и паролем, видит документы, которые он должен обработать, и после обработки отправить их дальше по одному из доступных в этой точке путей. Можно задать точки сбора информации, например пока сюда не попадет один документ типа А и три документа типа Б эта пачка дальше не пойдет.
В IBM Content manager встроено целых два механизма реализации WorkFlow – простой и сложный. В простом Вы легко описываете WorkFlow в виде таблички переходов (куда из данного узла могут идти документы и по каким условиям). Для более сложного WorkFlow можно использовать MQ WorkFlow. В этом случае Вы используете графический интерфейс для проектирования потоков, описываете точки принятия решения, точки сбора, подпотоки. Можно использовать С++ и Java API для работы с WorkFlow.
В последнее время на первый план выходит проблема хранения и уничтожения документов в соответствии с заданными регламентами. Одни документы должны храниться вечно, другие 10 лет, третьи устаревают и уничтожаются каждый год. Появилась даже целая наука ILM – Information Lifecycle Management, описывающая правила построения таких систем. IBM Content manager и его компонента Records Manager позволяют реализовать поддержку жизненного цикла информации. Вы можете разделить документы на классы и для каждого класса описать политику хранения и уничтожения. После этого IBM Content manager будет ее реализовывать и не позволит удалять документы с неистекшим  сроком хранения, и наоборот, устаревшие документы будет предложено удалить, чтобы освободить пространство хранения. Однако решение об уничтожении документов в любом случае должен принимать человек.
Документы нужно защитить от несанкционированного доступа. В IBM Content manager предусмотрен целый комплекс мер для этого. Во-первых каждый пользователь должен указать имя и пароль для входа в систему. Во-вторых права доступа и возможность выполнения операций с документами регламентируются листами прав доступа  ACL (Access Control Lists). Они могут задаваться и для пользователей и для типов документов и даже для отдельных узлов WorkFlow. В конечном счете действует суперпозиция этих  ACL и каждый пользователь с конкретным документом может сделать только то, что ему позволено в данном узле потока. 
Все документы в системе передаются только по защищенному протоколу HTTPS. Если в результате поиска Вы получили ссылку на найденный документ, то она будет одноразовой, т к содержит специальный жетон, действительный втечение короткого времени. Так что передача или перехват ссылки не позволит другим пользователям получить доступ к документу.
В поставку IBM Content manager входят три типа клиентских мест (клиентов) – толстый, тонкий, портлеты. Толстый клиент – это Windows клиент, тонкий клиент – это Java программа, выполняемая сервером приложений Content manager, с которой Вы можете работать через вэб броузер. И толстый и тонкий клиенты реализуют большую часть функций IBM Content manager, но имеют стандартный интерфейс. Используя код тонкого клиента как образец, разработчики могут модифицировать его, чтобы получить красивые интерфейсы, соответствующие стандартам  своего предприятия. Можно использовать для построения клиентских рабочих мест OLE совместимые инструменты.
Ну и конечно богатый API для С++, Java и Web сервисов позволяет писать любые программы, работающие с IBM Content manager. В системе есть точки подключения дополнительной обработки (User Exits), используя их можно расширять функциональность IBM Content manager.  А портлеты позволяют вставить окна для работы с IBM Content manager в Ваш портал.


Архитектура  Content Manager


Одной из основных задач IBM Content manager является обеспечение высокой масштабируемости при работе с большими объемами данных, возможность работы с неструктурированными данными множества пользователей через различные интерфейсы, включая тонкого вэб клиента. Система должна хранить очень большие объемы информации в удобном для архивирования/восстановления и администрирования виде и должна обеспечить быстрый защищенный доступ к данным.
Для обеспечения всех этих требований была разработана специальная архитектура на основе продуктов компании IBM. Как видно из рисунка 3, IBM Content manager состоит из двух основных компонент: библиотечного сервера и менеджера ресурсов. Они могут размещаться на одном компьютере или на разных компьютерах. Все метаданные о созданных типах документов, папках, связях и т д хранятся в библиотечном сервере. Там же хранятся значения атрибутов документов и индексы для полнотекстового поиска. 



Рис 3. Архитектура IBM Content manager


Практически библиотечный сервер - это СУБД DB2 с набором дополнительных хранимых процедур. Все запросы на поиск документов преобразуются в SQL операторы и выполняются на библиотечном сервере.
Менеджер ресурсов служит для хранения тел введенных документов. В его состав входит сервер приложений WebSphere Application Server, Tivoli Storage Manager, HTTP сервер. Документы могут храниться как в файловой системе, так и в СУБД. Компонента Video Charger, входящая в состав менеджера ресурсов, позволяет работать с потоковыми данными (аудио и видео). При поиске документов IBM Content manager работает следующим образом: после ввода критериев поиска на клиенте (тонкий, Windows, пользовательский) формируется SQL запрос к библиотечному серверу. Результаты поиска оформляются в виде списка ссылок на найденные документы, который возвращается клиенту. После того, как пользователь щелкнул на ссылку требуемого документа, этот документ по защищенному протоколу HTTPS передается клиенту с менеджера ресурсов. Библиотечный сервер в этом уже не участвует. 
Полученный документ может открываться на клиенте в своем “родном” приложении, например MS Word, или в собственном редакторе IBM Content manager, поддерживающем множество типов документов. Использование встроенного редактора удобно, если Вы не хотите дать возможность пользователю скопировать на свой компьютер или изменить документ. Во встроенном редакторе можно добавить замечания к документу, пометить его части, поставить “печать” на документ. 
Если Вы работаете с аудио или видео информацией, то найденные документы (ролики) можно выводить в режиме Streaming (как видеомагнитофон – прокрутил, остановил, запустил и т д) и в режиме Multicasting (поток идет непрерывно на несколько мониторов). Это, например, удобно для просмотра учебного фильма в классе. Поддерживается множество различных форматов  MPEG1, MPEG2, MPEG4 и MP3 для аудио.
IBM Content manager позволяет иметь несколько менеджеров ресурсов, причем они могут располагаться на компьютерах с разными операционными системами. Данные, запрашиваемые с менеджера ресурсов, кэшируются, поэтому повторные обращения к этим данным выполняются быстрее. Можно настроить систему так, что при сбое одного менеджера ресурсов она автоматически обратится к его копии, обеспечивая повышенную надежность работы.
Сегодня IBM Content manager работает на следующих платформах:  AIX, Sun Solaris, Windows, Linux, OS/400, OS/390.  Существует Express версия  Content manager, когда все его компоненты устанавливаются на один не очень мощный Intel компьютер с помощью упрощенного процесса инстолляции.
IBM Content manager является ядром системы для работы с неструктурированными данными. При необходимости к нему можно докупить ряд опций, расширяющих его функции. Уже упоминался компонент Records Manager, обеспечивающий соблюдение сроков  хранения документов. Перехват стандартных документов (чеков, накладных, счетов и т д) осуществляется с помощью компонента Content Manager On Demand. Кстати в проекте американской компании ViewPointe он позволяет перехватывать и эффективно хранить долгое время до 80 миллионов чеков в день. Несмотря на такие большие объемы, любой чек через несколько лет может быть быстро восстановлен.
Для работы со сложными составными документами, извещения пользователей по почте или Instant Messaging, работы с чертежами используется компонент DB2 Document Manager. Он, в частности, поддерживает документы в формате AutoCAD, MicroStation, AutoVue, Myriad. Компонент CommonStore  существует в трех видах – для Lotus Domino, для MS Exchange, для  SAP. Он позволяет автоматически (в соответствии с указанной политикой) или вручную (нажатием кнопки) помещать письма, прикрепления, документы SAP на хранение в IBM Content manager. После этого они доступны для поиска, а размер письма в почтовом ящике (документа в SAP) значительно уменьшается. Открыв письмо пользователь видит на месте текста или на месте прикрепления ссылочку, нажав на которую он открывает текст или прикрепление. При архивировании писем атрибуты документа могут браться из полей заголовка письма (от кого, кому, тема и т д). Можно настроить систему так, что в IBM Content manager будут уходить только старые письма, письма от конкретных адресатов и т д. Использование CommonStore не только превращает письма в корпоративное имущество, но и упрощает администрирование архива, повышает надежность системы и ее быстродействие.
Компонент Lotus WorkPlace Web Content Manager позволяет быстро и легко (без помощи вэб мастера) разрабатывать вэб страницы для отображения контента, описывать Workflow для создания и публикации этого контента. Все эти компоненты приведены в таблице на рисунке 4.




Компонент
Назначение
Content Manager (+VideoCharger)
Управление документами, изображениями, видео и аудио 
DB2 Document Manager
Управление составными документами для Content Manager и  Domino Document Manager
Content Manager OnDemand
Автоматический захват компьютерных документов (computer output)
CommonStore for Lotus Domino / Exchange, SAP
Архивирование почты Lotus Notes, MS Exchange, и SAP R/3 данных и документов
Records Manager
Управление сроком хранения записей, документов, почтыl
Lotus Workplace Web Content Management
Простое создание и поддержание Web сайтов


Рис 4.  Content manager и дополнительные компоненты


Примеры внедрения

       На основе IBM Content manager реализованы и успешно функционируют сотни проектов.  Он применяется в самых разных областях промышленности – государственном секторе, финансовых учреждениях, издательской деятельности, индустрии развлечений, пищевой промышленности, транспорте и т д, и т п. Особенно много в последнее время было внедрений в области обеспечения безопасности (работа с отпечатками пальцев, сбор информации с камер наблюдения, системы слежения на транспорте и т д). Коротко опишем несколько систем на основе IBM Content manager в различных областях промышленности.
       1. Королевская библиотека Нидерландов (Koninklijke Bibliotheck). 
       В Нидерландах очень трепетно относятся ко всему, что издается в стране. Это национальное достояние и оно должно храниться надежно и быть доступно населению. Поэтому было принято решение собрать все публикации (бумажные и электронные) и хранить их не менее 100  лет. Был создан электронный архив на основе IBM Content manager, в который помещены и продолжают добавляться все публикации (книги, газеты, журналы, научные статьи и т д).  Они поступают как в бумажном виде, так и на CD, дискетах, магнитооптике и т д. и загружаются в архив. К публикациям реализован простой и быстрый доступ. Сейчас в архиве хранятся миллионы документов, экономия, за счет исключения ручной каталогизации  и уменьшения затрат при хранении, составляет 5 млн долларов  в год. 
Аналогичный проект в Египте ориентирован на хранение отсканированных изображений древних манускриптов. В этом проекте каждое изображение хранится в трех экземплярах – большие документы высокого разрешения, документы среднего разрешения для повседневной работы, небольшие документы низкого разрешения для рассылки по почте и работы с медленными каналами связи.


       2. Архив университета Индианы
       Здесь стояла немного другая задача. Нужно было поострить сложный мультимедиа архив для хранения тысяч звуковых записей, фотографий, образов печатных документов и других изображений. Причем надо было обеспечить быстрый доступ к этой информации как сотрудников университета, так и более 100 тысяч студентов. Доступ должен был выполняться из различных мест, расположенных как в университетском городке, так и вне его. Проект был успешно выполнен на основе IBM Content manager и Video Charger на машинах IBM pSeries. Это обеспечило доступ большого числа людей к высококачественному контенту.
       Кстати, в России мы часто сталкиваемся с ситуацией, когда в огромных хранилищах на стеллажах имеется очень большое количество данных, очень важных для многих заказчиков. Но сложность поиска и предоставления этих данных делает их недоступными для потребителей. Т е они одновременно и есть и недоступны. IBM Content manager позволяет решить эту проблему. 
       3. Проект Государственный Эрмитаж.
       Это наверное наиболее известный российский проект на основе IBM Content manager. Он разрабатывался с помощью специалистов компании IBM и сегодня сотрудники Эрмитажа пополняют архив изображений и описаний экспонатов. Проект очень красивый, посетители сайта могут гулять по залам и знакомиться с экспонатами, смотреть планы этажей и т д. Посетите сайт www.hermitage.ru  -> цифровая коллекция и убедитесь сами.
       4. Телевизионная корпорация ABC (Australian Broadcasting Corp)
       IBM Content manager часто используется различными телевизионными корпорациями для создания архивов накопленных за много лет видео и аудио записей.  CNN, ABC, Шведская SVT и другие компании оцифровали свой контент и хранят его в IBM Content manager. Это позволило как избавиться от стеллажей с лентами в офисе, так и обеспечить быстрый поиск нужных видео/аудио фрагментов. Так корпорация ABC 50 лет архивировала свои теле и радио передачи и накопила более 150000 часов вещания. Это примерно 3,75 Pb высококачественной информации. Объемы немалые. Помещение всей этой информации в IBM Content manager позволила не только ускорить поиск, но и удешевить хранение, обеспечить автоматическое обновление информации при появлении новых стандартов хранения, улучшить качество составления сетки вещания. Кроме того, появилась новая возможность – продавать программы online через Интернет.
       5. Компания Coca-Cola
         Всем известная компания Coca-Cola имеет офисы в более чем 200 странах. Она много внимания уделяет маркетингу своей продукции. Над маркетинговыми материалами трудятся люди из многих стран, накоплены бесценные  наработки более чем за 100 лет. Чтобы обеспечить сотрудникам, разбросанным по всему миру, быстрый и легкий доступ к корпоративным маркетинговым материалам, Coca-Cola создала хранилище документов, изображений, видео и т д на основе IBM Content manager. Это позволило ускорить подготовку и реализацию новых маркетинговых материалов и программ, обеспечило эффективный и простой доступ ко всему архиву данных из любой точки мира, повысило эффективность операций.
       6. National Geographic Society
       Многие из вас знакомы с сайтом и журналами Национального географического Общества . Общество накопило огромный массив прекраснейших фотографий о природе. Эти фотографии используются рекламными агенствами, отделами маркетинга, издательствами и т д. Благодаря помещению этого массива фотографий в цифровой архив, сегодня выбрать и купить эти фотографии можно быстро и просто через Интернет. Более 6000 пользователей со всего мира посещают этот архив каждый год. И каждый год архив пополняется 5000 новых фотографий высокого разрешения. Посетит сайт www.nationalgeographic.com и убедитесь сами.

Этот список систем, созданных на основе IBM Content manager можно продолжать долго и он пополняется каждый год. Но даже из 6 приведенных примеров видно с какой разнородной неструктурированной информацией работает IBM Content manager, какую экономическую выгоду дает его использование, какие огромные объемы информации можно хранить и обрабатывать, и главное, что система действительно давно и широко используется в различных отраслях промышленности.








 


Батуты - купить батуты Berg, интернет-магазин . сумки DUE TENTAZIONE
jAntivirus