Современная организация информации – проблемы и решения

Количество информации, в частности медиафайлов (фото, видео, музыка), как в интернете так и на компьютерах конечных пользователей постоянно растет. В связи с этим, все более важным становится выбор правильного подхода к сортировке и упорядочению этой информации. Другими словами, возникает вопрос – как организовать кучу файлов, чтобы обеспечить быстрый и удобный поиск нужного? В этой статье мы рассмотрим проблему применительно к хранению изображений, хотя принцип современной организации идентичен для всех остальных разновидностей контента.

Количество информации, в частности медиафайлов (фото, видео, музыка), как в интернете так и на компьютерах конечных пользователей постоянно растет. В связи с этим, все более важным становится выбор правильного подхода к сортировке и упорядочению этой информации. Другими словами, возникает вопрос – как организовать кучу файлов, чтобы обеспечить быстрый и удобный поиск нужного? В этой статье мы рассмотрим проблему применительно к хранению изображений, хотя принцип современной организации идентичен для всех остальных разновидностей контента.

Существует 2 подхода к организации информации:

     
  1. Разбиение по категориям
  2.  
  3. Пометка асоциативными метками

Разбиение по категориям – исторически первый подход к организации информации – представляет собой, попросту говоря, – разложение файлов по папкам. При умеренном количестве файлов такой способ себя вполне оправдывает (и даже более эффективен).

Пометка асоциативными метками – более широкий подход – каждому файлу присваиваются ассоциируемые с ним ключевые слова. Можно даже сказать что разбиение по категориям является очень частным случаем меток. Не стоит воспринимать метки как нечто новое, «притянутое за уши» – вспомните интернет и поиск в интернете. Что вы вбиваете в поисковую строку Google? Правильно, ключевые слова, по которым будут найдены соответствующие документы. Каждой вебстранице помещаемой в интернет, вебмастер присваивает ключевые слова, наиболее полно описывающие представляемую на этой странице информацию. Эти слова помещаются в дескриптор META в заголовочной части страницы:

<META name="keywords" content="ключевое слово1, ключевое слово2">

И как показала практика, такой способ организации огромных обьемов информации является правильным. Я не пишу «единственно правильным», потому что наиболее гибкий поиск может обеспечить только комбинированный способ организации – например метки и возможность сортировки по дате, и т.п.

Кроме того, прикрепить несколько меток к файлу гораздо проще чем однозначно отнести его к какой-либо категории, потому что описать обьект легче набором ассоциаций но никак не одним словом. Например, у вас есть фотоснимок с пчелой крупным планом, в какую папку вы его положите – Насекомые, Макро или Пчелы?

Сохраните это изображение себе на компьютер. При помощи Spotlight <http://iland.kiev.ua/news/53> (Mac OS X 10.4) вы легко отыщите эту картинку по любому из прописанных в ней ключевых слов – Пчелы, Макро, Насекомые, по названию работы – Водопой, или по имени автора – Андрей Каплуненко (это все IPTC данные). Или по модели фотоаппарата: DMC-LC20 (это уже EXIF данные).

Реализация

Итак, технология использования меток (ключевых слов) уже хорошо себя зарекомендовала в интернете, самой большой свалке информации. Метки сейчас очень активно применяются для упорядочения абсолютно всего – как новостей на новостных сайтах, так и фотографий на Flickr или закладок в Del.icio.us. Без меток сейчас просто никак – получится безнадежная свалка.

Осталось только придумать как использовать этот замечательный подход к упорядочению на локальном компьютере, который также постепенно медленно но уверенно превращается в свалку. Пользователям Mac OS X 10.4 гораздо проще – еще с апреля 2005 (когда была представлена OS 10.4 Tiger) у них есть замечательная поисковая система Spotlight. Ключевая особенность Spotlight заключается в том что поиск производится по мета-данным заключенным внутри файла – «служебной информации об содержимом файла». Мета данные, например, для фотоснимка содержат такую информацию как параметры вспышки, светочуствительность, выдержка, диафрагма, ключевые слова (!) и прочее. 

Пользователям Windows нужно установить себе Vista – только в этой операционной системе обещали полную интегрированную поддержку поиска по метаданным и индексации метаданных.

Справка – типы метаданых в файлах изображений

EXIF – область дополнительной информации в которой хранятся параметры сьемки: ведущее число вспышки, баланс белого, светочуствительность, выдержка, диафрагма, фокальное расстояние обьектива, фокальное расстояние в пересчете на 35мм эквивалент, и т.д. Здесь же хранится уменьшенная копия изображения (превьюшка).

IPTC – область дополнительной информации в которой хранится информация как правило заполняемая пользователем – ключевые слова, место сьемки, описание, копирайты, благодарности, контактная информация автора. Кстати, некоторые IPTC данные могут заполняться автоматически – например место сьемки может узнаваться у системы GPS навигации и автоматически прописываться в снимок – такие схемы реально работают.

XMP – задумка компании Adobe. Расширяемый открытый стандарт по внедрению метаданных различных типов.

Но возможность поиска по метаданным сама по себе мало полезна, нужно сначала каким-то образом включить мета-информацию в файл. При сьемке изображения камера автоматически записывает EXIF информацию, а IPTC придется прописать вручную. Как? При помощи программ для работы с изображениями.

Пользователям Windows для работы с метаданными можно использовать Adobe Photoshop. Откройте фотографию в Photoshop и выберите File > File Info – откроется окно в котором можно прописать IPTC данные и просмотреть EXIF. Что делать если нужно применить одну и ту же IPTC информацию (набор ключевых слов, например) большому количеству снимков? В этом случае можно написать действие для Фотошопа которое автоматизирует такую задачу. Или воспользоваться другим софтом. Есть, например, Picasa от Google, но у меня нет возможности проверить может ли он изменять свойства снимков в пакетном режиме. Для профессионалов – iView Media Pro.

Пользователям Macintosh также много не насоветуешь. Для профессионалов есть в своем роде уникальная мощная Aperture (программа от Apple) и iView Media Pro (от iView Multimedia принадлежащей Microsoft). Кстати, не стоит забывать о Photoshop – он обеспечивает все возможности доступные Windows пользователям, плюс он может быть «заскриптован» при помощи AppleScript или Automator. Но это все профессиональный софт. Для обычных пользователей есть Preview – программа, входящая в комплект OS X. Но она не позволяет изменить мета-данные для нескольких файлов в один прием. Откройте изображение в Preview и нажмите Cmd+I:

В открывшемся окне вы можете просмотреть EXIF/IPTC данные, а также добавить ключевые слова перейдя на закладку Keywords.

Если нужно изменить IPTC информацию для большого количества изображений, очень целесообразно использовать Автоматор-действие которое так и называется: «Write IPTC Tags to JPEGs». Скачать его можно здесь: http://www.apple.com/downloads/macosx/automator/writeiptctagstojpegs.html

Действие позволяет прописать массу полезной информации включая ключевые слова, название работы, авторство, благодарности, контактную информацию:

Обратите пожалуйста внимание – некоторые программы хранят ключевые слова и прочую дополнительную информацию в своей базе данных, а не внутри файла. Так делает, например, iPhoto. Такие ключевые слова имеют смысл только при работе в данной программе и абсолютно невидимы снаружи. То есть если у вас в iPhoto снимкам присвоены какие-то ключевые слова, но эти слова не встроены непосредственно в файл, то Spotlight-поиск по таким словам не даст результатов. Помните об этом и следите за тем куда встраиваете ключевые слова, тогда найти что-либо будет очень очень просто. А Spotlight поможет в поиске. Надеюсь я убедил вас в важности использования меток для организации постоянно растущих обьемов информации?

 


Spotlight, Tiger

Январь 21, 2007 | Андрей Каплуненко | | комментировать


  1. Leon TrautLeon Traut

    На самом деле почти все нормальные вьюеры под windows работают с Exif или IPTC или одновременно. По роду деятельности я часто оформляю и класифицирую фотографии. К сожалению, идеальной программы в этом смысле пока нет

Добавить комментарий


Чтобы не вводить постоянно эти символы, зарегистрируйтесь


Запомнить введенные данные
Оповещать о новых сообщениях?

Рассылка iLand

Люди говорят

  • Дмитрий Наша компания тоже перестала пользоваться Новой Почтой после того, как они потеряли 10 из 30 посылок на одну из сетей АЗС. Возместили только минимальную страховку, а о том что мы получили штрафы за недопоставки они даже и говорить отказались. Сейчас пользуемся… далее
    Ср, Сен. 08, 2010 - 11:52:28
  • Александр Русанов По предварительной информации через месяц. Следите за сайтом. Будем обязательно оповещать. далее
    Ср, Сен. 08, 2010 - 11:22:44
  • serg когда появится в продаже? далее
    Вт, Сен. 07, 2010 - 11:43:24
  • Александр Русанов Предзаказы уже принимаем. Милости просим;) далее
    Пн, Сен. 06, 2010 - 2:21:07
  • студент вот именно! я и не знал что у студентов сток в кармане есть)))))) далее
    Вс, Сен. 05, 2010 - 8:23:21