Количество информации, в частности медиафайлов (фото, видео, музыка), как в интернете так и на компьютерах конечных пользователей постоянно растет. В связи с этим, все более важным становится выбор правильного подхода к сортировке и упорядочению этой информации. Другими словами, возникает вопрос – как организовать кучу файлов, чтобы обеспечить быстрый и удобный поиск нужного? В этой статье мы рассмотрим проблему применительно к хранению изображений, хотя принцип современной организации идентичен для всех остальных разновидностей контента.

 

Количество информации, в частности медиафайлов (фото, видео, музыка), как в интернете так и на компьютерах конечных пользователей постоянно растет. В связи с этим, все более важным становится выбор правильного подхода к сортировке и упорядочению этой информации. Другими словами, возникает вопрос – как организовать кучу файлов, чтобы обеспечить быстрый и удобный поиск нужного? В этой статье мы рассмотрим проблему применительно к хранению изображений, хотя принцип современной организации идентичен для всех остальных разновидностей контента.

Существует 2 подхода к организации информации:

  1. Разбиение по категориям
  2. Пометка асоциативными метками

Разбиение по категориям – исторически первый подход к организации информации – представляет собой, попросту говоря, – разложение файлов по папкам. При умеренном количестве файлов такой способ себя вполне оправдывает (и даже более эффективен).

Пометка асоциативными метками – более широкий подход – каждому файлу присваиваются ассоциируемые с ним ключевые слова. Можно даже сказать что разбиение по категориям является очень частным случаем меток. Не стоит воспринимать метки как нечто новое, «притянутое за уши» – вспомните интернет и поиск в интернете. Что вы вбиваете в поисковую строку Google? Правильно, ключевые слова, по которым будут найдены соответствующие документы. Каждой вебстранице помещаемой в интернет, вебмастер присваивает ключевые слова, наиболее полно описывающие представляемую на этой странице информацию. Эти слова помещаются в дескриптор META в заголовочной части страницы:

<META name="keywords" content="ключевое слово1, ключевое слово2">

И как показала практика, такой способ организации огромных обьемов информации является правильным. Я не пишу «единственно правильным», потому что наиболее гибкий поиск может обеспечить только комбинированный способ организации – например метки и возможность сортировки по дате, и т.п.

Кроме того, прикрепить несколько меток к файлу гораздо проще чем однозначно отнести его к какой-либо категории, потому что описать обьект легче набором ассоциаций но никак не одним словом. Например, у вас есть фотоснимок с пчелой крупным планом, в какую папку вы его положите – Насекомые, Макро или Пчелы?

Сохраните это изображение себе на компьютер. При помощи Spotlight <http://iland.kiev.ua/news/53> (Mac OS X 10.4) вы легко отыщите эту картинку по любому из прописанных в ней ключевых слов – Пчелы, Макро, Насекомые, по названию работы – Водопой, или по имени автора – Андрей Каплуненко (это все IPTC данные). Или по модели фотоаппарата: DMC-LC20 (это уже EXIF данные).

Реализация

Итак, технология использования меток (ключевых слов) уже хорошо себя зарекомендовала в интернете, самой большой свалке информации. Метки сейчас очень активно применяются для упорядочения абсолютно всего – как новостей на новостных сайтах, так и фотографий на Flickr или закладок в Del.icio.us. Без меток сейчас просто никак – получится безнадежная свалка.

Осталось только придумать как использовать этот замечательный подход к упорядочению на локальном компьютере, который также постепенно медленно но уверенно превращается в свалку. Пользователям Mac OS X 10.4 гораздо проще – еще с апреля 2005 (когда была представлена OS 10.4 Tiger) у них есть замечательная поисковая система Spotlight. Ключевая особенность Spotlight заключается в том что поиск производится по мета-данным заключенным внутри файла – «служебной информации об содержимом файла». Мета данные, например, для фотоснимка содержат такую информацию как параметры вспышки, светочуствительность, выдержка, диафрагма, ключевые слова (!) и прочее.

Пользователям Windows нужно установить себе Vista – только в этой операционной системе обещали полную интегрированную поддержку поиска по метаданным и индексации метаданных.

Справка – типы метаданых в файлах изображений

EXIF – область дополнительной информации в которой хранятся параметры сьемки: ведущее число вспышки, баланс белого, светочуствительность, выдержка, диафрагма, фокальное расстояние обьектива, фокальное расстояние в пересчете на 35мм эквивалент, и т.д. Здесь же хранится уменьшенная копия изображения (превьюшка).

IPTC – область дополнительной информации в которой хранится информация как правило заполняемая пользователем – ключевые слова, место сьемки, описание, копирайты, благодарности, контактная информация автора. Кстати, некоторые IPTC данные могут заполняться автоматически – например место сьемки может узнаваться у системы GPS навигации и автоматически прописываться в снимок – такие схемы реально работают.

XMP – задумка компании Adobe. Расширяемый открытый стандарт по внедрению метаданных различных типов.

Но возможность поиска по метаданным сама по себе мало полезна, нужно сначала каким-то образом включить мета-информацию в файл. При сьемке изображения камера автоматически записывает EXIF информацию, а IPTC придется прописать вручную. Как? При помощи программ для работы с изображениями.

Пользователям Windows для работы с метаданными можно использовать Adobe Photoshop. Откройте фотографию в Photoshop и выберите File > File Info – откроется окно в котором можно прописать IPTC данные и просмотреть EXIF. Что делать если нужно применить одну и ту же IPTC информацию (набор ключевых слов, например) большому количеству снимков? В этом случае можно написать действие для Фотошопа которое автоматизирует такую задачу. Или воспользоваться другим софтом. Есть, например, Picasa от Google, но у меня нет возможности проверить может ли он изменять свойства снимков в пакетном режиме. Для профессионалов – iView Media Pro.

Пользователям Macintosh также много не насоветуешь. Для профессионалов есть в своем роде уникальная мощная Aperture (программа от Apple) и iView Media Pro (от iView Multimedia принадлежащей Microsoft). Кстати, не стоит забывать о Photoshop – он обеспечивает все возможности доступные Windows пользователям, плюс он может быть «заскриптован» при помощи AppleScript или Automator. Но это все профессиональный софт. Для обычных пользователей есть Preview – программа, входящая в комплект OS X. Но она не позволяет изменить мета-данные для нескольких файлов в один прием. Откройте изображение в Preview и нажмите Cmd+I:

В открывшемся окне вы можете просмотреть EXIF/IPTC данные, а также добавить ключевые слова перейдя на закладку Keywords.

Если нужно изменить IPTC информацию для большого количества изображений, очень целесообразно использовать Автоматор-действие которое так и называется: «Write IPTC Tags to JPEGs». Скачать его можно здесь: http://www.apple.com/downloads/macosx/automator/writeiptctagstojpegs.html

Действие позволяет прописать массу полезной информации включая ключевые слова, название работы, авторство, благодарности, контактную информацию:

Обратите пожалуйста внимание – некоторые программы хранят ключевые слова и прочую дополнительную информацию в своей базе данных, а не внутри файла. Так делает, например, iPhoto. Такие ключевые слова имеют смысл только при работе в данной программе и абсолютно невидимы снаружи. То есть если у вас в iPhoto снимкам присвоены какие-то ключевые слова, но эти слова не встроены непосредственно в файл, то Spotlight-поиск по таким словам не даст результатов. Помните об этом и следите за тем куда встраиваете ключевые слова, тогда найти что-либо будет очень очень просто. А Spotlight поможет в поиске. Надеюсь я убедил вас в важности использования меток для организации постоянно растущих обьемов информации?