Цифровые снимки будет легче хранить и находить

Цифровые снимки будет легче хранить и находить

На твёрдых дисках ПК во всем мире цифровые снимки занимают с каждым днем все больше места. Разобраться с ними не редкость все тяжелее — мало кто дотошно классифицирует и обрисовывает их, да и не всегда это быть может, а процедуры распознавания образов и автоматического дешифрирования до тех пор пока что далеки от совершенства. Отсутствие описания снимков быстро усложняет процедуру поиска нужного.

Собственный рецепт выхода из обстановки внесла предложение Маргарет Флек (Margaret Fleck) из лаборатории Hewlett-Packard в г. Пало-Альто (Калифорния).

Она предлагает применять для данной цели реплики тех, кто просматривает фотографии на компьютере. Согласно точки зрения г-жи Флек, эти реплики, не смотря на то, что и не обрисовывают фотографию в полной мере корректно, однако, содержат сведения о событиях, предшествовавших моменту съемки либо последовавших за ним — иными словами, передают контекст.

Маргарет Флек разработала программу, которая записывает реплики на диск компьютера, выявит обращение посредством средств voice recognition и выделяет главные слова, применяемые в будущем для аннотирования текста.

Тестовая версия программы, для работы которой нужен ПК с микрофоном, машинально начинает запись речи с момента открытия цифрового фотоальбома, фиксируя все комментарии. В случае если пауза продолжается продолжительнее 30 секунд, программа отключается. Обращение дешифрируется в настоящем масштабе времени, из нее выделяются такие главные слова, как, например, Венеция, медовый месяц, Рождество либо другие. Эти главные слова и помогают для индексации фотографий.

Потом, дабы отыскать нужную фотографию, необходимо определенные слова в окно поиска.

По мере совершенствования средств распознавания речи совокупность сможет генерировать долгие и подробные описания каждой сцены. Уже на данный момент имеющиеся на рынке программы снабжают распознавание практически 99% речи, но нуждаются в настройке на голос конкретного человека. Г-жа Флек же собирается создать совокупность, талантливую распознавать обращение всех, кто высказывается о фотографии, а не только только того человека, кто сидит у микрофона.

Распознавание речи нескольких человек до тех пор пока что осуществляется со намного меньшей точностью, но диалоги при непринужденной беседе намного более информативны. Маргарет Флек воспользовалась программой распознавания речи, созданной в самой HP.Не обращая внимания на меньшую эффективность распознавания, ей удается собрать достаточно главных слов для аннотирования фотографий.

Это в действительности остроумный метод аннотирования изображений, — думает Мор Наамен (Mor Naaman) из Стэндфордского университета. Сам он пробует решить ту же проблему иным методом — фиксируя посредством GPS-приемника, встроенного в фотокамеру, координаты места съемки. Сама же г-жа Флек резонно считает, что и в этом случае панацеи не отыскать, и вправду разумным ответом будет сочетание нескольких методик аннотирования.

В случае если предложенная Маргарет Флек методика окажется вправду действенной, она откроет возможности создания широких библиотек цифровых изображений разнообразные. Действительно, она не лишена субъективизма, и темперамент приобретаемых так аннотаций будет очень сильно зависеть от интеллектуальных изюминок участников дискуссии.

Увлекательные записи:

Организация хранения в ванной комнате. «ДО» и «ПОСЛЕ» работы организатора пространства.


Комментарии и уведомления в настоящее время закрыты..

Комментарии закрыты.