Интервью : Вся правда о Метафорах

Павел МосквинНа вопросы Римейк.ру согласился ответить один из разработчиков нового поисковика (смотрите пресс-релиз ) Павел Москвин (см. фото)

Q: В вашем пресс-релизе сообщается, что "METAFORA.ru -первая в Рунете поисковая система по изображениям ". А Яндекс как же?:)

A:Яндекс тоже ищет по картинкам, и Апорт кстати тоже, однако выводит результат запроса в виде ссылок на страницы, где расположено изображение, без возможности предвартельного просмотра thumbnails (уменьшенные варианты изображений) .

Q:Чем отличается ваш поисковик, какие у него особенности.

A: www.metafora.ru является первой в российском интернете поисковой системой, которая производит поиск по графическим изображениям, размещенным на различных интернет серверах. Результат запроса выводится в виде уменьшенных копий графических изображений и общим описанием каждого графического объекта (описание, формат, размер (кб), ширина и высота (пиксел)). Любое изображение можно увеличить, получив при этом дополнительную информацию о нём (формат, заголовок страницы).

www.metafora.ru является специализированной поисковой системой, способной обрабатывать многочисленные запросы пользователей, быстро и релевантно выводить результаты запросов, одновременно обучаясь у пользователей более точной выдаче результатов.

Известно, что редкий пользователь поисковой системы просматривает более трех страниц результатов запроса и ненайдя нужной информации покидает поисковую ситему. Для решения этой проблемы была разработана система - IPR (Index of picture popularity), которая позволяет системе постепенно обучаться запросам пользователей и выводить наиболее подходящие изображения на первых страницах запроса.

Q: Можно подробней про IPR? Как это реализованно?

A: IPR (Index of picture popularity) - наше небольшое ноу хау, это программный механизм, который оценивает предпочтения пользователей по тому или иному поисковому запросу отслеживая их действия. Получается что каждый пользователь обучает поисковый механизм и с каждым разом релевантность повышается.

Q: На чем написан поисковик? Какие предъявляет требования к железу?

A: Написан на ПХП, в ближайший месяц переходим на С.

Поисковая система работает под ОС Unix, ядро ISPLinux version 1.0a-pre1 based on 2.2.20 на основе двух процессоров Pentium III (Coppermine) cpu MHz : 937.573. Данные возможности распределены между всеми клиентами ISP.Возможности сервера www.metafora.ru в настоящий момент:Сgi::cputime=15s::datasize=24M::stacksize=6M::memorylocked=6M::memoryuse= 64M: Для скриптов, запускаемых из cronилиизshell::cputime=10m::datasize= 24M::stacksize=6M::memorylocked=6M::memoryuse=64M:На вышеописанной машине установлен веб-сервер Apache/1.3.17 с поддержкой PHP Version 4.0.6 как модуль и Mysql 3.23.39.

Q: C чем связан переход на С? Не устраивает производительность?

A: Да, не устраивает производительность. Сейчас, у поисковой системы сравнительно маленькая скорость обработки запроса.

Кроме того, мы хотим увеличить функциональность системы. С переходом на новый движок, мы планируем учитывать морфологию русского языка при обработке поисковых запросов, т.е. при введении слова "автомобиль", программа будет склонять слово, следуя правилам грамматики русского языка, выдавая варианты написания "Автомобили", "автомобилем" и т.д.. Такой принцип реализован в ведущих поисковых системах, а для нас это будет большой шаг вперед.

Q: Собираетесь ли вы получать патент на свою разработку/технологию?

A: Нет, в настоящий момент у нас много других проблем. Получение патента дорого, ведь пошлины с нового года увеличены в 100 раз, кроме того долго, и вполне вероятно, что через полтора года патент уже не будет актульным.

Q: Для кого, как вы считаете, предназначен ваш поисковик?

A: Для всех, кто ищет изображения - дизайнеры, фотографы, веб мастера и простые пользователи.

Проект расчитан прежде всего на широкую аудиторию пользователей.

Q: За сколько, в среднем, проводится обработка одного запроса к поисковику?

A: Зависит от многих факторов (загруженность сервера, длина фразы итд.). Нынешний движок выполняет запрос в одно слово, в среднем за 0.5 - 1 секунду. При этом виртуальный сервер, на котором размещена поисковая система обладает сравнительно маленькой скоростью.

Q: Понимает ли ваш поисковик динамические страницы? А как следствие и сгенерированные "на лету" картинки?

A: Да, наша система понимает как динамическое содержание так и изображения.

Q: Собираетесь ли вы рекламировать свою разработку (имею ввиду в первую очередь интернет)? Если да, то как?

A: В настоящий момент мы ищем инвестора. В случае, если нам будут предложены условия, которые нас устраивают, мы будем развивать коммерческое направление проекта. Часть привлеченных средств пойдет на рекламу проекта в интернете.

Q: Расскажите о разработчиках.

A: Разработчики -

Павел Москвин (info@metafora.ru) - студент, юр.фак, 1982 г.р., подробная информация http://www.law.metafora.ru/about.shtml

роль в проекте - идея, дизайн, хтмл программирование, концепция, правовое консультирование, финансирование

Андрей Иванников (ivanikov@www.msiu.ru ) - студент, программист, 1982

- роль в проекте программирование ПХП, концепт, железо

Александр Иваненко (hershy95@cityline.ru ) - сотрудник военного НИИ, программирование на С

- роль в проекте программирование С, распознавание образов, сложные программные разработки, морфология словоформ и т.д.

В проекте участвует студия 2heads design (design@vimya.ru ) (www.vimya.ru , www.deforum.ru )

- роль в проекте разработка ID и дизайн (планируется в ближайшие 4 недели полная смена дизайна)

editor, alex@remake.ru
опубликовано 18 февраля 2002 года

Смотрите также:

// Для Римейка рассказывают. Ferra.ru - совместный проект Рамблера и ИД Компьютерра  (опубликовано 2002-03-07)
// Включи мечту! Мы угадаем твои желания  (опубликовано 2002-03-06)