пятница, 18 сентября 2009 г.

Openkapow - Создание роботов.

Сегодня начну рассказывать про одну замечательную технологию, которую по каким то причинам обошел стороной "РУНЕТ". Есть только одно упоминание в статье 18 инструментов в арсенал mashup-мейкера. Обзор платформ.


Весьма маститую платформу для мэшапов предлагает компания Kapow. Один её вариант — OpenKapow— доступен в открытом виде и набрал уже вокруг себя сообщество разработчиков. OpenKapow – это графический инструмент, позволяющий извлекать информацию из произвольных веб-ресурсов и представлять её в виде сервиса, как в общедоступном виде (публикация в OpenKapow), так и на внутри корпоративном сервере Kapow. Положительной особенностью платформы является наличие механизмов корректной отработки ошибок, в случае если возникли проблемы при извлечении данных. Благодаря этому Kapow уже не первый год используется в качестве источника информации для крупных контентных сайтов. Kapow – коммерческий продукт, а открытая версия OpenKapow имеет ограничения по публикации сервисов за пределами комьюнити.

Грубо говоря openkapow позволяет создавать "роботов" - некую "прослойку" между стулом и монитором, :) которая вместо Вас будет ходить по интернету, нажимать различные кнопки, загружать страницы, собирать НУЖНУЮ информацию и предоставлять ее Вам в необходимом виде. Ярким примером использования данной технологии может служить Infostart RSS лента. Технология по задачам напоминает Yahoo Pipes, однако кардинально отличается в реализации и философии использования ("битва" двух платформ будет описана позже).

Cоздать собственного робота очень легко. Для создания роботов нужно скачать среду разработки RoboMaker и установить её локально на вашем компьютере. Используя "point-and-click" вы можете создавать своих роботов, без необходимости писать какие-либо программы. После создания робота вы можете опубликовать на openkapow.com используя RoboMaker. Затем вы можете запускать своих роботов с openkapow серверов, и делиться ими с остальными членами сообщества. Каждый опубликованный робот получает уникальный URL, который можно использовать для вызова робота из Yahoo! Pipes, вашего RSS Reader, сайта, программы или mashup.

Что такое openkapow робот?

Робот в openkapow это небольшая программа, которая автоматизирует, путешествие человека по всемирной паутине.Вы хотите пойти и почитать новости, авторизироваться на сайте и проверить личные сообщения? Вы можете автоматизировать это в течение нескольких минут, а затем использовать роботов в Ваших RSS Reader или собственных программах.

RoboMaker

RoboMaker -это визуальная среда разработки роботов. В RoboMaker слито воедино настройки и выполнение шагов. Это делается с помощью "point-and-click" интерфейса, который включает в себя представление браузера, что позволяет разработчику увидеть страницу как будто они представлена в нормальном браузере, таком как Internet Explorer или Firefox. RoboMaker - это клиентская программа, которую загружается и запускается разработчиками на локальной машине. Когда робот завершен он может быть опубликован в openkapow.com используя интерфейс RoboMaker.

Что удивительного в RoboMaker?

RoboMaker дает вам возможность делать все, что нужно:
  • Полный контроль над процессами потоков, в том числе условий и циклов.Обработка без проблем IF-сценарий, OR-сценарий & and-сценарий.
  • Гибкая обработка ошибок. Используйте встроенный в отладчик для тестирования Ваших роботов.
  • HTTP, HTTPs, cookies, logins, headers, Javascript и т.д. все обрабатываться и полностью под вашим контролем.
  • Доступ к веб-страницам с помощью представления браузера,DOM представление, исходного представление HTML или использование html-тэгов.
  • Робот выполняется пока вы его разрабатываете! Это дает вам полный контроль над текущем состоянием робота.

Различные типы роботов

Есть 3 различных типов openkapow роботов, которые вы можете создавать:

RSS/Atom feed роботы
RSS робот - это робот, который создает RSS или Atom канал. RSS канал можно прочитать с помощью специальной программы RSS Reader, браузера, который поддерживает RSS или почтовой программы, которая позволяет читать RSS. RSS робот запускается по графику,который определяется разработчиком робота. Например, он может быть запущен один раз в час, а это означает, что раз в час канал будет обновлен новой информацией, которую, возможно, нашел робот.


REST роботы
REST робот - это робот, который запускается в качестве службы REST, это веб -сервис, который доступен с обычного URL. Робот выводит результат своей работы, например в XML, HTML или JSON. REST роботы, как правило, используются для создания API взаимодействия с веб-сайтом, и они, как правило, вызываются в рамках программы (написанными например на PHP, Ruby или Rails, C# или Java). Это делает REST роботов идеальной базой для mashups!

Web Clip роботы

Web Clip робот - это использование функциональности одного сайта на другом. С помощью Web Clip робота можно взять полный сайт, часть сайта или только часть страницы, и использовать его за пределами оригинального сайт. Внутри робота можно изменить HTML, таблицы стилей и т.д. оригинального сайта.