Компания Cloudera, образованная в прошлом году бывшими сотрудниками Google, Yahoo, Oracle и Facebook, выпустила в свет преконфигурированный дистрибутив Apache Hadoop. Это событие призвано придать дополнительный импульс более широкому распространению платформы, так как, по мнению многих пользователей, основная проблема развертывания и обслуживания Hadoop — это высокая сложность его конфигурирования.
Hadoop представляет собой распределенную среду выполнения приложений, построенную по кластерной схеме на базе широко распространенных компьютеров х86 архитектуры. В основе ее работы лежит технология Map/Reduce, когда приложение разбивается на множество маленьких фрагментов, каждый из которых может быть запущен на любом из узлов кластера. В дополнение к этому, Hadoop для хранения данных использует распределенную файловую систему HDFS, в результате чего значительно повышается показатель суммарной пропускной способности кластера. Hadoop и HDFS оптимизированы для работы с очень большими объемами данных и разработаны таким образом, что на любой сбой система реагирует автоматически, обеспечивая высокую надежность и сохранность данных.
Дистрибутив Cloudera собран на последнем стабильном ядре Hadoop, в которое внесены некоторые исправления, направленные на упрощение конфигурации, а также содержит набор дополнительных утилит, значительно упрощающих жизнь системному администратору. В настоящее время продукт доступен виде rpm-пакетов только для Red Hat Enterprise Linux и совместимых дистрибутивов и свободно распространяется под лицензией Apache 2.
|