Анотация: В статье исследуется проблема обработки большого количества данных, хранения данных в распределенных кластерных системах. Анализируются существующие способы обработки данных с помощью облачных вычислений, принципы их работы. Предлагается разработка сервиса, который может решить такие задачи, как изменение и распределение данных между процессорами, балансировка загрузки, обработка отказов, сбор и агрегация промежуточных результатов.
Ключевые слова:
облачные вычисления, модель программирования MapReduce, поисковые системы, распределенные кластерные системы