MapReduce и параллельные СУБД


Планирование


В параллельной СУБД каждому узлу точно известно, что и когда он должен делать в соответствии с распределенным планом выполнения запроса. Поскольку операции известны заранее, система может оптимизировать план выполнения для минимизации объема пересылок данных между узлами. В отличие от этого, каждая задача в системе MR планируется, исходя из поблочной обработки данных в каждом узле. Такое планирование работы во время выполнения на уровне блоков данных является значительно более дорогостоящим, чем планирование, производимое СУБД на стадии компиляции. С другой стороны, как утверждают некоторые исследователи , у динамического планирования в стиле MR имеется то преимущество, что оно позволяет адаптироваться к перекосам рабочей нагрузки и различиям в производительности между узлами системы.



Содержание раздела