MapReduce внутри, снаружи или сбоку от параллельных СУБД



         

Аналитические параллельные СУБД сегодня


Как отмечается в , в действительности направление DWAA появилось еще в 1980-е гг., и соответствующие пионерские продукты были созданы в компании Britton Lee Inc. , которая в 1989 г. была сначала переименована в ShareBase Corporation, а затем поглощена компанией Teradata , которая к этому времени тоже придерживалась подхода DWAA. Аппаратно-программное решение, основанное на ассоциативной адресации элементов хранения данных, имелось у компании ICL (Content Addressable File Store ). Однако на рынке систем поддержки хранилищ данных на основе подхода DWAA с тех пор осталась только Teradata.

Возрождение направления DWAA в начале 2000-х, безусловно, связано с упомянутым выше ростом заинтересованности компаний в сравнительно недорогих и эффективных решениях, направленных исключительно на поддержку хранилищ данных и их анализа. Вокруг этого направления стали возникать софтверные стартапы, первым из которых стала компания Netezza , основавшая свое эффективное DWAA-решение на использовании программируемых вентильных матриц (Field Programmable Gate Array, FPGA) и процессоров PowerPC. Использование FPGA в контроллерах магнитных дисков позволяет осуществлять "на лету" первичную фильтрацию данных, а применение PowerPC вместо процессоров Intel (по утверждению компании) позволяет снизить энергопотребление и расходы на охлаждение.

С тех пор появилось еще около десяти новых компаний, ориентирующихся на разработку DWAA с применением (почти всегда) разновидностей массивно-параллельной архитектуры (MPP) "sharing-nothing":

  • Vertica Systems – MPP, поколоночное хранение таблиц;

  • DATAllegro Inc. , недавно поглощенная Microsoft, которая основала на продукте этой компании проект Madison, ставший основой SQL Server 2008 R2 Parallel Data Warehouse , – MPP, система основана на использовании СУБД Ingres (тем самым, таблицы хранятся по строкам);

  • Greenplum – MPP, система основана на использовании СУБД PostgreSQL (тем самым, таблицы хранятся по строкам);

  • Aster Data Systems – MPP, таблицы хранятся по строкам;




  • Содержание  Назад  Вперед