123
Disco MapReduce

Disco MapReduce

Disco je lehký, open-source framework pro distribuované výpočty založený na paradigmatu MapReduce a napsaný v Pythonu.
Disco je implementace mapreduce pro distribuované výpočty.Disco podporuje paralelní výpočty na velkých souborech dat uložených na nespolehlivém clusteru počítačů, jako v původním rámci vytvořeném společností Google.Díky tomu je dokonalým nástrojem pro analýzu a zpracování rozsáhlých datových sad, aniž by se museli obávat složitých technických otázek souvisejících s distribucí, jako jsou komunikační protokoly, vyrovnávání zatížení, zamykání, plánování úloh a odolnost proti chybám, které zpracovává společnost Disco.

Webová stránka:

Kategorie

Alternativy Disco MapReduce pro všechny platformy s jakoukoli licencí

Apache Hadoop

Apache Hadoop

Apache Hadoop je open source softwarový rámec, který podporuje datově náročné distribuované aplikace licencované na základě licence Apache v2.
Apache Spark

Apache Spark

Apache Spark ™ je rychlý a obecný stroj pro zpracování dat ve velkém měřítku. Programy SpedRun až 100x rychlejší než Hadoop MapReduce v paměti nebo 10x rychlejší na disku.
Amazon Kinesis

Amazon Kinesis

Služby Amazon Kinesis usnadňují práci s datovými proudy v reálném čase v cloudu AWS.
dispy

dispy

dispy je Python framework pro paralelní provádění výpočtů tím, že je distribuuje do více procesorů na jednom počítači (SMP), mezi mnoho strojů v klastru nebo ...