Disco MapReduce

Disco är en lätt, öppen källkodsram för distribuerad databehandling baserad på MapReduce-paradigmet och skriven i Python.

Gratis
Windows
Mac
Linux

Disco är en implementering av mapreduce för distribuerad databehandling.Diskotek stöder parallella beräkningar över stora datauppsättningar, lagrade på ett opålitligt datorkluster, som i det ursprungliga ramverket skapat av Google.Detta gör det till ett perfekt verktyg för att analysera och bearbeta stora datauppsättningar utan att behöva oroa sig för svåra tekniska problem relaterade till distribution som kommunikationsprotokoll, lastbalansering, låsning, jobbplanering och feltolerans, som hanteras av Disco.

Alternativ till Disco MapReduce för alla plattformar med någon licens

Apache Hadoop

Apache Hadoop är ett program med öppen källkod som stöder datakrävande distribuerade applikationer licensierade under Apache v2-licensen.

Gratis
Windows
Mac
Linux

Apache Spark

Apache Spark ™ är en snabb och allmän motor för storskalig databehandling. SpeedRun-program är upp till 100 gånger snabbare än Hadoop MapReduce i minnet, eller 10 gånger snabbare på disken.

Gratis
Windows
Mac
Linux

Amazon Kinesis

Amazon Kinesis-tjänster gör det enkelt att arbeta med strömningsdata i realtid i AWS-molnet.

Betald
Web

Apache Flink

HPCC Systems

Linux

dispy

dispy är ett Python-ramverk för parallell exekvering av beräkningar genom att distribuera dem över flera processorer på en enda maskin (SMP), bland många maskiner i ett kluster eller ...

Gratis
Windows
Mac
Linux