Disco MapReduce

Disco MapReduce

Disco är en lätt, öppen källkodsram för distribuerad databehandling baserad på MapReduce-paradigmet och skriven i Python.
Disco är en implementering av mapreduce för distribuerad databehandling.Diskotek stöder parallella beräkningar över stora datauppsättningar, lagrade på ett opålitligt datorkluster, som i det ursprungliga ramverket skapat av Google.Detta gör det till ett perfekt verktyg för att analysera och bearbeta stora datauppsättningar utan att behöva oroa sig för svåra tekniska problem relaterade till distribution som kommunikationsprotokoll, lastbalansering, låsning, jobbplanering och feltolerans, som hanteras av Disco.
disco-mapreduce

Funktioner

kategorier

Alternativ till Disco MapReduce för alla plattformar med någon licens

Apache Hadoop

Apache Hadoop

Apache Hadoop är ett program med öppen källkod som stöder datakrävande distribuerade applikationer licensierade under Apache v2-licensen.
Apache Spark

Apache Spark

Apache Spark ™ är en snabb och allmän motor för storskalig databehandling. SpeedRun-program är upp till 100 gånger snabbare än Hadoop MapReduce i minnet, eller 10 gånger snabbare på disken.
Amazon Kinesis

Amazon Kinesis

Amazon Kinesis-tjänster gör det enkelt att arbeta med strömningsdata i realtid i AWS-molnet.
dispy

dispy

dispy är ett Python-ramverk för parallell exekvering av beräkningar genom att distribuera dem över flera processorer på en enda maskin (SMP), bland många maskiner i ett kluster eller ...