1
Disco är en implementering av mapreduce för distribuerad databehandling.Diskotek stöder parallella beräkningar över stora datauppsättningar, lagrade på ett opålitligt datorkluster, som i det ursprungliga ramverket skapat av Google.Detta gör det till ett perfekt verktyg för att analysera och bearbeta stora datauppsättningar utan att behöva oroa sig för svåra tekniska problem relaterade till distribution som kommunikationsprotokoll, lastbalansering, låsning, jobbplanering och feltolerans, som hanteras av Disco.
disco-mapreduce
Hemsida:
http://discoproject.org/Funktioner
kategorier
Alternativ till Disco MapReduce för Windows
18
Apache Hadoop
Apache Hadoop är ett program med öppen källkod som stöder datakrävande distribuerade applikationer licensierade under Apache v2-licensen.
9
Apache Spark
Apache Spark ™ är en snabb och allmän motor för storskalig databehandling. SpeedRun-program är upp till 100 gånger snabbare än Hadoop MapReduce i minnet, eller 10 gånger snabbare på disken.