ArchiveBox

ArchiveBox

Self Webbarkivet med självhosting med öppen källkod.Tar webbläsarhistorik / bokmärken / Pocket / Pinboard / etc., Sparar HTML, JS, PDF-filer, media och mer.
  • Gratis
Eftersom moderna webbplatser är komplicerade och ofta förlitar sig på dynamiskt innehåll arkiverar ArchiveBox webbplatserna i flera olika format utöver vad offentliga arkiveringstjänster som Archive.org och Archive.is kan spara.ArchiveBox importerar en lista med webbadresser från stdin, fjärr url eller fil, lägger sedan sidorna till en lokal arkivmapp med wget för att skapa en sökbar html-klon, youtube-dl för att extrahera media och en fullständig instans av Chrome headless för PDF,Skärmdump och DOM-dumpningar och mer ... Med flera metoder och den marknadsdominerande webbläsaren för att köra JS säkerställer vi att vi kan spara till och med de mest komplexa, känsliga webbplatserna i minst några högkvalitativa, långsiktiga dataformat.### Kan importera länkar från: - Pocket, Pinboard, Instapaper - RSS, XML, JSON eller vanlig textlistor - Browserhistorik eller bokmärken (Chrome, Firefox, Safari, IE, Opera och mer) - Shaarli, Delicious, RedditSparade inlägg, Wallabag, Unmark.it och annan text med länkar i den!### Kan spara dessa saker för varje webbplats: - "favicon.ico" -favikon för webbplatsen - "example.com / page-name.html" wget-klon på webbplatsen, med .html bifogad om inte finns - "output.pdf` Tryckt PDF av webbplatsen med hjälp av headless chrome - `screenshot.png` 1440x900 skärmdump av webbplatsen med headless chrome -` output.html` DOM Dump av HTML efter rendering med headless chrome - `archive.org.txt` En länk tillsparad webbplats på archive.org - `warc /` för html + gzipped warc-filen.gz - `media /` alla mp4-, mp3-, undertexter och metadata som hittas med hjälp av youtube-dl - `git /` klon i vilket arkiv som helst för github, bitbucket eller gitlab-länkar - `index.html` &` index.json`HTML- och JSON-indexfiler som innehåller metadata och detaljer Arkiveringen är additiv, så att du kan schemalägga `. / Arkiv` att köra regelbundet och dra nya länkar till indexet.Allt det sparade innehållet är statiskt och indexeras med JSON-filer, så det lever för alltid och är lätt parsbart, det kräver ingen backend som alltid körs.
archivebox

kategorier

Alternativ till ArchiveBox för Software as a Service (SaaS) med öppen källkodslicens