12
ArchiveBox
Self Webbarkivet med självhosting med öppen källkod.Tar webbläsarhistorik / bokmärken / Pocket / Pinboard / etc., Sparar HTML, JS, PDF-filer, media och mer.
- Gratis
Eftersom moderna webbplatser är komplicerade och ofta förlitar sig på dynamiskt innehåll arkiverar ArchiveBox webbplatserna i flera olika format utöver vad offentliga arkiveringstjänster som Archive.org och Archive.is kan spara.ArchiveBox importerar en lista med webbadresser från stdin, fjärr url eller fil, lägger sedan sidorna till en lokal arkivmapp med wget för att skapa en sökbar html-klon, youtube-dl för att extrahera media och en fullständig instans av Chrome headless för PDF,Skärmdump och DOM-dumpningar och mer ... Med flera metoder och den marknadsdominerande webbläsaren för att köra JS säkerställer vi att vi kan spara till och med de mest komplexa, känsliga webbplatserna i minst några högkvalitativa, långsiktiga dataformat.### Kan importera länkar från: - Pocket, Pinboard, Instapaper - RSS, XML, JSON eller vanlig textlistor - Browserhistorik eller bokmärken (Chrome, Firefox, Safari, IE, Opera och mer) - Shaarli, Delicious, RedditSparade inlägg, Wallabag, Unmark.it och annan text med länkar i den!### Kan spara dessa saker för varje webbplats: - "favicon.ico" -favikon för webbplatsen - "example.com / page-name.html" wget-klon på webbplatsen, med .html bifogad om inte finns - "output.pdf` Tryckt PDF av webbplatsen med hjälp av headless chrome - `screenshot.png` 1440x900 skärmdump av webbplatsen med headless chrome -` output.html` DOM Dump av HTML efter rendering med headless chrome - `archive.org.txt` En länk tillsparad webbplats på archive.org - `warc /` för html + gzipped warc-filen.gz - `media /` alla mp4-, mp3-, undertexter och metadata som hittas med hjälp av youtube-dl - `git /` klon i vilket arkiv som helst för github, bitbucket eller gitlab-länkar - `index.html` &` index.json`HTML- och JSON-indexfiler som innehåller metadata och detaljer Arkiveringen är additiv, så att du kan schemalägga `. / Arkiv` att köra regelbundet och dra nya länkar till indexet.Allt det sparade innehållet är statiskt och indexeras med JSON-filer, så det lever för alltid och är lätt parsbart, det kräver ingen backend som alltid körs.
archivebox
kategorier
Alternativ till ArchiveBox för Chrome
785
Spara webbsidor för att läsa senare och eliminera röran med bokmärken med webbplatser som bara är en engångsintresse.
191
Wayback Machine
Bläddra igenom över 150 miljarder webbsidor arkiverade från 1996 till några månader sedan.
184
wallabag
wallabag är en open source-egen värdbar applikation för att spara webbsidor. ## Bekväm läsning
67
Evernote Web Clipper
Spara allt du ser online - inklusive text, länkar och bilder - på ditt Evernote-konto med ett enda klick.
19
14
PageArchiver
PageArchiver (tidigare kallad "Scrapbook for SingleFile") är en Chrome-förlängning som hjälper dig att arkivera webbsidor för offlineläsning. Huvudfunktioner är: