ArchiveBox

ArchiveBox

Self Webbarkivet med självhosting med öppen källkod.Tar webbläsarhistorik / bokmärken / Pocket / Pinboard / etc., Sparar HTML, JS, PDF-filer, media och mer.
  • Gratis
Eftersom moderna webbplatser är komplicerade och ofta förlitar sig på dynamiskt innehåll arkiverar ArchiveBox webbplatserna i flera olika format utöver vad offentliga arkiveringstjänster som Archive.org och Archive.is kan spara.ArchiveBox importerar en lista med webbadresser från stdin, fjärr url eller fil, lägger sedan sidorna till en lokal arkivmapp med wget för att skapa en sökbar html-klon, youtube-dl för att extrahera media och en fullständig instans av Chrome headless för PDF,Skärmdump och DOM-dumpningar och mer ... Med flera metoder och den marknadsdominerande webbläsaren för att köra JS säkerställer vi att vi kan spara till och med de mest komplexa, känsliga webbplatserna i minst några högkvalitativa, långsiktiga dataformat.### Kan importera länkar från: - Pocket, Pinboard, Instapaper - RSS, XML, JSON eller vanlig textlistor - Browserhistorik eller bokmärken (Chrome, Firefox, Safari, IE, Opera och mer) - Shaarli, Delicious, RedditSparade inlägg, Wallabag, Unmark.it och annan text med länkar i den!### Kan spara dessa saker för varje webbplats: - "favicon.ico" -favikon för webbplatsen - "example.com / page-name.html" wget-klon på webbplatsen, med .html bifogad om inte finns - "output.pdf` Tryckt PDF av webbplatsen med hjälp av headless chrome - `screenshot.png` 1440x900 skärmdump av webbplatsen med headless chrome -` output.html` DOM Dump av HTML efter rendering med headless chrome - `archive.org.txt` En länk tillsparad webbplats på archive.org - `warc /` för html + gzipped warc-filen.gz - `media /` alla mp4-, mp3-, undertexter och metadata som hittas med hjälp av youtube-dl - `git /` klon i vilket arkiv som helst för github, bitbucket eller gitlab-länkar - `index.html` &` index.json`HTML- och JSON-indexfiler som innehåller metadata och detaljer Arkiveringen är additiv, så att du kan schemalägga `. / Arkiv` att köra regelbundet och dra nya länkar till indexet.Allt det sparade innehållet är statiskt och indexeras med JSON-filer, så det lever för alltid och är lätt parsbart, det kräver ingen backend som alltid körs.
archivebox

kategorier

Alternativ till ArchiveBox för alla plattformar med någon licens

Pocket

Pocket

Spara webbsidor för att läsa senare och eliminera röran med bokmärken med webbplatser som bara är en engångsintresse.
Wget

Wget

GNU Wget är ett gratis programvarupaket för att hämta filer med HTTP (S) och FTP, de mest använda Internetprotokollen.
HTTrack

HTTrack

En webbplatskopieringstjänst som laddar ner hela webbplatser och bygger dem rekursivt lokalt.
Wayback Machine

Wayback Machine

Bläddra igenom över 150 miljarder webbsidor arkiverade från 1996 till några månader sedan.
wallabag

wallabag

wallabag är en open source-egen värdbar applikation för att spara webbsidor. ## Bekväm läsning
Pinboard

Pinboard

Pinboard är ett personligt arkiv för saker du hittar online och inte vill glömma.
Evernote Web Clipper

Evernote Web Clipper

Spara allt du ser online - inklusive text, länkar och bilder - på ditt Evernote-konto med ett enda klick.
Archive.is

Archive.is

Archive.is låter dig "ta ett foto" av en webbsida som alltid kommer att finnas tillgänglig även om den ursprungliga sidan ändras eller raderas.
Internet Archive

Internet Archive

Internet Archive är ett ideellt digitalt bibliotek som erbjuder gratis universell tillgång till böcker, filmer och musik samt 150 miljarder arkiverade webbsidor.
Stash.ai

Stash.ai

Stash är en smart bokmärke-app över enheter som stöds av konstgjord intelligens.Spara artiklar, videor och allt annat.De kategoriseras automatiskt åt dig.
SiteSucker

SiteSucker

macOS-applikation som automatiskt laddar ner webbplatser från Internet.Det gör detta genom att asynkront kopiera webbplatsens webbsidor, bilder, PDF-filer, stilark och andra filer till din lokala hårddisk, genom att duplicera webbplatsens katalogstruktur.
PageArchiver

PageArchiver

PageArchiver (tidigare kallad "Scrapbook for SingleFile") är en Chrome-förlängning som hjälper dig att arkivera webbsidor för offlineläsning. Huvudfunktioner är:
Reminiscence

Reminiscence

Själv värd bokmärke och arkivhanterare.Bokmärke länkar och redigera dess metadata (som titel, taggar, sammanfattning) via webbgränssnitt.
Fossilo

Fossilo

Fossilo.com arkiverar kontinuerligt kompletta webbplatser som pdf och flera andra format som enkelt kan öppnas och ses utan beroenden i framtiden.Du kan navigera i arkiven i plattformen eller ladda ner det som ett oberoende paket.
WebCull

WebCull

WebCull är en länkarrangör som är utformad för att hjälpa dig att bli mer produktiv och organiserad när du använder webben.