Erstellen Sie eine Offline-Spiegelkopie einer Site mit Wget unter Windows und Linux
Manchmal benötigen Sie eine durchsuchbare Kopie einer Website, damit Sie offline darauf zugreifen, einen USB-Stick anschließen oder sogar auf Ihr Smartphone hochladen und diese beim Fliegen oder Reisen lesen können. Während es in modernen Browsern und Betriebssystemen einfach ist, eine Webseite als PDF zu speichern, kann es ärgerlich sein, jede einzelne Seite zu verarbeiten. Hier kommt wget.
Werbung
Wget ist ein Open-Source-Download-Manager. Es handelt sich um eine Konsolen-App, die hauptsächlich für Linux entwickelt wurde, jedoch erfolgreich auf andere Betriebssysteme wie Windows und MacOS portiert wurde.
kein Ton auf dem Chromecast-Bildschirm
Wenn Sie mit wget nicht vertraut sind, sollten Sie es auf jeden Fall ausprobieren. Es ist sehr mächtig. Es ermöglicht das Abrufen von Dateien von Websites mithilfe von HTTP, HTTPS und FTP, den Internetprotokollen, die wir derzeit verwenden. Sein Verhalten wird durch Befehlszeilenargumente gesteuert.
Wget unterstützt eine Vielzahl von Optionen zum Abrufen von Dateien bei langsamen oder instabilen Verbindungen, einschließlich Wiederholungsversuchen, Fortsetzen dort, wo sie übrig geblieben sind, und mehr. Es unterstützt die Datei 'robots.txt', sodass es wie ein Webcrawler funktionieren kann. Es kann nur geänderte Dateien abrufen, unterstützt Platzhalter, Dateitypbeschränkungen und reguläre Erweiterungen.
Wget unterstützt das rekursive Abrufen von HTML-Websites und FTP-Servern, sodass Sie eine Website spiegeln können. Hier ist, wie es gemacht werden kann.
Bevor Sie fortfahren können, müssen Sie die wget-App herunterladen.
Holen Sie sich Wget unter Windows
Normalerweise verwende ich Binärdateien aus folgenden Quellen:
Beide machen ihre Arbeit.
Holen Sie sich Wget unter Linux
Verwenden Sie den Paketmanager Ihrer Distribution. Einige Beispiele (ausführen sie als Wurzel ):
Debian / Ubuntu / Mint:
apt install wget
CentOS / Redhat
yum install wget
Arch Linux
pacman -Sy wget
Leere Linux
xbps-install -S wget
Um eine Offline-Kopie einer Site mit Wget zu erstellen,
- Öffnen Eingabeaufforderung /. Terminal .
- Geben Sie unter Windows den vollständigen Pfad zur Datei wget.exe ein.
- Geben Sie unter Linux einfach wget ein.
- Geben Sie nun die folgenden Argumente ein, um den folgenden Befehl zu erhalten:
wget --mirror --convert-links --adjust-extension --page-require - --no-parent https://site-to-download.com
- Ersetze das
https://site-to-download.com
Teil mit der tatsächlichen Site-URL, von der Sie einen Spiegel erstellen möchten.
Du bist fertig!
Hier sind die Schalter, die wir verwenden:
--Spiegel
- wendet eine Reihe von Optionen an, um den Download rekursiv zu machen.--kein Elternteil
- Crawlen Sie das übergeordnete Verzeichnis nicht, um nur einen Teil der Site abzurufen.--convert-links
- sorgt dafür, dass alle Links ordnungsgemäß mit der Offline-Kopie funktionieren.--Seitenvoraussetzungen
- Laden Sie JS- und CSS-Dateien herunter, um den ursprünglichen Seitenstil beim Durchsuchen eines lokalen Spiegels beizubehalten.- Anpassung anpassen
- fügt den Dateien die entsprechenden Erweiterungen (z. B. HTML, CSS, JS) hinzu, wenn sie ohne sie abgerufen wurden.
Das ist es.