18 gennaio, 2007

Creare un mirror di un sito con wget

Vi è mai capitato di trovare un manuale che vi interessa su internet ma non un tarball o un zip da scaricare per leggerlo in locale? Un metodo per scaricarlo ugualmente in modo semplice (senza dover scaricare una pagina per volta) è quello di utilizzare wget per fare il mirroring (in locale) della parte di sito che contiene il nostro manuale. Il comando da usare è il seguente:


wget -m -np http://www.example.com/book/

L'opzione -m serve ad indicare a wget che vogliamo fare un mirroring, mentre l'opzione -np (-no-parent) indica a wget di non "uscire" dalla directory specificata. L'opzione è molto utile nel caso che (come nell'esempio) si vuole scaricare solo una directory del sito. Se non utilizziamo questa opzione, se in una pagina della directory book ci fosse un link ad esempio alla directory example.com/test, wget seguirebbe il link e scaricherebbe anche quella.

2 commenti:

  1. Anonimo1:27 PM

    ciao

    e se ad esempio le immagini di questo libro fossero nella cartella www.example.com/images come dovrei fare a scaricare il tutto con un comando?
    :)

    RispondiElimina
  2. Dovresti aggiungere l'opzione -p (--page-requisites) che indica a wget di scaricare tutti i files necesari a visualizzare correttamente le pagine html (e quindi anche le immagini)

    :)

    RispondiElimina