Hoe om die wget Linux Command te gebruik om webbladsye en lêers te laai

Die wget nut kan u webblaaie, lêers en beelde van die web aflaai met behulp van die Linux-opdraglyn.

U kan self 'n enkele wget-opdrag gebruik om van 'n webwerf af te laai of 'n insetlêer op te stel om veelvuldige lêers oor verskeie webwerwe af te laai.

Volgens die handleiding kan wget gebruik word selfs wanneer die gebruiker uit die stelsel ingeteken het. Om dit te doen, sal jy die nohup-bevel gebruik.

Die wget nut sal 'n aflaai weer probeer, selfs wanneer die konneksie daal, en hervat waar dit weggelaat is, indien moontlik, wanneer die konneksie terugkeer.

U kan hele webtuistes aflaai met behulp van wget en skakel die skakels om na plaaslike bronne te wys, sodat u 'n webwerf vanlyn kan sien.

Die kenmerke van wget is soos volg:

Hoe om 'n webwerf af te laai deur Wget te gebruik

Vir hierdie gids sal ek jou wys hoe om my persoonlike blog af te laai.

Wget www.everydaylinuxuser.com

Dit is die moeite werd om jou eie gids op jou rekenaar te skep deur die mkdir-opdrag te gebruik en dan in die gids te beweeg deur die cd-opdrag te gebruik .

Byvoorbeeld:

mkdir everydaylinuxuser
CD everydaylinuxuser
Wget www.everydaylinuxuser.com

Die resultaat is 'n enkele index.html-lêer. Hierdie lêer is op sigself redelik nutteloos, aangesien die inhoud nog steeds van Google getrek word en die beelde en style sheets nog steeds op Google gehou word.

Om die volledige webwerf en al die bladsye te laai, kan u die volgende opdrag gebruik:

wget -r www.everydaylinuxuser.com

Dit laai die bladsye rekursief tot 'n maksimum van 5 vlakke diep.

5 vlakke diep is dalk nie genoeg om alles van die werf te kry nie. U kan die skakel -l gebruik om die aantal vlakke aan te stel wat u wil gaan soos volg:

wget -r-l10 www.everydaylinuxuser.com

As jy oneindige herhaling wil hê, kan jy die volgende gebruik:

wget -r -l inf www.everydaylinuxuser.com

Jy kan ook die inf vervang met 0 wat dieselfde ding beteken.

Daar is nog een probleem. U kan al die bladsye lokaal kry, maar al die skakels in die bladsye wys steeds na hul oorspronklike plek. Dit is dus nie moontlik om plaaslik tussen die skakels op die bladsye te klik nie.

U kan hierdie probleem oplos deur die -k skakelaar te gebruik wat al die skakels op die bladsye omskakel om na hul plaaslik afgelaaide ekwivalent soos volg te verwys:

wget -r -k www.everydaylinuxuser.com

As jy 'n volledige spieël van 'n webwerf wil kry, kan jy eenvoudig die volgende skakelaar gebruik wat die noodsaaklikheid vir die gebruik van die -r -k en -l skakelaars verwyder.

wget -m www.everydaylinuxuser.com

Daarom, as jy jou eie webwerf het, kan jy 'n volledige rugsteun maak met hierdie een eenvoudige opdrag.

Begin wget as 'n agtergrondbevel

U kan wget kry om te hardloop as 'n agtergrondopdrag sodat u met u werk in die terminale venster kan voortgaan terwyl die lêers afgelaai word.

Gebruik die volgende opdrag:

wget -b www.everydaylinuxuser.com

U kan natuurlik skakelaars kombineer. Om die wget-bevel op die agtergrond te bestuur terwyl u die werf weerspieël, sal u die volgende opdrag gebruik:

wget -b -m www.everydaylinuxuser.com

U kan dit verder vereenvoudig soos volg:

wget-bm www.everydaylinuxuser.com

meld

As u die wget-opdrag in die agtergrond uitvoer, sal u nie enige van die normale boodskappe wat dit na die skerm stuur, sien nie.

U kan al die boodskappe wat na 'n logbestand gestuur word, ontvang sodat u op enige tyd met die stertbevel vordering kan maak.

Om inligting uit die wget-opdrag na 'n logbestand uit te voer, gebruik die volgende opdrag:

wget -o / path / to / mylogfile www.everydaylinuxuser.com

Die omgekeerde, natuurlik, is om glad nie te teken nie en geen uitset na die skerm. Om alle uitvoer uit te skakel, gebruik die volgende opdrag:

wget -q www.everydaylinuxuser.com

Laai af vanaf verskeie webwerwe

U kan 'n insetlêer opstel om van baie verskillende webwerwe af te laai.

Maak 'n lêer oop met jou gunsteling-redakteur of selfs die katopdrag en begin bloot die werwe of skakels om van elke lyn van die lêer af te laai.

Stoor die lêer en voer dan die volgende wget-opdrag uit:

wget -i / path / to / inputfile

Afgesien van die opbou van jou eie webwerf of om iets te laai om te lees op die trein, is dit onwaarskynlik dat jy 'n hele webwerf wil aflaai.

U sal waarskynlik 'n enkele URL met beelde aflaai of dalk lêers soos zip-lêers, ISO-lêers of prentlêers aflaai.

Met die oog daarop wil jy nie die volgende in die insetlêer tik soos dit tydrowend is nie:

As jy weet dat die basis-URL altyd dieselfde sal wees, kan jy net die volgende spesifiseer in die insetlêer:

U kan dan die basis-URL as deel van die wget-opdrag soos volg verskaf:

wget -B http://www.myfileserver.com -i / path / to / inputfile

Herstel opsies

As jy 'n tou lêers opstel om in 'n insetlêer te laai en jy laat die hele nag hardloop om die lêers te laai, sal jy redelik geïrriteerd wees as jy die oggend afkom om vas te stel dat dit op die eerste lêer vasgekeer het en het die hele nag weer probeer.

U kan die aantal retries spesifiseer met die volgende skakelaar:

wget -t 10 -i / path / to / inputfile

U kan die bogenoemde opdrag gebruik in kombinasie met die -T skakel wat u toelaat om 'n time-out in sekondes soos volg te spesifiseer:

wget -t 10 -T 10 -i / path / to / input file

Bogenoemde opdrag sal 10 keer weer probeer en sal probeer om 10 sekondes vir elke skakel in die lêer aan te sluit.

Dit is ook taamlik irriterend as jy net 75% van 'n 4 gigabyte lêer op 'n stadige breëbandverbinding gedeeltelik afgelaai het vir jou verbinding om uit te skakel.

U kan wget gebruik om weer te probeer van waar dit gestop het met die volgende opdrag:

wget-c www.myfileserver.com/file1.zip

As jy 'n bediener hamer, kan die gasheer dit nie te veel hê nie en kan jy jou versoeke blokkeer of doodmaak.

U kan 'n wagperiode spesifiseer wat spesifiseer hoe lank om te wag tussen elke herwinning soos volg:

wget -w 60 -i / path / to / inputfile

Bogenoemde opdrag sal 60 sekondes wag tussen elke download. Dit is handig as jy baie lêers aflaai vanaf 'n enkele bron.

Sommige webgashere kan egter die frekwensie raak en sal u in elk geval blokkeer. Jy kan die wagtydperk ewekansig maak om te laat lyk of jy nie 'n program soos volg gebruik nie:

Wget - Random-Waiting -i / path / to / inputfile

Beskerm aflaai limiete

Baie internetdiensverskaffers gebruik steeds aflaai perke vir jou breëbandgebruik, veral as jy buite 'n stad woon.

U kan 'n kwota byvoeg, sodat u die aflaai limiet nie blaas nie. Jy kan dit op die volgende manier doen:

wget -q 100m -i / path / to / inputfile

Let daarop dat die -q-opdrag nie met 'n enkele lêer sal werk nie.

So as jy 'n lêer wat 2 gigabytes in grootte is, aflaai, sal -q 1000m nie die lêer aflaai nie.

Die kwota word slegs toegepas wanneer rekursief afgelaai word vanaf 'n webwerf of wanneer 'n insetlêer gebruik word.

Kry deur sekuriteit

Sommige webwerwe vereis dat u inteken om toegang te kry tot die inhoud wat u wil aflaai.

U kan die volgende skakelaars gebruik om die gebruikersnaam en wagwoord te spesifiseer.

wget --user = jou gebruikersnaam - paswoord = jou paswoord

Nota op 'n veelgebruikersstelsel as iemand die ps-bevel bestuur, sal hulle jou gebruikersnaam en wagwoord kan sien.

Ander aflaaiopsies

By verstek sal die skakelaar -r rekursief die inhoud aflaai en sal dopgehou skep soos dit gaan.

U kan al die lêers aflaai om na 'n enkele vouer te laai deur die volgende skakelaar te gebruik:

wget -nd -r

Die teenoorgestelde hiervan is om die skep van dopgehou te dwing wat bereik kan word deur die volgende opdrag te gebruik:

wget -x -r

Hoe om sekere lêertipes te laai

As u rekursief van 'n werf wil aflaai, maar u slegs 'n spesifieke lêertipe wil aflaai soos 'n mp3 of 'n prent soos 'n png, kan u die volgende sintaksis gebruik:

wget -A "* .mp3" -r

Die omgekeerde hiervan is om sekere lêers te ignoreer. Miskien wil jy nie uitvoerbare programme aflaai nie. In hierdie geval gebruik jy die volgende sintaksis:

wget -R "* .exe" -r

Cliget

Daar is 'n Firefox-byvoeging genoem cliget. U kan dit by Firefox op die volgende manier byvoeg.

Besoek https://addons.mozilla.org/en-US/firefox/addon/cliget/ en klik die "Add to Firefox" -knoppie.

Klik die installeerknoppie wanneer dit verskyn. Jy sal nodig hê om Firefox weer te begin.

Om cliget te gebruik, besoek 'n bladsy of lêer wat u wil aflaai en regsklik. 'N Konteksmenu sal verskyn genaamd cliget en daar sal opsies wees om te "copy to wget" en "copy to curl".

Klik op die "kopieer na wget" opsie en maak 'n terminaal venster oop en klik regs en plak. Die toepaslike wget opdrag sal in die venster geplak word.

Basies, dit spaar jou om die opdrag self te tik.

opsomming

Die wget bevel as 'n groot aantal opsies en skakelaars.

Dit is dus die moeite werd om die handleiding vir wget te lees deur die volgende in 'n terminale venster te tik:

man wget