Meta Charset Tag in HTML5

Stel karakterkodering in HTML5

Voordat HTML5 bekendgestel is, stel die karakterkodering op 'n dokument op met 'n element wat jy nodig het om die ietwat verborge lyn hieronder te skryf. Dit is die Meta Charset-elemente as u HTML4 in u webblad gebruik:

Wat belangrik is om te merk in hierdie kodeer die aanhalingstekens wat u sien rondom die inhoud attribuut: inhoud = " text / html; charset = iso-8859-1 " . Soos alle HTML-eienskappe, definieer hierdie aanhalingstekens die waarde van die kenmerk, wat aandui dat die hele string teks / html; charset = iso-8959-1 is die inhoud van hierdie element. Dit is behoorlike HTML en dit is hoe hierdie string geskryf moes word. Dit is ook onwrikbaar lank en lelik! Dit is ook nie iets wat jy waarskynlik van die bokant van jou kop sal onthou nie! In die meeste gevalle sal webontwikkelaars hierdie kode van een webwerf moet kopieer en plak in 'n nuwe een wat hulle ontwikkel omdat dit baie van die begin af skryf.

HTML5 sny die ekstra dinge uit & # 34;

HTML5 het nie net 'n aantal nuwe elemente by die taal bygevoeg nie , maar dit het ook baie van die sintaksis van HTML, insluitend die Meta Charset element, vereenvoudig. Met HTML5 kan jy jou karakterkodering voeg met die baie makliker om sintaksis vir die META- element te onthou wat jy sien hieronder:

Vergelyk die vereenvoudigde sintaksis met wat ons aan die begin van hierdie artikel geskryf het, die ou sintaks wat gebruik word vir HTML4, en jy sal sien hoeveel makliker om te skryf en onthou dat die HTML5-weergawe werklik is. In plaas daarvan om dit van 'n bestaande werf te kopieer en te plak in enige nuwe een waarmee jy gewerk het, is dit absoluut iets wat jy as 'n voorste webontwikkelaar kan onthou. Hierdie besparing van tyd baie is nie veel nie, maar as jy die ander sintaksareas wat HTML5 vereenvoudig, oorweeg, voeg die spaargeld by!

Sluit altyd die karakterkodering in

Jy moet altyd karakterkodering vir jou webblaaie insluit, selfs al wil jy nooit enige spesiale karakters gebruik nie. As jy nie 'n karakterkodering insluit nie, word jou werf kwesbaar vir 'n kruiswerf-skripaanval met UTF-7.

In hierdie scenario sien anattacker dat jou webwerf geen karakters vir die kodering het gedefinieer nie, dus word die blaaier getref om te dink dat die karakterkodering van die bladsy eintlik UTF-7 is. Vervolgens spuit die aanvaller UTF-7-gekodeerde skrifte in die webblad en jou werf word gehack. Dit is natuurlik problematies vir almal wat betrokke is, van jou maatskappy tot jou besoekers. Die goeie nuus is dat dit 'n eenvoudige probleem is om te vermy. Maak seker dat jy karakterkodering by al jou webblaaie voeg.

Waar om karakters te voeg

Die karakterkodering vir 'n webblad behoort die eerste reël van jou HTML se element te wees. Dit verseker dat die leser weet wat die karakterkodering is voordat dit enigiets anders op die bladsy doen as om die doktipe te bepaal en te identifiseer dat dit 'n HTML bladsy. Jou HTML moet lees:

...

Gebruik HTTP Headers vir ekstra sekuriteit

U kan ook die karakterkodering in die HTTP-opskrifte spesifiseer. Dit is selfs veiliger as om dit op die HTML-bladsy te voeg, maar jy sal toegang hê tot die bedienerkonfigurasies of .htaccess-lêers. Dit beteken dat jy dalk moet werk met jou webwerf se gasheerverskaffer om hierdie soort toegang te verkry of te maak Die veranderinge vir jou. Toegang is regtig die uitdaging hier. Die verandering self is eenvoudig, so 'n diensverskaffer moet hierdie verandering vir jou relatief maklik kan maak.

As uApache gebruik, kan u die standaard karakters stel vir u hele werf deur: AddDefaultCharset UTF-8 by te voeg na u wortel .htaccess- lêer. Apache se standaardkarakter is ISO-8859-1 .