Beknopte Inleiding tot URL-kodering

'N Webwerf se URL , wat ook algemeen bekend staan ​​as die "webwerfadres", is wat iemand in 'n webblaaier gaan betree om toegang tot 'n spesifieke webwerf te verkry. As jy inligting deur 'n URL slaag, moet jy seker maak dat dit slegs spesifieke toegelate karakters gebruik. Hierdie toegelate karakters bevat alfabetiese karakters, syfers en enkele spesiale karakters wat betekenis het in die URL-string. Enige ander karakters wat by 'n URL gevoeg moet word, moet gekodeer word sodat hulle nie probleme ondervind tydens die leser se reis om die bladsye en hulpbronne wat jy soek, te vind nie.

Kodering van 'n URL

Die mees gekodeerde karakter in URL-string is die -karakter. Jy sien hierdie karakter wanneer jy 'n plus-teken (+) in 'n URL sien. Dit verteenwoordig die spasie-karakter. Die plus teken dien as 'n spesiale karakter wat daardie spasie in 'n URL verteenwoordig. Die mees algemene manier waarop jy dit sal sien, is in 'n mailto-skakel wat 'n onderwerp insluit. As jy die onderwerp wil hê om spasies daarin te hê, kan jy dit as pluspunte enkodeer:

mailto: email onderwerp = hierdie + is + my + onderwerp

Hierdie bietjie koderende teks sal 'n onderwerp van "hierdie is my onderwerp" oordra. Die "+" karakter in die kodering sal vervang word met 'n werklike wanneer dit in die blaaier gelewer word.

Om 'n URL te enkodeer, vervang jy die spesiale karakters met hul enkoderingstring. Dit sal byna altyd met 'n% karakter begin.

Kodering van 'n URL

Streng gesproke moet jy altyd enige spesiale karakters wat in 'n URL gevind word, enkodeer. Een belangrike noot, as jy 'n bietjie geïntimideer word deur al hierdie praatjies of enkodering, is dat jy gewoonlik geen spesiale karakters in 'n URL buite hul normale konteks sal vind nie, behalwe met vormdata.

Die meeste URL's gebruik die eenvoudige karakters wat altyd toegelaat word, dus hoef geen enkodering nodig te wees nie.

As u data aan CGI- skripte deur die GET-metode inlewer, moet u die data kodeer soos dit oor die URL gestuur sal word. Byvoorbeeld, as jy 'n skakel skryf om 'n RSS-feed te bevorder, moet jou URL geënkodeer word om by die script-URL te voeg waarop jy dit bevorder.

Wat moet gekodeer word?

Enige karakter wat nie 'n alfabetiese karakter, 'n nommer of 'n spesiale karakter is wat buite die normale konteks gebruik word nie, moet in u bladsy geënkodeer word. Hieronder is 'n tabel met algemene karakters wat in 'n URL en hul enkodering gevind kan word.

Resepte karakters URL-kodering

Karakter Doel in URL enkodering
: Afsonderlike protokol (http) van adres % 3B
/ Afsonderlike domein en dopgehou % 2F
# Afsonderlike ankers % 23
? Afsonderlike navraag string % 3F
& Afsonderlike navraag elemente % 24
@ Skei gebruikersnaam en wagwoord van domein % 40
% Dui 'n gekodeerde karakter aan % 25
+ Dui 'n spasie aan % 2B
Nie aanbeveel in URL's % 20 of +

Let daarop dat hierdie gekodeerde voorbeelde verskil as wat jy met HTML spesiale karakters kry . As u byvoorbeeld 'n URL met 'n ampersand (&) karakter moet koder, gebruik u% 24, wat in die tabel hierbo vertoon word. As u HTML uitskryf en u 'n ampersand by die teks wou voeg, kon u nie% 24 gebruik nie. In plaas daarvan sou jy óf "& amp;" gebruik; of "& # 38;", wat beide die & in die HTML-bladsy sal uitskryf wanneer dit gelewer word. Dit kan aanvanklik verwarrend wees, maar dit is basies die verskil tussen die teks wat op die bladsy self verskyn, wat deel uitmaak van die HTML-kode en die URL-string, wat 'n afsonderlike entiteit is en dus onderhewig is aan verskillende reëls.

Die feit dat die "&" karakter, sowel as baie ander karakters in elkeen voorkom, moet nie verwar word met die verskille tussen die twee nie.

Oorspronklike artikel deur Jennifer Krynin. Geredigeer deur Jeremy Girard.