Краток вовед во кодирање URL

URL на веб страната, исто така попозната како "адреса на веб-страница", е она што некој ќе влезе во веб-прелистувач за да пристапи на одредена веб-страница. Кога пренесувате информации преку URL-то, треба да бидете сигурни дека користи само специфични дозволени знаци. Овие дозволените знаци вклучуваат алфабетски знаци, броеви и неколку специјални знаци кои имаат значење во низата URL. Сите други знаци кои треба да се додадат на URL-то треба да бидат кодирани така што тие не предизвикуваат проблеми за време на патувањето на прелистувачот за да ги лоцираат страниците и ресурсите што ги барате.

Кодирање URL

Најчесто кодираниот знак во URL-тоната е знак. Овој лик го гледате секогаш кога ќе видите знак за плус (+) во URL-то. Ова претставува просторен карактер. Знакот плус дејствува како посебен карактер кој го претставува тој простор во URL-то. Највообичаен начин што ќе го видите ова е во врска со mailto, која вклучува предмет. Ако сакате субјектот да има празни места во него, можете да ги кодирате како плус:

mailto: email? subject = this + is + my + subject

Овој дел од кодирачкиот текст би пренел предмет на "ова е мојот предмет". Знакот "+" во кодирањето ќе биде заменет со вистински <празно место> кога ќе биде прикажан во прелистувачот.

За кодирање на URL-то, едноставно ги заменувате специјалните знаци со низата за кодирање. Ова скоро секогаш ќе започне со% карактер.

Кодирање URL

Строго кажано, секогаш треба да ги кодирате сите специјални знаци кои се наоѓаат во URL-то. Една важна белешка, во случај да се чувствувате малку исплашена од сето ова разговор или кодирање, е дека вообичаено нема да пронајдете специјални знаци во URL-то надвор од нивниот нормален контекст, освен со податоци за форма.

Повеќето URL адреси ги користат едноставните знаци кои секогаш се дозволени, така што воопшто нема кодирање.

Ако поднесете податоци до CGI скрипти користејќи го методот GET, треба да ги кодирате податоците како што ќе бидат испратени преку URL-то. На пример, ако пишувате врска за да промовирате RSS фид , URL-то ќе мора да биде кодирано за да го додадете во URL-то на скрипта на која го промовирате.

Што треба да се кодира?

Секој карактер што не е азбучен карактер, број или специјален карактер кој се користи надвор од неговиот нормален контекст, ќе треба да биде кодиран на вашата страница. Подолу е прикажана табела со обични ликови што може да се најдат во URL-то и нивното кодирање.

Кодирање URL на задржани ликови

Карактер Цел во URL-то Кодирање
: Одделен протокол (http) од адреса % 3B
/ Посебен домен и директориуми % 2F
# Одделни сидра % 23
? Одделна низа за пребарување % 3F
& & Одделни елементи за пребарување % 24
@ Одделно корисничко име и лозинка од доменот % 40
% Укажува кодиран карактер % 25
+ Укажува простор % 2B
Не се препорачува во URL-то % 20 или +

Забележете дека овие кодирани примери се различни од она што го наоѓате со специјални карактери на HTML . На пример, ако треба да кодирате УРЛ со амперсанд (&) знак, би користеле% 24, што е прикажано во горната табела. Ако пишувате HTML и сакавте да додадете амперсанд на текстот, не можете да користите% 24. Наместо тоа, би користеле или "& amp;"; или "& # 38;", кои ќе ги напишат & и во HTML-страницата кога ќе бидат прикажани. Ова може да изгледа збунувачки во почетокот, но во основа е разликата помеѓу текстот што се појавува на самата страница, која е дел од HTML кодот и URL низата, која е посебен ентитет и затоа е предмет на различни правила.

Фактот дека карактерот "&", како и многу други ликови, може да се појави во секоја не треба да ве збуни со разликите меѓу двете.

Авторски напис од Џенифер Крајнин. Уредено од Џереми Жирар.