Kan man ha ÅÄÖ i Domännamn? Här är Svaret!

En fråga som många svenskar som ska registera ett domännamn har är om man kan ha bokstäverna åäö i domännamnet.

Svaret på den frågan är ja! Men så har det inte alltid varit. I denna artikel går vi igenom allt du behöver veta om speciella bokstäver i domännamn.

Internationaliserade domännamn, på engelska internationalized domain names (IDN) är domännamn som antingen:

skrivs på språk/skript med latinska bokstäver med diakritiska tecken (accentertecken som å eller ö) eller
inte använder det latinska alfabetet alls

IDN:er tillåter personer som talar icke-latinbaserat skript som modersmål att komma åt Internet på sitt eget språk, men också länder som har bokstäver som inte finns i det vanliga alfabetet. Däribland bokstäverna åäö.

Eftersom internetanvändningen ökar runt om i världen och världen är full av många olika språk och skript (kinesiska är det mest talade språket!), erbjuder IDN:er ett utmärkt sätt att få kontakt med din målgrupp oavsett vilket språk de talar. Och det kan vara relevant för dig att behöva använda åäö i vissa fall om du ska sätta upp en svensk hemsida.

Många språk använder tecken som inte ingår i ASCII, standardteckenuppsättningen som stöds av alla datorer. Dessa språk kräver användning av Unicode för att visa tecken som krävs för det språket, som accenttecken på franska, åäö på svenska, eller de tecken som används på kinesiska. Det är ofta möjligt att använda den utökade Unicode-teckenuppsättningen när du registrerar ett domännamn, antingen i din unika valda domän eller i någon av de många tillgängliga internationaliserade tilläggen.

Du kan få ett internationaliserat domännamn att fungera i ett system som inte stöder Unicode genom att använda punycode-versionen av ditt domännamn. Punycode konverterar de internationella tecknen till ASCII-tecken på ett sätt som är läsbart av alla system. Ett punycode-domännamn börjar alltid med xn– för att signalera att domännamnet använder punycode.

Vad är ett internationaliserat domännamn (IDN)?

Fram till 2003 fick domännamn endast bestå av bokstäver från det latinska alfabetet, siffrorna 0 till 9 och ett bindestreck.

Dessa begränsade alternativ kan förklaras genom att titta närmare på domännamnssystemet (DNS). Tjänsten, som också ansvarar för att översätta webbadresser till IP-adresser, fungerar på ett namnschema som är baserat på American Standard Code for Information Interchange (ASCII). Detta system är mestadels byggt på engelskspråkiga tangentbord och är inte särskilt representativt för ett internationellt projekt som internet.

För att kompensera för denna stora nackdel togs ett system kallat Internationalizing Domain Names in Application (IDNA) i drift. Målet med denna mekanism är att definiera en standardiserad översättning från Unicode till ASCII, vilket gör det möjligt att visa tecken från alla kända alfabet i internetdomäner.

Redan i mitten av 1990-talet, i början av globaliseringen av Internet, började ingenjörer av Domain Name System (DNS) utveckla de protokoll som krävs för internationaliseringen av domännamn. Processen är komplicerad eftersom den delvis bygger på translitterationen av en sekvens av icke-ASCII-tecken till en sekvens av ASCII-tecken, föregås av prefixet ”xn--” (kallat ”ACE-prefix”). Efter några försök godkändes ett protokoll utvecklat av Internet Engineering Task Force (IETF) av Internet Engineering Steering Group (IESG) (RFC 5890, ISSN 2070-1721). För det första gjordes internationaliserade domännamn tillgängliga och för det andra toppdomäner. Idag tillåter tekniken att domännamn registreras i formen idn.idn.

IDNA anses vara en av de största revolutionerna i internets historia. Det här nya systemet är särskilt användbart för personer som använder asiatiska, afrikanska eller arabiska teckensystem. Givetvis också svenska för den delen, även om de allra flesta alrdig behöver använda åäö i sina domännamn.

Teoretiskt sett kan varje Unicode-text användas i ett internationaliserat domännamn. I praktiken kan dock domänregister individuellt bestämma vilka specialtecken som kan användas för registrering. Urvalet tenderar att variera, eftersom domänregister individuellt kan bestämma vilka specialtecken som kan användas för registrering. Det betyder att symbolerna skiljer sig åt beroende på vilken toppdomän (t.ex. .com, .mx, .ca, etc.) som används.

Hur fungerar IDNA?

Mycket av internets infrastruktur stöds endast av ASCII-teckenuppsättningen. Och för att säkerställa att dessa internationaliserade namn kan bearbetas, kan varje IDN som är tillgängligt i Unicode översättas till en ACE-sträng, som är baserad på ASCII. Efter detta visas webbadresser med tecken med accenter eller omljud; servern, å andra sidan, fortsätter att behandla adresserna som ASCII-kompatibla. Dessa processer specificeras i memon IDNA2003 och IDNA2008. Översättning från Unicode till ASCII sker på klientsidan och baseras på en standardiserad kodningsprocess som kallas Punycode.

Punycode

Den RFC 3492-standardiserade Punycoden utvecklades för att tydligt visa Unicode-teckensträngar utan kvalitetsförlust till ASCII-symboler. Alla icke-ASCII-tecken tas bort från domännamnet, kodas och separeras med ett bindestreck. Denna kodsekvens innehåller information om Unicode-symbolen i fråga samt dess position i domännamnet. Dessutom monteras varje ACE-sträng som skapas på detta sätt med prefixet xn i början; detta klargör för läsaren att teckensekvensen är IDN-kodad enligt IDNA och Puny kodningsstandarder.

Skillnader mellan IDNA2003 och IDNA

För den ursprungliga proceduren från 2003 normaliserades internationaliserade webbadresser före Punycode-kodning med nameprep-metoden. Denna metod ändrade stora bokstäver till gemener, tog bort kontrolltecken och överförde motsvarande tecken till en enhetlig form. Nameprep togs bort från denna process med introduktionen av IDNA2008. Nu specificerar IDNA ingen normalisering; istället rekommenderar den en algoritm som omvandlar stora bokstäver till gemener.

En internationaliserad toppdomän är inte nödvändigtvis översättningen eller translitterationen av en ASCII ccTLD. En internationaliserad toppdomän kan faktiskt också vara en generisk toppdomän, identisk med ett generiskt ord. 2012, när ICANN efterlyste nya gTLD:er, fick den över 100 förfrågningar om internationaliserade generiska tillägg. Till exempel finns .com i flera andra skript som .คอม (Thai), .कॉम (Hindi), .كوم (arabiska) och .ком (ryska).

En internationaliserad toppdomän kan också spegla ett varumärkes-TLD. Eftersom det engelska språket dominerar affärsvärlden finns det relativt få internationaliserade varumärkes-TLD:er.

Vissa marknader är dock tillräckligt stora och/eller strategiska för att övertyga företag att förvärva ett internationaliserat varumärkes-TLD. På så sätt skickar företag sina marknadsföringsbudskap på målkonsumentens språk. Denna kommersiella strategi är baserad på varumärkenas existensberättigande: förmågan att identifiera produkters ursprung. Detta är till exempel fallet med följande toppdomäner:.大众 汽车 (.Volkswagen, på kinesiska).飞利浦 (Philips, på kinesiska).谷 歌 (.Google, på kinesiska).诺基亚 (Nokia, på kinesiska) och.亚马逊 /.ア マ ゾ ン (.Amazon, på kinesiska respektive japanska)

Vissa företag, vars historiska huvudkontor ligger i ett land där skriftsystemet skiljer sig från det latinska systemet, har förvärvat internationaliserade varumärkes-TLDs. Detta är särskilt fallet med kinesiska företag som Weibo (. 微 博, på kinesiska), PCCW (. 電訊 盈科, på kinesiska) och CITIC Group (. 中信, på kinesiska), Hongkong-företag som Shangri-la Hotels and Resorts (.香格里拉, på kinesiska) och Kerry Logistics (. 嘉 里), det singaporska företaget Temasek (. 淡 马 锡, på kinesiska), det saudiska företaget Aramco (.ارامكو) eller det koreanska företaget Samsung (. 삼성, i koreanska).

Lämna en kommentar