Muss ich das alles eintippen? - HTTP und WWW

Grundfrage

Muss ich bei einer Internetadresse eigentlich immer "http://" und "www" eingeben oder kann man das auch weglassen?



Kurzfassung für Eilige

Nein, diese beiden Dinge müssen in der Regel nicht eingegeben werden. "http" ist der Standard im Browser, "www" ist auf dem Zielserver ebenfalls als Default (Standardeinstellung) eingestellt. Insofern kann man getrost z.B. "google.de" eintippen und der Browser und Zielserver machen daraus automatisch "http://www.google.de"


Langfassung für wirklich Interessierte

Das "HTTP"

Die Datenübertragung im Internet erfolgt über ein spezielles Protokoll, dem sog. "Hypertext Transfer Protocol", bekannt nach seiner Abkürzung "HTTP". Das HTTP wird verwendet, um alles, was eine Webseite so braucht (Text, Bilder, etc) zu übertragen.
Eine Variante von HTTP ist HTTPS, eine verschlüsselte Variante von HTTP (siehe Artikel zum Thema Verschlüsselung).

Doch wenn HTTP ohnehin der Standard im Internet ist, warum ist es dann Bestandteil einer Internetadresse wie "http://www.google.de"? Ganz einfach: der Browser kann neben HTTP und HTTPS - allein dafür muss man es ja schon angeben - noch weitere Protokolle verarbeiten. Das vorangestellte HTTP(S) bei einer Adresse sagt dem Browser also, was er zu verwenden hat.

Für Dateidownloads im Internet wird dagegen oft das sog. "File Transfer Protocol" (FTP) verwendet. Dieses Protokoll spezialisiert sich auf schnellen, sicheren Datentransfer ausschließlich von Dateien.

Theoretisch kann man dem Browser beliebig viele Protokolle beibringen. Die Kommunikationssoftware "Skype" richtet zum Beispiel ein eigenes Protokoll "skype://" ein. Steht im Code einer Webseite nun ein Link mit "skype://1234567890", dann weiß der Browser, dass er diese Telefonnummer an das Programm Skype übergeben muss. Dieses ruft dann die Nummer an. 
Ein Standard-Protokoll ist auch "mailto", das dafür sorgt, dass sich beim Anklicken von E-Mailadressen auf einer Webseite das Mailprogramm öffnet.

Der Browser kennt also viele verschiedene Protokolle, trotzdem bleibt HTTP der Standard. Aus diesem Grund muss man das Protokoll auch nicht in die Adresszeile eingeben, zumindest solange man beim klassischen HTTP bleibt. Denn dann ergänzt der Browser das ganz von allein. 

Übrigens: das "://" zwischen Protokoll und Adresse dient nur zur klaren Abgrenzung, denn "http.www.google.de" hätte eine andere Bedeutung.

Tipp: HTTPS ist durch die Verschlüsselung der Verbindung immer die bessere Variante. Browser-Erweiterungen wie "HTTPS Everywhere" erlauben es dabei weiterhin faul zu sein - und das Protokoll nicht eintippen zu müssen - weil es automatisch aus HTTP immer HTTPS macht.

Das "WWW"

Eine Internetadresse besteht aus mehreren Teilen. Um das Protokoll haben wir uns bereits gekümmert. Der Rest besteht aus dem Schema <subdomain>.<domain>.<top level domain>.

Top Level Domains - TLD
Fangen wir hinten an. Die Top Level Domain (TLD) ist der Teil, der auf ein Land verweist (country code TLD), beispielsweise .de für Deutschland, .at für Österreich oder .ch für die Schweiz. 

Parallel dazu gibt es spezifische Domains für bestimmte Themen wie z.B. .com für "commercial", diese Domain wird also für Geschäftszwecke verwendet. .edu stellt eine spezifische TLD für Bildungseinrichtungen wie Universitäten dar. 

In jüngster Zeit kann jeder neue TLDs beantragen, im Laufe der kommenden Jahre werden v.a. Firmen ihre ganz eigenen TLDs bekommen, darunter Google (.google), TUI (.tui) und BMW (.bmw, .mini).

First Level Domain ("die Domain")
Vor der TLD ist der Domainname zu finden, üblicherweise ein Eigenname. Das können Produkte sein (tennissocken.de), Firmennamen (google.de) oder Dienstleistungen und Datenbanken (wikipedia.de). 

TLD und Domain sind das absolute Minimum, damit eine gültige Internetadresse vorliegt. 


Second Level Domain - die Subdomain
Neben Domainname und TLD gibt es noch einen weiteren Teil, die sog. Subdomain. Das ist ein Prefix zu der eigentlichen Domain, wie z.B. "www.google.de" oder - wie bei diesem Blog hier - "understand-technology.blogspot.com". Das DNS kümmert sich aber nicht um diesen Teil der Adresse, das macht der Webserver.


Das Domain Name System - DNS
Browser und Server finden sich im Internet aber nicht auf Basis von Namen sondern - wie bei Allem in der Computerwelt - über Zahlen. Jede an das Internet angeschlossene Maschine hat dabei eine eindeutige sog. "IP-Adresse". Das sind 4 Zahlen von 0-255, die mit Punkten getrennt werden, z.B. 12.123.123.23. 

Die Übersetzung der eingegebene Internetadresse wie "amazon.de" in eine IP-Adresse erfolgt über sog. DNS-Server. Das DNS steht dabei für "Domain Name Systen", vereinfacht gesagt ist es nichts anderes als eine lange Liste von IP-Adressen und ihre entsprechenden (menschenlesbaren) Webadressen.



Das Telefonnetz funktioniert übrigens ganz ähnlich, denn auch hier muss stets bekannt sein, welches Gerät - bzw. welcher Anschluss - zu welcher Rufnummer gehört. Mit Handies geht es sogar noch einen Schritt weiter, denn hier muss man zusätzlich noch wissen, an welcher Sendestation es grade angemeldet ist.

Wenn man also eine Adresse aufruft wie "understand-technology.blogger.com", dann sagt das DNS dem Browser nur, unter welcher IP-Adresse er "blogger.com" findet. Der Browser schickt dann die vollständige Adresse an diesen Server und blogger.com. Dieser findet intern heraus, was er tun muss und liefert dann das korrekte Blog aus. Der Server hat also eine Art internes Register.

Wenn keine Subdomain angegeben wird haben Webserver i.d.R. einen Standard eingestellt. Intern wird "leer" also z.B. genauso behandelt, als ob jemand "www" eingegeben hätte. "blogger.com" und "www.blogger.com" sind also identisch, solange der Server entsprechend eingestellt ist. Praktischerweise sind das aber fast alle Webserver, so dass man getrost das "www" weglassen kann.


Zusammengefasst

Solange man im Internet ganz normal surft und Seiten aufruft ist das Protokoll HTTP der Standard, man kann also darauf verzichten, das vor einer Adresse einzugeben.
Tippfaule können zudem auch das "www" weglassen, weil ein Seitenaufruf genauso behandelt wird, als wenn man es eingegeben hätte. 
Für den seltenen Fall, dass ein Server nicht so konfiguriert ist, bekommt man eine Fehlermeldung und muss es dann eben doch eintippen.


Wer noch mehr über das Internet wissen will:
Opa, wie funktioniert das Internet?. Das Buch erklärt das Internet und wie all die Server, Router und Kabel  zusammenspielen in Dialogen zwischen Opa und Enkel.

Keine Kommentare:

Kommentar veröffentlichen