Einführung ins Internet

für den Philologenverband Region Heidelberg

am 26.02.1997

Michael Hebgen
Universitätsrechenzentrum
Im Neuenheimer Feld 293
69120 Heidelberg

Email: michael.hebgen@urz.uni-heidelberg.de

Dieser Vortrag ist online über Internet/WWW verfügbar unter der Adresse

http://www.rzuser.uni-heidelberg.de/~x02/phv.html


1. Elektronische Kommunikation

Um elektronisch kommunizieren zu können, braucht man im einfachsten Fall zwei Computer, die durch eine Leitung miteinander verbunden sind - genauso wie man zum Telefonieren mindestens zwei Telefonapparate benötigt, die beide am Telefonnetz hängen.

Und genauso, wie es für den Transport von Schallwellen von einem Fernsprechpartner zum anderen verschiedene Möglichkeiten gibt, existieren auch bei Computern verschiedene Arten, wie man Zeichen senden und empfangen kann. Der Fachausdruck für eine dieser Arten, Zeichen von einem Rechner zum anderen zu transportieren, heißt Protokoll.

Das Protokoll erfüllt eine Transportfunktion für digitale Daten, die sehr viele Teilaufgaben beinhalten.Es ist dazu da, eine möglichst sichere Übertragung von Bytes (Speicherplatz für ein Zeichen) zu gewährleisten. Auch muß es dafür sorgen, daß gesendete Daten den Empfänger finden, es wählt die entsprechende Route durch den Dschungel von Netzwerkrechnern. Werden Computer unterschiedlicher Bauart und mit unterschiedlichen Betriebssystemen miteinander verbunden, so gibt das Protokoll darauf acht, das die Zeichendarstellungen des einen Systems in die des anderen Systems übersetzt werden.

2. Was ist Internet?

Internet ist ein die ganze Welt umspannendes Computernetzwerk mit einem fast unbegrenzten Angebot an Software, Diskussionspartnern und elektronisch gespeichertem Wissen. Die Größe des Internet läßt sich nur noch schätzen, man geht heute von mehr als 30 Millionen Rechnern, mehr als 100 Millionen Benutzer und Hunderte von Millionen an Informationsseiten aus.

Als Internet wird die Verbindung aller Rechner bezeichnet, die über das Protokoll TCP/IP miteinander kommunizieren. 1969 konstruierte das amerikanische Verteidigungsministerium (DoD, department of defense) ein Computernetz namens ARPANET (Advanced Research Projects Agency - Net), das 4 Computer miteinander verband. 1972 wurde es erstmals öffentlich präsentiert und viele US-amerikanischen Universitäten und Forschungseinrichtungen schlossen sich an das Netz an. Eine zweite Generation der Netzwerksoftware, bestehend aus einer ganzen Familie von Protokollen, wurde bis 1982 spezifiziert und entwickelt; zwei seiner Hauptelemente, das Transmission Control Protocol (TCP) und das Internet Protocol (IP) wurden zu einer "pars-pro-toto"-Bezeichnung für die gesamte Protokollfamilie.

Dabei wurde großer Wert darauf gelegt, daß TCP/IP von verschiedenen Rechnertypen "verstanden" wird. Alle Spezifikationen sind in allgemein und frei zugänglichen Dokumenten beschrieben, die als RFCs (Request For Comment) bezeichnet werden und an verschiedenen Stellen im Netzwerk gespeichert sind.

Das Internet präsentiert sich heute als Verbindung vieler, von verschiedenen Organisationen betriebener Teilnetze und wird daher auch als das Netz der Netze bezeichnet. Obwohl einzelne Organisationen bestimmte Aufgaben für das gesamte Internet erfüllen, gibt es doch keine Organisation, die für das Internet zuständig und verantwortlich ist.

Als Übertragungsmedien werden im Internet hauptsächlich Standleitungen (mit unterschiedlichen Kapazitäten), aber auch normale Wähl-Telefonleitungen oder ISDN oder Satelittenkommunikation verwendet; Standleitungen erlauben, daß die verbundenen Rechner ständig sende- und empfangsbereit sind. Während Wählleitungen oder ISDN eine Datentransferrate von bis zu 64 kbps (Kilobit/Sekunde - entspricht ca. 6-7.000 Zeichen pro Sekunde oder ungefähr 3 A4-Seiten Text), gibt es heute Festverbindungen mit bis zu 155 Mbps (Megabit/Sekunde - entspricht ca. 8.000 A4-Seiten Text pro Sekunde oder dem Übertragen von 3 Bibeln pro Sekunde).

Die einzelnen Leitungen stehen dabei nicht nur einer Verbindung zur Verfügung. Dadurch, daß die Informationen in klar definierte Pakete mit allen wichtigen Adressierungsinformationen verpackt sind, können mehrere Verbindungen gleichzeitig über eine Leitung bedient werden.

2.1 TCP/IP, Adressen, Routing

TCP/IP als Protokoll ist eigentlich nichts anderes als eine Sammlung von allgemein gültigen Regeln. Für (fast) alle Betriebssysteme gibt es Software, die diese Regeln in die eigenen übersetzen und umgekehrt. Neuere Betriebssysteme wie z.B. Unix, Windows 95, Windows NT oder Apple´s MacOS beinhalten TCP/IP als integralen Bestandteil des Systems.

Wenn zwei Computer miteinander kommunizieren wollen, so müssen sie den jeweils anderen auch identifizieren können. Alle Computer in einem Netzwerk müssen daher eine eindeutige Adresse haben - ähnlich wie beim Telefon. Unter TCP/IP besteht die Adresse aus einer Folge von 4 Zahlen zwischen 0 und 255, die durch Punkte voneinander getrennt sind. So stellt z.B. die Zahlenfolge

einen Rechner im Universitätsrechenzentrum Heidelberg dar. Um es für den Anwender leichter zu machen, haben die einzelnen Netzwerkrechner auch Namen, Domain Names genannt. Spezielle Programme, sogenannte Domain Name Server (DNS) übersetzen diese Namen in die eigentliche Zahlenadresse. So bezeichnet z.B.

einen Computer, der sich - wie das .de am Ende zeigt - in Deutschland befindet, und zwar in der Universität Heidelberg (.uni-heidelberg) im Universitätsrechenzentrum (.urz) und dort den Namen sun0 hat. Auf der höchsten Ebene gibt es für jedes Land einen Länderkode, z.B. fr für Frankreich, ch für Schweitz, uk für Großbritannien oder jp für Japan. Der Länderkode us für die Vereinigten Staaten von Nordamerika wird normalerweise nicht benutzt, innerhalb von Amerika wird die oberste Ebene nach Organisationsformen unterschieden, d.h. die Mitgliedsschaft in einer Domain basiert auf dem Typ von Organisation (kommerziell, militärisch usw.), zu der der Rechner gehört - z.B. com für kommerzielle, edu für schulische, gov für staatliche, mil für militärische oder net für NetzwerkOrganisationen.

Wenn man nun von seinem PC einen Rechner mit seinem Namen anspricht, muß der Weg zu diesem Rechner ermittelt werden - ähnlich wie beim Telefon, wenn ich von Heidelberg eine Nummer in San Franzisko wähle. Dies geschieht durch spezielle Netzwerkrechner, sogeannte Router, die sich dynamisch Informationen über die Route austauschen.

2.2 Grundlegende Netzdienste

Bisher wurde beschrieben, was das Internet ist, wie es aufgebaut ist und auf welche Art dabei Computer miteinander verbunden werden. Nun stellt sich die Frage, was man denn mit dem Internet im allgemeinen anfangen kann, d.h. welche Dienste es anbietet.

Für einige der im folgenden beschriebenen Dienste ist Voraussetzung, daß man auf einem Rechner eine Kennung (Projektnummer) besitzt - im Fall der elektronischen Post spricht man auch oft von einer Mailbox.

2.2.1 Electronic Mail

Elektronische Post ist wohl für die elektronische Kommunikation der wichtigste Netzdienst, man kann damit Nachrichten an Kommunikationspartner weltweit verschicken. Voraussetzung ist, daß man selbst und der Kommunikationspartner eine Kennung auf einem Rechner haben.

Der Aufbau eine Electronic Mail (E-Mail) entspricht dem eines normalen Briefs: Es gibt einen Briefkopf, der Adresse des Empfängers und des Absenders enthält, meist ein subject (Betreff), und die eigentliche Mitteilung. Einen bestimmten Benutzer an einem Rechner kann man anschreiben, indem man vor den Namen des Rechners die Kennung des Benutzers setzt und dazwischen ein @-Zeichen, z.B.

Elektronische Post wird normalerweise sofort zugestellt; falls der Zielrechner nicht erreichbar ist, wird i.a. 3 Tage lang versucht, die E-Mail auszuliefern, ansonsten kommt sie zurück mit dem Vermerk "konnte nicht ausgeliefert werden". Auf dem Zielrechner wird sie dann meist solange gespeichert, bis sie der Empfänger gelesen hat.

In WWW - siehe unten - gibt es elegante Möglichkeiten, wie man z.B.eine Mail an den Autor eines Dokuments einbinden kann: Mail an Michael Hebgen

2.2.2 Terminal Emulation (Telnet)

Die Idee, die hinter diesem etwas komplizierten Fachausdruck steckt, ist recht einfach. Mit Hilfe einer Terminalemulation ist es möglich, eine direkte Verbindung von dem PC oder Mac am Schreibtisch zu einem Host (Supercomputer, Großrechner, Unix Workstation usw.) herzustellen, wobei sich der PC/Mac wie ein Terminal verhält. Über die eigene Tastatur können Befehle an den Host eingegeben werden und die Ergebnisse sind dann am eigenen Bildschirm zu sehen. Normalerweise benötigt man auf dem Host eine Kennung und ein Password, das beim Anmelden überprüft wird.

Im wesentlichen gibt es 2 Arten von Terminals, die von den Hosts erwartet werden:

So betreibt z.Zt. die Universitatsbibliothek Heidelberg auf einem IBM Rechner das Bibliothekssystem HEIDI, zu dem man sich so durchschalten und in den Bibliothekskatalogen recherchieren kann.

2.2.3 Dateitransfer (FTP und anonymous FTP)

FTP (File Transfer Protocol) steht für die Übertragung von Daten von Hosts zu PC oder Mac und umgekehrt zur Verfügung. Es handelt sich dabei um einen definierten Satz von Befehlen, die von den unterschiedlichen Computern gleich interpretiert werden - so entspricht z.B. der FTP-Befehl zum Listen des Dateibestandes eines Verzeichnisses, egal welches Betriebssystem der Host verwendet, dem dir-Befehl von MS-DOS.

Mit dem Programm FTP kann man Files von einem Rechner auf einen anderen übertragen. Der Unterschied zwischen FTP und anonymous FTP besteht darin, daß man sich auf dem Zielrechner mit einer eigenen Kennung (Projektnummer und Passwort) oder mit der allgemeinen Benutzernummer anonymous anmeldet; im letzteren Fall wird man häufig aufgefordert, als Passwort die eigene Email-Adresse anzugeben. Das URZ betreibt einen eigenen anonymous FTP-Server mit dem Namen

Besonders zu beachten ist, daß FTP beim Übertragen eines Files einen evtl. schon vorhandenen File gleichen Namens ohne Rückfrage überschreibt.

2.3 Erweiterte Netzdienste

2.3.1 Listserv

Listserver sind spezielle Mail-Server, die Verteilerlisten für E-Mail verwalten, in die sich jeder Interessierte selbst ein- und austragen kann. Das URZ betreibt einen Listserver unter der Adresse

der mit anderen Listservern weltweit zusammenarbeitet. An den Listserver kann man E-Mail schicken mit dem Inhalt

2.3.2 NetNews

Im Gegensatz zum Listserver-Konzept, in dem jeder Teilnehmer einer Liste die Artikel/Programme als E-Mail zugeschickt bekommt, werden beim News-System alle Artikel aller Gruppen zentral auf einem Rechner für eine bestimmte Dauer gespeichert und können von jedem Benutzer - ohne vorherige Anmeldung am Server - über eigens dafür vorgesehene Programme, sogenannte NewsReader, gelesen und verschickt werden. Der Austausch von Daten zwischen dem Rechner, auf dem die Artikel gespeichert sind (Server), und dem Rechner, auf dem diese Artikel gelesen werden (Client), geschieht dabei über ein eigenes TCP/IP Protokoll namens NNTP (NetNews Transfer Protokoll).

Obwohl sich die einzelnen NewsReader oft sehr stark unterscheiden, haben jedoch alle einige wichtige Kommandos gemeinsam:

Die Anzahl der verschiedenen Diskussionsgruppen steigt ständig, z.Zt. sind es schon mehr als 10.000. Einige für Schulen interessante (aber sehr inaktive) Newsgruppen sind

2.3.3 Archie

Im Internet gibt es Hunderte von anonymous FTP-Servern mit Tausenden von Gigabytes an Software und Daten. Um in dieser Vielfalt von verteilten Servern noch etwas finden zu können, wurde Archie erfunden.

Archie ist eine Server, der in einer Datenbank die Verzeichnisse der anonymous FTP-Server führt und entsprechende Anfragen beantwortet. Dabei ist zu beachten, daß die Qualität der Antworten von Archie u.a. von den Betreibern der FTP-Server abhängt, wann und wie Sie Ihre Verzeichnisse aktualisieren.

Seit Beginn des Jahres 1996 betreibt das URZ für das Landesforschungsnetz BelWü einen eigenen Archie Server mit dem Namen

..... und dann gibt es noch das

3. World Wide Web (WWW)

WWW ist ein im Internet auf TCP/IP aufsetzendes Client-Server-Protokoll, um verteilte Dokumente zu suchen und bereitzustellen. Man mag sich fragen: "Gibt es nicht schon genug Netzdienste (Archie, FTP, Telnet, ...), warum jetzt auch noch WWW und was ist das Besondere daran?"

Nun, WWW versucht mittels Menueführung benutzerfreundlich zu sein. Die Menuepunkte sind, vereinfacht gesagt, logische Zeiger auf weitere Menues (Verzeichnisse), wobei am Ende jeder Zeigerkette der letztlich gesuchte Datenfile steht. Der Benutzer braucht sich überhaupt nicht den Kopf zu zerbrechen, wo in der WWW-Welt die Daten sich befinden. WWW vereinigt also die Daten aller öffentlichen WWW-Server zu einer einzigen, riesigen, verteilten Datenbank.

Darüberhinaus können Menuepunkte aber auch Telnet-Sitzungen oder Aufrufe von anonymous FTP sein, nach Volltexten lokal oder weltweit suchen, aus Archie- oder Gopher-Aufrufen (Gopher war eine Art "Vorgängermodell" von WWW) bestehen, zum Bearbeiten von E-Mail oder zum Lesen von News-Artikeln benutzt werden. Zusammenfassend heißt das, daß WWW nicht nur eine riesige weltweite Datenbank ist, sondern auch fast alle anderen Dienste unter einer Oberfläche integriert.

Außerdem bietet WWW auch noch neue Arten von Dokumenten an. Innerhalb eines Dokuments können Textattribute wie Fettdruck, Überschriften usw. angegeben werden, da die Dokumente in einer einheitlichen standardisierten Sprache HTML (Hypertext Mark Up Language) abgefaßt sind. Auch können innerhalb eines Dokuments Hyperlinks (Verweise) auf andere evtl. entfernte Dokumente vorkommen. Darüberhinaus können Dokumente mit Graphiken angereichert sein, was in manchen Fällen zusätzliche Information bedeutet. Neben den oben beschriebenen Dokumenten werden auch alle Formen von Multimedia unterstützt wie Bild, Bewegtbild und Ton - soweit die erforderliche Hard- und Software auf dem Client-Rechner vorhanden ist.

Als WWW-Clients werden in der Regel Netscape auf fast allen Plattformen angeboten, für Windows 95 und Windows NT setzt sich auch immer mehr der Internet Explorer von Microsoft durch.

Noch ein Hinweis: Da die WWW-Daten definitionsgemäß verteilt sind, kann das Übertragen von Dokumenten manchmal auch etwas länger dauern, insbesondere wenn aufwendige Graphik, Video- oder Ton-Daten enthalten sind.

3.1 WWW Hyperlinks (URL)

Mittlerweise dürften Sie sich fragen: "Wie sehen die Hyperlinks zu diesen wunderbaren Internetdiensten wohl aus?" Nun, dieses Thema wurde bisher ausgespart, weil sie nicht besonders "schön" oder benutzerfreundlich sind. Der korrekte Name für diese Links lautet URL (Uniform Resource Locators). Ein URL macht dem Web-Client folgende drei Angaben:

Ein typisches URL, bei dem alle drei Teile angegeben sind, sind also beispielsweise so aus:

Jeder Internetdienst im Web hat seinen eigenen Namen für URLs - siehe nachfolgende Tabelle

Dienst Name im URL
Hypertext http:
FTP ftp:
NetNews news: und nntp:
WAIS wais:
Telnet telnet: und tn3270:
Ausgehende E-Mail mailto:
Lokale Dateien file:

3.2 Java

Wenn man nun denkt, das sei alles, hat man sich getäuscht - die Entwicklung geht weiter. Was halten Sie von der Idee, nicht alle Programme auf Ihrer Festplatte halten zu müssen, sondern sie sich bei Bedarf über das Netz zu holen? Erste Ansätze dazu, in WWW-Dokumenten auch Programme zu verschicken und auf dem WWW-Client auszuführen, sind mit der Entwicklung einer neuen Programmiersprache namens Java zu sehen. Hier ist noch vieles in der Entwicklung, die u.a. durch ein mehrere Millionen Dollar Programm von der Firma Sun unterstützt wird.

4. Informationen

4.1 Informationsanbieter

Die Frage ist nun, wer gibt alles Informationen ins Netz? Und die Antwort dazu ist: Jeder. Einige ausgewählte Beispiele:

Man kann also feststellen "Wer nicht im Web vertreten ist, den gibt es nicht"!

4.2 Informationssuche

Das zentrale Problem des Internet läßt sich kurz und knapp formulieren: Alles da bloß wo?

Es gibt derzeit keine allgemeingültige Methode, um im Internet verläßlich Informationen zu finden. Das hat viel mit der Dynamik des Internet zu tun. Täglich werden weltweit Seiten geändert, kommen neue Seiten hinzu und alte Seiten werden gelöscht, gehen neue Server ans Netz oder ziehen einfach nur um (neuer URL!).

Daher lassen sich nur Methoden vermitteln die das Suchen im Internet einfacher und verständlicher machen sollen. Lassen Sie uns mal - ähnlich dem Suchen nach einer Telefonnummer - drei Kategorien unterscheiden:

Daneben gibt es noch Mischformen zwischen Katalog und Suchmaschine und einige sehr spezielle Hilfsmittel - siehe Script des RRZN Hannover.

5. Wie komme ich ans Internet?

Nachdem Sie das jetzt gesehen haben, stellt sich die Frage "Wie komme ich selbst oder meine Schule ans Internet?" Dazu müssen Sie als erstes einen Internet Provider finden, das ist eine Einrichtung, die selbst am Internet ist und Ihnen den Zugan zu Internet ermöglicht:

Außerdem gibt es noch spezielle Konditionen für Schulen in Baden-Württemberg und für Lehrer an diesen Schulen, über die mein Kollege Hartmuth Heldt berichtet. Er ist auch Ihr Ansprechpartner, wenn Sie einen Internetanschluß an/über die Universität Heidelberg beantragen.

5.1 Internetzugang für Schulen - Hartmuth Heldt