Något om WWW och HTML

Denna sida sammanfattar och kompletterar det som sades om WWW och HTML på föreläsningen 991129.

WWW = HTML + URL

Ursprunget till WWW (World Wide Web) kan sägas vara kombinationen av två uppfinningar:
HTML, HyperText Markup Language
Ett enkelt sätt att tillverka hypertextdokument.
URL, Universal Resource Locator
Ett enhetligt sätt att ge adresser till dokument på en godtycklig dator i världen.

Vad är HTML

HTML står alltså för HyperText Markup Language, vilket på svenska blir ungefär beskrivningsspråk för hypertext.

Vad är hypertext?

Alla vet väl vad vanlig text är. Hypertext är vanlig text plus möjligheten att enkelt följa hänvisningar (korsreferenser), dvs länkar.

Idén om hypertext som sådan är ganska gammal. Den uppfanns av en amerikansk regeringstjänsteman någon gång på 60-talet (om jag inte minns fel). Programmet HyperCard på Macintosh anväde sig av hypertextidén långt innan WWW fanns. HTML utformades på CERN i början av 90-talet och det var då hypertext kombinerades med idén om URL:er. Detta blev början till WWW.

Vad är en URL

Adresser till webbsidor anges med URLer. En typisk URL kan se ut så här:
http://www.etek.chalmers.se/~hallgren/Eda/
En URL har följande uppbyggnad:
Protokol (http i exemplet)
Detta anger vilket kommunikationprotokol som ska användas för att hämta dokumentet. Andra tillåtna protokol är:
Datornamn (www.etek.chalmers.se i exemplet)
Detta anger vilken dator dokumentet ska hämtas från. Det föregås av //. Ibland utelämnas datornamnet, t ex då man refererar till ett nyhetsmeddelande eller en nyhetsgrupp, eftersom dessa normalt hämtas från den lokala nyhets-servern.
Portnummer (syns inte i exemplet)
Efter datornamnet kan man ange ett portnummer. De olika protokolen är kopplade till en standardport, men om man av någon anledning vill använda en annan port kan man ange denna. Det normala portnumret för http är 80, men i UNIX får vanliga användare inte använda portnummer under 1024, så om en vanlig användare vill starta en egen webbserver kan han t ex ta 8888. Adressen skulle kunna bli http://dogbert.cs.chalmers.se:8888.
Filnamn (/~hallgren/Eda/ i exemplet)
Detta anger vilket dokument på datorn som ska hämtas. Detta skickas till webbservern som det är och det vanliga är att webbservern tolkar det som ett filnamn, och skickar tillbaka innehållet i filen, men det kan betyda något annat.

Andra saker som kan förekomma i filnamnsdelen är

?något
Detta skickas när man fyllt i en textruta, t ex för ange vad man vill söka efter i en söktjänst
#något
Detta anger en plats inuti ett HTML-dokument. Delen efter # skickas inte till webbservern, utan webbläsaren hämtar hela dokumentet och hoppar sedan automatiskt fram till den angivna delen.

HTML-dokuments uppbyggnad

Se även HTML 3.2 Rerefence eller HTML 4.0 Reference för en mer komplett beskrivning.

Ett HTML-dokument har följande uppbyggnad:

<HTML>
  <HEAD>
    <TITLE>dokumentets titel</TITLE>
    ...
  </HEAD>

  <BODY>
    <H1>första rubriken</H1>
    ...
  </BODY>
</HTML>
I HEAD-delen ges viss information om dokumentet, bland annat dokumentets titel (som brukar visas som fönstertitel i webbläsarna)

Element

Ett dokument byggs upp av element. Element har När det gäller vissa element kan startmarkeringen och/eller slutmarkeringen utelämnas. T ex kan HTML-elementets start- och slutmarkerring alltid utelämnas, eftersom ett HTML-dokument alltid består av ett enda HTML-element. Även HEAD- och BODY-elementens start- och slutmarkeringar kan utelämnas. Ovanstående dokumentskelett kan alltså förkortas till
    <TITLE>dokumentets titel</TITLE>
    ...
    <H1>första rubriken</H1>
    ...
Det är ändå underförstått att det finns en HEAD-del och en BODY-del.

Vissa element har inget innehåll. Då är startmarkeringen obligatorisk, och slutmarkeringen måste utelämnas. Exempel på sådana element är HR, BR och IMG (se nedan).

Elementens namn kan skrivas med stora eller små bokstäver.

Element för "styckeutformningar"

Radbrytningar i HTML-filen har ingen betydelse för hur HTML-dokumentet ser ut. Om man har ett eller flera mellanslag mellan orden spelar heller ingen roll. För att börja på nytt stycke använder man P-elementet eller något av de andra i listan nedan.

Element för "teckenutformningar"

Logiska markeringar (beskriver betydelse): Fysiska markeringar (ger ett bestämt utseende) (rekommenderas inte):

Speciella element

Att tänka på när man gör webbsidor

En viktig sak att tänka på när man skriver något är: vem ska läsa det?

När det gäller webbsidor kan man fråga sig följande om läsarna:

Vilka presentationsformer vill de ha?
Hur modern webbläsare använder de? Vilka finesser kan man använda?
Hur stor bildskärm har användaren? Hur många färger har de?
Utforma dokumentet så att användaren själv kan välja hur stort fönster han vill ha. Ändra inte typsnitt/textstorlek för normal text. Undvik överambitiös design.
Hur snabb internetanslutning har de?

Datoranvädning E1
Thomas Hallgren, hallgren@etek.chalmers.se
Links Last modified: Sun Dec 5 19:34:15 CET 1999