Il linguaggio utilizzato per realizzare i documenti ipertestuali del World
Wide Web. Si tratta di un gruppo di marcatori che indicano al browser
come visualizzare la pagina e permettono di stabilire collegamenti tra
una parola o un intero blocco di testo e un'altra pagina Web, magari memorizzata
su un server remoto. Il testo da codificare deve essere in formato ASCII
e la marcatura dei brani interessati dal collegamento ipertestuale avviene
mediante l'aggiunta di parole codice che possono essere digitate direttamente
da tastiera oppure aggiunte per mezzo di traduttori automatici (i più
recenti tra i wordprocessor dispongono di funzioni di traduzione automatica
dal proprio formato a quello HTML). L'HTML deriva da SGML, rispetto al
quale è molto più semplice, ma anche meno espandibile. L'elemento cardine
per il funzionamento del World Wide Web è il protocollo HTTP (Hypertext
Transfer Protocol). Si tratta di un protocollo molto semplice che regola
l'interazione tra il nostro browser e il particolare server con cui quest'ultimo
di volta in volta si connette a seguito di una nostra richiesta diretta
oppure seguendo un rimando ipertestuale. La transazione tra queste due
entità si svolge in quattro fasi: connessione, richiesta del documento,
risposta e disconnessione. Le prime tre sono di solito segnalate nella
finestra del browser con scritte in inglese che ci spiegano cosa sta succedendo.
Nella richiesta il browser specifica al server quale protocollo deve essere
utilizzato (HTTP oppure FTP o altro ancora) infatti lo stesso browser
può essere utilizzato per collegarsi anche con siti che non fanno parte
del World Wide Web e che offrono servizi Internet più tradizionali, come
appunto lo scaricamento di file attraverso il protocollo FTP (File Transfer
Protocol). Dopo che la pagina è giunta sulla nostra macchina, la connessione
col server s'interrompe e va ripresa quando si chiede di passare a una
seconda pagina sul medesimo server oppure a un secondo server. Questo
talvolta vale anche per il percorso a ritroso, dove si chiede di visualizzare
una seconda volta una pagina che avevamo già visto. L'eventuale presenza
di grafica rende questo andirivieni abbastanza lento poiché tutte le volte
gli elementi grafici devono essere scaricati di nuovo. Una soluzione pratica
per eliminare questo inconveniente consiste nel creare una cache sul disco
della nostra macchina o sul server che fa da gateway (porta di accesso
verso Internet). Così, ogni volta che chiediamo una pagina già vista,
la caricheremo dal nostro disco locale o ppure dal disco del server vicino
anziché di richiamarla dalla Rete. I software di cache sono entità diverse
dai browser e perciò bisogna procurarseli separatamente. Un sistema per
non dover scaricare continuamente la stessa pagina (se questa contiene
prevalentemente testo) consiste nel salvarla sulla propria macchina come
file a sé stante e nel richiamarla dall'interno del browser come si richiamerebbe
un qualsiasi documento dall'interno di un word processor (tra l'altro,
alcuni programmi di elaborazione dei testi permettono di visualizzare
e modificare queste pagine scaricate in locale senza dover ricorrere al
browser). Il documento che circola sulla rete quando si è connessi a un
server Web ha un formato particolare e usa al proprio interno una serie
di codici che dicono al browser come visualizzare il testo e le immagini
che vi sono associate. Il più diffuso tra i linguaggi usati per questa
codifica è l'HTML (Hypertext Markup Language - linguaggio per la codifica
degli ipertesti attraverso marcatori) che costituisce una versione semplificata
dell'SGML (Standard Generalized Markup Language - linguaggio di codifica
standard e generalizzato). Anche qui l'accento è sulla semplicità, infatti
l'HTML prevede un massimo di 37 marcatori e chiunque può imparare a utilizzarli
visto che richiamano lo stesso metodo di codifica in uso sui vecchi wordprocessor
per DOS, dove il marcatore indicava la caratteristica di tutte le parole
che lo seguivano (diceva ad esempio che erano in corsivo) e doveva essere
seguito da un altro marcatore che ne annullava l'effetto. In questa figura
vediamo un documento codificato con HTML.