Sommario
Questa sezione delle specifiche descrive i tipi di dati elementari che possono apparire come contenuto di un elemento o come valore di un attributo.
Per informazioni introduttive su come leggere la DTD HTML, si consulti la guida a SGML.
Ogni definizione di attributo include informazioni circa la sensibilità a maiuscole/minuscole dei suoi valori. Le informazioni sulla forma maiuscola/minuscola sono presentate per mezzo delle seguenti parole chiave:
Se un valore di attributo è un elenco, le parole chiave si applicano a ciascun valore nell'elenco, a meno che non sia indicato diversamente.
La definizione del tipo di documento specifica la sintassi del contenuto di elementi HTML e di valori di attributo per mezzo di contrassegni SGML (es., PCDATA, CDATA, NAME, ID, ecc.). Si veda [ISO8879] per le loro definizioni complete. Quel che segue è un riepilogo delle informazioni chiave:
I programmi utente possono ignorare gli spazi bianchi iniziali e finali nei valori di attributo CDATA (es., " miovalore " può essere interpretato come "miovalore"). Gli autori non dovrebbero dichiarare valori di attributo contenenti spazi bianchi iniziali o finali.
Per alcuni attributi HTML 4 con valori di attributo di tipo CDATA, queste specifiche impongono ulteriori restrizioni sull'insieme dei valori legali dell'attributo che possono non essere espresse dalla DTD.
Benché gli elementi STYLE e SCRIPT usino CDATA per il loro modello di dati, per questi elementi i CDATA devono essere gestiti dai programmi utente in modo differente. Codice di marcatura ed entità devono essere trattate come puro testo e passati all'applicazione così come sono. La prima occorrenza della sequenza di caratteri "</" (il delimitatore di apertura del marcatore finale) funge da terminazione per la parte finale del contenuto dell'elemento. Nei documenti validi, questo sarebbe il marcatore finale dell'elemento.
Un certo numero di attributi (%Text; nella DTD) prende del testo che ci si aspetta sia "umanamente leggibile". Per informazioni introduttive circa gli attributi, si consulti la disamina informativa sugli attributi.
Queste specifiche usano il termine URI nell'accezione definita in [URI] (si veda anche [RFC1630]).
Si noti che gli URI includono gli URL (come definito in [RFC1738] e [RFC1808]).
Gli URI relativi sono risolti in URI completi usando un URI di base. [RFC1808], sezione 3, definisce l'algoritmo normativo per questo processo. Per maggiori informazioni circa gli URI di base, si consulti la sezione su URI di base nel capitolo dedicato ai collegamenti.
Gli URI sono rappresentati nella DTD dall'entità parametro %URI;.
Gli URI sono in generale sensibili alla forma maiuscola/minuscola. Possono esservi URI, o parti di URI, in cui la forma maiuscola/minuscola non ha importanza (es., i nomi di macchina), ma identificarli può non essere semplice. Gli utenti dovrebbero in ogni caso considerare gli URI come sensibili alla forma maiuscola/minuscola (per tenersi al riparo da problemi).
Si consulti l'appendice per informazioni circa i caratteri non-ASCII nei valori di attributo degli URI.
Il tipo di valore di attributo "color" (%Color;) fa riferimento alle definizioni di colore così come sono specificate in [SRGB]. Un valore di colore può essere o un numero esadecimale (prefissato dal carattere cancelletto #) o uno dei seguenti sedici nomi di colore. I nomi di colore sono maiuscolo-indifferenti.
![]() |
Black = "#000000" | ![]() |
Green = "#008000"
|
![]() |
Silver = "#C0C0C0" | ![]() |
Lime = "#00FF00"
|
![]() |
Gray = "#808080" | ![]() |
Olive = "#808000"
|
![]() |
White = "#FFFFFF" | ![]() |
Yellow = "#FFFF00"
|
![]() |
Maroon = "#800000" | ![]() |
Navy = "#000080"
|
![]() |
Red = "#FF0000" | ![]() |
Blue = "#0000FF"
|
![]() |
Purple = "#800080" | ![]() |
Teal = "#008080"
|
![]() |
Fuchsia = "#FF00FF" | ![]() |
Aqua = "#00FFFF"
|
Pertanto, i valori di colore "#800080" and "Purple" si riferiscono entrambi al colore porpora.
Benché i colori possano aggiungere una significativa quantità di informazioni ai documenti e renderli più leggibili, si tengano presenti le seguenti direttive nell'includere il colore nei propri documenti:
L'HTML specifica tre tipi di valori di lunghezza per gli attributi:
I valori di lunghezza sono neutri rispetto alla forma maiuscola/minuscola.
Nota. Il "tipo di media" (definito in [RFC2045] e [RFC2046]) specifica la natura di una risorsa collegata. Queste specifiche impiegano l'espressione "tipo di contenuto" piuttosto che "tipo di media" in accordo con l'uso corrente. Inoltre, in queste specifiche, "tipo di media" può far riferimento al mezzo di comunicazione con il quale un programma utente riproduce un documento.
Questo tipo è rappresentato nella DTD da %ContentType;.
I tipi di contenuto sono maiuscolo-indifferenti.
Esempi di tipi di contenuto comprendono "text/html", "image/png", "image/gif", "video/mpeg", "text/css" e "audio/basic". Per l'elenco corrente dei tipi MIME registrati, si consulti [MIMETYPES].
Il valore degli attributi il cui tipo è un codice di lingua ( %LanguageCode nella DTD) fa riferimento ad un codice di lingua così come specificato da [RFC1766], sezione 2. Per informazioni su come specificare i codici di lingua in HTML, si consulti la sezione sui codici di lingua. Spazi bianchi non sono permessi all'interno del codice di lingua.
I codici di lingua sono maiuscolo-indifferenti.
Gli attributi "charset" (%Charset nella DTD) si riferiscono ad una codifica dei caratteri così come è descritta nella sezione sulle codifiche dei caratteri. I valori devono essere stringhe (es., "euc-jp") presenti nel registro IANA (si veda [CHARSETS] per un elenco completo).
I nomi delle codifiche dei caratteri sono maiuscolo-indifferenti.
I programmi utente devono seguire i passi mostrati nella sezione su come specificare le codifiche dei caratteri allo scopo di determinare la codifica dei caratteri di una risorsa esterna.
Certi attributi invocano un singolo carattere dall'insieme dei caratteri del documento. Questi attributi assumono il tipo %Character nella DTD.
Singoli caratteri possono essere specificati per mezzo di riferimenti a caratteri (es., "&").
[ISO8601] consente molte scelte e variazioni nella rappresentazione di date ed orari. Le specifiche correnti usano uno dei formati descritti nel profilo [DATETIME] per la propria definizione di stringhe data/orario legali (%Datetime nella DTD).
Il formato è:
YYYY-MM-DDThh:mm:ssTZDdove:
YYYY = quattro cifre per l'anno MM = due cifre per il mese (01=Gennaio, etc.) DD = due cifre per il giorno del mese (da 01 a 31) hh = due cifre per l'ora (da 00 a 23) (am/pm NON permesso) mm = due cifre per i minuti (da 00 a 59) ss = due cifre per i secondi (da 00 a 59) TZD = designatore di fuso orario
Il designatore di fuso orario è uno tra:
Devono essere presenti esattamente i componenti illustrati qui, con questa esatta punteggiatura. Si noti che la "T" appare letteralmente nella stringa per indicare l'inizio dell'elemento orario, come specificato in [ISO8601].
Se un'applicazione generatrice non conosce l'orario al secondo, può usare il valore "00" per i secondi (e per i minuti e le ore, se necessario).
Nota. [DATETIME] non si occupa del problema dell'aggiustamento dei secondi.
Gli autori possono usare i seguenti tipi di collegamento riconosciuti, elencati qui con le loro interpretazioni convenzionali. Nella DTD, %LinkTypes rimanda ad un elenco separato da spazi di tipi di collegamento. I caratteri spazio bianco non sono permessi all'interno dei tipi di collegamento.
Questi tipi di collegamento sono maiuscolo-indifferenti, cioè "Alternate" ha lo stesso significato di "alternate".
Programmi utente, motori di ricerca, ecc. possono interpretare questi tipi di collegamento in una molteplicità di modi. Ad esempio, i programmi utente possono fornire accesso ai documenti collegati attraverso una barra di navigazione.
Gli autori possono voler definire tipi addizionali di collegamento non descritti in queste specifiche. Se questo è il caso, essi dovrebbero usare un profilo per riportare le convenzioni usate per definire i tipi di collegamento. Si veda l'attributo profile dell'elemento HEAD per maggiori dettagli.
Per ulteriori approfondimenti circa i tipi di collegamento, si consulti la sezione sui collegamenti nei documenti HTML.
Quello che segue è l'elenco dei descrittori dei media riconosciuti (%MediaDesc nella DTD).
Future versioni di HTML potranno introdurre nuovi valori ed ammettere valori parametrizzati. Per facilitare l'introduzione di queste estensioni, i programmi utente conformi devono essere in grado di analizzare i valori di attributo media come segue:
media="screen, 3d-glasses, print and resolution > 90dpi"
è trasformato in:
"screen" "3d-glasses" "print and resolution > 90dpi"
"screen" "3d-glasses" "print"
Nota. I fogli di stile possono includere al loro interno variazioni dipendenti dai media (ad es., il costrutto CSS @media). In tali casi può essere appropriato adoperare "media=all".
Dati di script (%Script; nella DTD) possono essere il contenuto dell'elemento SCRIPT ed il valore di attributi che rappresentano eventi intrinseci. I programmi utente non devono interpretare i dati di script come codice di marcatura HTML, ma devono invece passarli come dati ad un motore di script.
La sensibilità alla forma maiuscola/minuscola dei dati di script dipende dal linguaggio di scripting.
Si noti che i dati di script che sono il contenuto di un elemento non possono contenere riferimenti a caratteri, ma i dati di script che sono valori di attributo possono contenerli. L'appendice fornisce ulteriori informazioni circa il modo di specificare dati non HTML.
I dati dei fogli di stile (%StyleSheet; nella DTD) possono essere il contenuto dell'elemento STYLE ed il valore dell'attributo style. I programmi utente non devono interpretare i dati dei fogli di stile come codice di marcatura HTML.
La sensibilità alla forma maiuscola/minuscola dei dati di stile dipende dal linguaggio dei fogli di stile.
Si noti che i dati di fogli di stile che sono il contenuto di un elemento non possono contenere riferimenti a caratteri, ma i dati di fogli di stile che sono valori di attributo possono contenerli. L'appendice fornisce ulteriori informazioni circa il modo di specificare dati non HTML.
Ad eccezione dei nomi riservati elencati sotto, i nomi di destinazione dei frame (%FrameTarget; nella DTD) devono cominciare con un carattere alfabetico (a-zA-Z). I programmi utente dovrebbero ignorare qualsiasi altro nome di destinazione.
I seguenti nomi di destinazione sono riservati ed hanno significati speciali.