Indice |
Cosè Usenet |
Le origini di Usenet |
I messaggi in Usenet |
Il formato dei messaggi | I Newsreader |
Appendici: A B |
Bibliografia |
![]() |
USENET
Tratto dalla Tesi di diploma "Il lessico dei Newsgroups di argomento religioso:
lo studio di quattro casi esemplari con applicazione dello Spad-T®"
<< Usenet riguarda le persone [ ] Usenet è linsieme delle persone che sanno cosè Usenet >>. [ Dern, 1995: 197] NetNews, più comunemente chiamata Usenet, è un sistema condiviso (sharing system) di messaggi che provengono da tutto il mondo in un formato standard. In poche parole Usenet è una comunità mondiale di bacheche elettroniche (BBS), strettamente associate ad Internet, le cui informazioni sono costituite da singoli messaggi, ciascuno dei quali può essere letto e condiviso da molti utenti. I messaggi sono organizzati in gruppi di argomenti o "Newsgroup". Usenet comprende molti computer in molte organizzazioni e sedi diverse. Gli utenti di Usenet leggono e forniscono contributi (affiggono messaggi) nella sede Usenet locale. Ogni sede Usenet distribuisce le affissioni dei suoi clienti alle altre sedi Usenet in base ai vari parametri di configurazione impliciti ed espliciti e a sua volta riceve affissioni dalle altre sedi. Tramite Usenet milioni di utenti di computer in tutto il mondo condividono informazioni, presentano domande e risposte, conducono discussioni tra più utenti. Esistono pacchetti software speciali per gli utenti di Usenet (Newsreader per la lettura e laffissione di messaggi). << Usenet non è unorganizzazione. Nessuna persona o gruppo ha autorità su Usenet nel suo insieme. Nessuno controlla chi riceve un contributo, quali articoli sono propagati nelle varie sedi, chi può affiggere gli articoli o qualsiasi altra cosa. Non esiste unazienda Usenet, né un gruppo di utenti Usenet: ogni utente è solo >>. [ Dern, 1995: 198]. I messaggi Usenet viaggiano con qualsiasi mezzo, che può essere UUCP (Unix to Unix copy), in cui i computer effettuano chiamate da modem a modem e inoltrano le copie di tutti i messaggi appropriati, oppure attraverso Internet e anche via radio, dischetto, nastro di backup e CD-Rom.
Le origini di Usenet Indice Usenet nacque nel 1979 quando due studenti della Duke University nella Carolina del Nord Tom Truscott e Jim Ellis pensarono di collegare i rispettivi computer per scambiare informazioni avvalendosi di servizi UUCP (Unix to Unix copy) che erano appena stati aggiunti in una nuova versione del sistema operativo Unix. Steve Bellovin, a quei tempi studente presso la University of North Carolina, scrisse un software che gestiva lo scambio dei messaggi e che fu installato nei computer delle due università. Il servizio prese il nome "News" e le sedi che lo fornivano divennero note come Usenet (reti di utenti Unix). Negli anni successivi questi ed altri membri della comunità Unix, tra cui Steve Daniel, Mark Harton, Matt Glickman e Rick Adams, scrissero nuove versioni del software News per la lettura, laffissione e la distribuzione di messaggi News attraverso la rete Usenet in continua espansione. Nella metà degli anni Ottanta, il servizio Usenet si era diffuso nei sistemi Unix di migliaia di università e organizzazioni operanti nel settore della fabbricazione e delluso dei computer. Vennero adottate convenzioni per coordinare il collegamento delle sedi Usenet, lavviamento di nuovi gruppi News e le regole sociali. Alla fine degli anni Ottanta, la rete Usenet si era già affermata come risorsa principale per discussioni e sviluppi tecnici allinterno di Unix, di TCP/IP e delle comunità Internet, oltre che come comunità pienamente autonoma. Nei primi anni Novanta Usenet è disponibile in tutti i continenti, compresa lAntartide. I messaggi in Usenet Indice La suddivisione nei vari Newsgroup delle migliaia di articoli affissi ogni giorno in Usenet contribuisce ad identificare quali messaggi vale la pena di leggere. Tuttavia anche questo può non essere adeguato: un gruppo di notizie può arrivare facilmente a decine e anche centinaia di affissioni quotidiane. Un metodo per ovviare a questo inconveniente è il "concatenamento" dei messaggi, ovvero interconnettendo gli articoli secondo lordine delle risposte. Ogni catena di discussioni è un albero di articoli, in cui tutti gli articoli di risposta (figli) si diramano dai rispettivi articoli di origine (genitori). Largomento di un articolo è definito come il contenuto del relativo campo "Subject". LRFC (Request for Comments) 1036 (Standard for Interchange of USENET Messages) reperibile allindirizzo Internet http://www.ietf.org/ è un documento che contiene tutti i riferimenti per il formato standard dei messaggi Usenet e per alcuni standard di trasmissione delle "News". La regola è che tutti i messaggi Usenet devono essere formattati come messaggi di posta Internet in accordo con lRFC 822. Lo standard Usenet è però più restrittivo rispetto lo standard Internet. Si hanno infatti alcune necessità in più e limpossibilità di usare alcune caratteristiche di Internet. In generale, comunque, è possibile scrivere un messaggio Usenet con un tool per comporre messaggi di posta Internet. I messaggi Usenet sono composti da una intestazione, costituita da una serie di righe di testo (header lines) seguita dal "corpo" del messaggio (body). Lintestazione è separata dal corpo da una riga vuota (null line). Ciascuna riga dellintestazione è formata da:
Alcune righe di intestazione sono obbligatorie, altre opzionali. Le righe obbligatorie sono:
Il formato dei messaggi USENET Indice Mentre lRFC 822 specifica i dettagli circa lintestazione dei messaggi, lRFC 1521 definisce il formato del "corpo" del messaggio. Lo standard della posta elettronica così come descritto nellRFC 821 e 822, limita il contenuto dei messaggi a linee di testo ASCII a 7 bit non più lunghe di 1000 caratteri, consentendo luso dei caratteri stampabili fino al valore ASCII 128. Tale limitazione non permetterebbe ladozione di un particolare insieme (set) di caratteri diverso da quello ASCII a 7 bit, né linvio di dati in formato binario (non testuale), come immagini e audio. Per ovviare a questo inconveniente i programmi di invio e ricezione delle "News" o delle "Mail" ("Local mail user Agent", ovvero programmi, con i quali gli utenti spediscono e ricevono messaggi) implementano un sistema di conversione (codifica) standard di tutti i dati non testuali in caratteri stampabili ASCII a 7 bit. A ciò si unisce lestensione del servizio SMTP "Simple Mail Transfer Protocol" (protocollo di trasmissione delle mail) - così come riportato nellRFC 1426 - che consente il trasporto di messaggi MIME a 8 bit. Lestensione SMTP lascia, però, la possibilità di limitare la lunghezza delle linee di testo le quali possono continuare ad essere non più lunghe di 1000 caratteri. LRFC 1521 introduce nuovi campi dintestazione che definiscono il formato del corpo del messaggio e consentono una compatibilità tra tutti i programmi di posta elettronica. Eventuali campi o valori dei campi stessi, al di fuori dello standard decretato dallRFC 1521, devono essere indicati facendoli precedere dai caratteri "X-". I campi standard sono i seguenti:
I valori per il campo Content-Transfer-Encoding sono i seguenti:
LRFC 2183 specifica un nuovo campo (opzionale) dintestazione per i messaggi MIME: il Content-disposition. Di seguito si riportano i valori per questo campo ed i loro parametri. I parametri sono separati tra loro dal carattere ";".
I Newsreader Indice Nel paragrafo 1.3 è stato specificato che i messaggi Usenet devono essere formattati come messaggi di posta elettronica conformemente con quanto specificato con lRFC 822. In generale, quindi, è possibile scrivere un messaggio Usenet con un tool per comporre messaggi di posta Internet, detto anche Local mail user Agent (programma demandato alla gestione della posta che lavora nella macchina locale, ovvero nel Pc dellutente). Esistono però dei programmi sviluppati appositamente per gestire i messaggi Usenet. Essi vengono denominati Newsreader (programmi di lettura di notizie). Tali programmi nascondono allutente il modo in cui i gruppi di notizie ed i messaggi Usenet sono effettivamente memorizzati, facilitando la selezione, la lettura e la risposta ai messaggi. Essi sono in grado infatti di leggere e interpretare lintestazione dei messaggi così da poter rappresentare le informazioni in maniera corretta. Sono disponibili molti programmi di lettura di notizie per vari tipi di computer per sfruttare le varie interfacce utente di tipo grafico e le altre caratteristiche specifiche del computer. Molti di questi programmi sono disponibili gratuitamente, altri vengono commercializzati. Il canale di diffusione principale è Internet. I Newsreader hanno le seguenti caratteristiche comuni:
___________________________________________ NOTE
Le BBS, a differenza della posta elettronica, consentono di organizzare le informazioni come risorse comuni condivise, in directory che non appartengono al singolo utente. I messaggi arrivano in aree di proprietà del software della bacheca elettronica: molti utenti possono leggere contemporaneamente la stessa copia , come se si trattasse di un giornale comune o di un avviso affisso ad un muro, mediante programmi software progettati per organizzare e leggere i numerosi messaggi. Invece di inviare un messaggio ad una persona, lo si invia, o "affigge", in un gruppo della BBS.
Nel settore delle reti, il termine tecnico per designare il collegamento di reti è internetworking, mentre per indicare una rete di reti viene impiegato il termine internetwork o internet. La nuova internet work, incentrata su ARPAnet fu soprannominata Internet, con la "I" maiuscola.
TCP/IP è lacronimo di (Trasmission Control Protocol/Internetworking Protocol). ARPA ( Advanced Research Projects Agency), negli anni sessanta, attuò una serie di progetti basati sulla creazione di hardware e software per realizzare una piccola rete sperimentale basata sulla commutazione di pacchetto. Dal progetto ARPAnet e dal concetto di internetworking (ovvero del collegamento di singole reti in unentità più grande) si sviluppò un nuovo protocollo di comunicazione che permise linterconnessione di reti a commutazione di pacchetto eterogenee: il protocollo TCP/IP (Trasmission Control Protocol/Internetworking Protocol). La commutazione di pacchetto è un metodo di condivisione della linea telefonica tra computer, per cui ogni flusso di dati viene suddiviso in pacchetti. Ogni pacchetto è formato da una porzione di dati e da una sezione denominata intestazione contenente informazioni quali lindirizzo del mittente e del destinatario, il numero di ID del pacchetto per consentire il riassemblaggio delle porzioni di dati nellordine esatto, lora della creazione del pacchetto e le informazioni per verificare che il contenuto del pacchetto sia stato trasmesso correttamente. Il processo di trasmissione di un pacchetto prende il nome di commutazione. I pacchetti vengono commutati attraverso la rete (definita come un insieme di linee e nodi, dove le linee sono i percorsi nei quali scorrono i dati, mentre i nodi sono i punti in cui le linee si intersecano e le risorse, ovvero i dati, vengono trasferiti ad altre linee). Nella rete i pacchetti sono trasferiti da un commutatore di pacchetto (nodo) di una linea al successivo che esamina lintestazione per decidere a quale linea commutare (o inoltrare) il pacchetto. Con la commutazione di pacchetto molti flussi di dati possono essere inseriti e mescolati su di una linea comune per essere in seguito riordinati nella loro forma originaria allaltra estremità. Grazie alle informazioni contenute in ciascun pacchetto, i pacchetti provenienti da una sorgente possono anche essere trasmessi attraverso percorsi (route) diversi e arrivare tutti a destinazione.
Un gruppo di notizie o Newsgroup può essere diviso in sottogruppi in una sorta di gerarchia. Lassegnazione dei nomi nei Newsgroup di Usenet segue determinate convenzioni: i nomi dei gruppi e dei sottogruppi sono separati da un punto (.). Il nome della parte sinistra indica la gerarchia di massimo livello. Per esempio it.discussioni.auto indica il sottogruppo auto nel gruppo discussioni della gerarchia it (italiano).
I documenti RFC (Request for Comments) sono le serie ufficiali di documenti che definiscono gli standard e gli altri aspetti di Internet, identificati sovente con un numero di RFC (per esempio: RFC 1822) oltre che con un titolo. Scritte da sviluppatori di spicco di Internet, le Request for Comments vanno dalle specifiche dei protocolli alle proposte, alle analisi, alle specifiche, ai resoconti generali, fino ad argomenti più leggeri come saggi umoristici occasionali o argomenti culturali quali poesie.
LRFC 822 è un documento che contiene i riferimenti per il formato standard dei messaggi di testo "ARPA Internet".
ASCII è lacronimo di American Standard Code for Information Interchange, ovvero un sistema di codifica che permette una corrispondenza biunivoca tra i numeri binari ed un insieme di caratteri (alfanumerici e di servizio). Ciò che ne deriva è una tabella su cui viene riportato il numero binario con il corrispondente carattere di riferimento. Nelle tabelle ASCII si usa indicare il valore numerico in formato decimale o esadecimale. La codifica ASCII può essere a 7 bit oppure a 8 bit. Nel primo caso comprende 27=128 caratteri dei quali, quelli fino al valore decimale 31, sono caratteri di controllo non stampabili. Nel secondo caso comprende 28=256 caratteri ovvero i caratteri di controllo, quelli stampabili più gli estesi. Oltre a quella ASCII esistono altre tabelle codici nate per soddisfare esigenze diverse come quella di gestire un sistema in una lingua diversa dallinglese.
I Newsgroup moderati sono Newsgroup in cui tutti i messaggi sono sottoposti al vaglio di una persona definita il moderatore del gruppo. Il moderatore dovrà decidere della pertinenza di ciascun messaggio allargomento del Newsgroup.
LRFC 1521 decreta lo standard MIME (Multipurpose Internet Mail Extensions).
LRFC 1426 decreta lestensione ad 8 bit del servizio MIME.
Un parametro aggiuntivo, indicato insieme al valore /plain e separato da questo dal carattere ";" è charset, ovvero il set di caratteri adottato per comporre il mesaggio. Un set di caratteri è sostanzialmente una tabella in cui, per ogni carattere è riportato lequivalente codice binario o esadecimale. La composizione e interpretazione del testo del messaggio avviene ad opera del Local mail user Agent che deve avere a disposizione, nel sistema, la tabella codice. Alcune tabelle codice sono le seguenti: US-ASCII (ASCII); ISO-88591 (Latina: Europa occidentale); ISO-88592 (Latina: Europa centrale/est). Per una lista esaustiva riferirsi allRFC 1521 pag. 28.
LRFC 1341 decreta lo standard MIME. È stato sostituito dallRFC 1521. Ma la parte che riguarda il testo richtext è ancora valida.
SGML è lacronimo di Standard Generalized Mark-up Language. Un documento in linguaggio SGML contiene due tipi dinformazione: la struttura ed il contenuto. La struttura è determinata da particolari istruzioni sempre in formato testo (Murk-up tags) racchiuse tra parentesi angolari . Il contenuto è rappresentato dal testo racchiuso tra i Murk-up tags. Per struttura si intendono le parti logiche di un documento (Capitoli, sezioni, paragrafi, ecc.) [http://www.techapps.co.uk/iihb_sgml.html]
Sono programmi per comporre o semplicemente visualizzare documenti scritti in SGML. NellRFC 1341 (sostituito dallRFC 1521) (Appendice D) viene proposto un semplice programma in 44 linee per tradurre un testo in "richtext" in "plain text".
LRFC 1563 (The text/enriched MIME Content-type) specifica la sintassi del testo formattato "enriched".
LRFC 1866 definisce la sintassi dellHTML (Hypertext Markup Language, simile allSGML di cui sopra) nonché il valore "/html" del campo "Content-Type:"
Il corpo del messaggio in questo caso è costituito da diverse parti ciascuna delimitata da precisi confini (boundary) espressi sotto forma di caratteri alfanumerici identificativi indicati anche nellintestazione del messaggio nel campo Content-Type. La voce boundary="caratteri alfanumerici", infatti, segue con il carattere ";" la dicitura multipart . Ciascuna parte del corpo del messaggio - incapsulata tra il valore boundary specificato nellintestazione e preceduto dai caratteri "--" (codice ASCII decimale 45) - contiene a sua volta una intestazione ed un corpo separati da una riga vuota, in maniera simile a quella specificata nellRFC 822 e nellRFC 1521. Il valore del boundary preceduto e terminato dai caratteri "--" indica la fine dellultima parte in cui è diviso il corpo del messaggio. Il testo contenuto tra i boundary può terminare con una linea vuota (in tal caso trattasi di testo esplicito in formato ASCII. Ciò viene indicato anche nellintestazione del boundary stesso) oppure no (in questo caso trattasi di testo implicito in formato ASCII e non è necessario indicarlo nellintestazione del boundary). [Vedere Appendice A per un esempio]
Tre parametri sono richiesti nel campo Content-Type (i parametri sono indicati successivamente al valore message/partial e separati da questo e tra loro dal carattere ";"). Il parametro "id" è un identificatore unico usato per riassemblare le parti del messaggio. Il parametro "number" è un numero intero che indica la sequenza delle parti del messaggio da assemblare (la numerazione inizia da 1 e non da 0). Il parametro "total" che indica il numero totale delle parti in cui è stato scomposto il messaggio. [Vedere Appendice A per un esempio]
Quando il valore del campo "Content-Type: " è "message/external-body" troviamo dei valori aggiuntivi per alcuni campi atti a descrivere determinate caratteristiche del file esterno che rappresenta il corpo del messaggio. Tali valori, separati tra loro dal carattere ";" , sono i seguenti:
Nota: alla fine dei valori spiegati appena sopra, trova posto, separata da due linee vuote, lintestazione del corpo incapsulato nel file. Nel senso che il corpo disponibile nel file ha unintestazione che viene riportata nel messaggio dorigine. [Vedere Appendice A per un esempio]
Il valore octet-stream può avere i seguenti parametri indicati in successione e separati dal carattere ";": type: tipo o categoria del dato. padding: numero di bit di "riempimento" usati laddove i bit totali dai dati inclusi nel corpo non sono multipli di un byte. name: parametro introdotto già dallRFC 1341 suggerisce il nome del file quando appunto i dati vengono salvati in un file.
LRFC 1740 (MIME Encapsulation of Macintosh files MacMIME) decreta lo standard per lincapsulazione dei file Apple Macintosh.
LRFC 2387 (The MIME Multipart/Related Content-type) decreta le specifiche per un nuovo valore del campo "Content-Type: " .
PEM sta per privacy-enhanced mail. I dettagli del servizio PEM sono contenuti nellRFC 1421, 1422, 1423, 1424.
PGP sta per Pretty Good Privacy. I dettagli del formato PGP sono contenuti nellRFC 1991, 2015 e 1847.
Con il sistema a chiave simmetrica, un messaggio è crittato e decrittato usando la stessa chiave ; questa deve essere conosciuta sia dal mittente che dal ricevente. La chiave passa dall'uno all'altro, attraverso una transazione separata, ma il sistema è vulnerabile perchè essa può venir rubata nel momento in cui attraversa la rete.
PGP utilizza una tecnica di criptazione basata su chiavi pubbliche asimmetriche, che prevede la presenza di due chiavi: una pubblica, che l'autore può mettere a disposizione di chiunque inviandola a un apposito server Web e una privata, conservata solo dall'utente e protetta da un codice di accesso personale. Per trasmettere un messaggio in forma protetta è anzitutto necessario che il mittente scarichi dal server Web la chiave pubblica del destinatario e cripti con questa il documento; il destinatario potrà a questo punto decriptare la comunicazione ricevuta tramite la propria chiave privata, utilizzando il codice di accesso personale. Chiaramente è virtualmente impossibile risalire dalla chiave pubblica a quella privata, poiché gli algoritmi di criptazione utilizzati hanno raggiunto livelli di sicurezza paragonabili a quelli impiegati in campo militare, impedendo qualsiasi tentativo di decifrazione operato tramite sistemi di analisi matematica. Per firmare elettronicamente un messaggio PGP utilizza invece un metodo inverso a quello impiegato per la criptazione e cioè adopera la chiave privata (ed il relativo codice di accesso) per apporre la firma e quella pubblica per verificare la conformità del messaggio con l'impronta generata durante la sigla.
Un messaggio criptato è formato da due parti: la prima costituita da una informazione di controllo indicante la versione dell application/pgp-encrypted, la seconda contenente i dati criptati avente "application/octet-stream" come valore del Content-Type nellintestazione. Ogni parte è ovviamente racchiusa tra i boundary. [Vedere lappendice A per un esempio]
Un messaggio firmato è costituito da due parti: la prima contenente i dati in formato MIME, la seconda contenente la firma con " application/pgp-signature" come valore del campo Content-Type. [Vedere lappendice A per un esempio]
Dallinglese to quote: citare
|