Etichettatura professionale dei siti Web

NB. A more up to date version of this document is available in English

È possibile leggere questo (lungo) documento in questa pagina, oppure scaricarlo nel formato preferito facendo clic su uno dei seguenti link:

Questi documenti sono formattati per la stampa fronte/retro su fogli di carta A4.

Sommario

Il concetto alla base dell’etichettatura dei siti Web è piuttosto semplice: il contenuto è trasmesso al client con una serie di descrittori codificati che il software di filtro può bloccare o lasciar passare, a seconda delle impostazioni dei genitori. Sembra il sogno di un censore? No, ed ecco perché:

  1. I descrittori ICRA sono concepiti per essere il più possibile obiettivi. Una caratteristica è presente o assente nel sito. Vi è poco spazio per i giudizi personali, pur dovendo ammettere che, nonostante ogni sforzo fatto per essere neutrali, in alcuni casi il giudizio personale non può essere totalmente escluso.
  2. Il contenuto del sito è classificato dal proprietario e non da ICRA.
  3. Il genitore e non ICRA decide ciò che il proprio figlio può e non può vedere.

La piattaforma utilizzata è la Platform for Internet Content Selection (PICS), uno standard definito dal W3C. Vi sono altri servizi di classificazione che utilizzano il sistema PICS, ma tutti sono in qualche misura portatori di valori culturali specifici. Il sistema ICRA è l’unico progettato per essere completamente indipendente dalle differenze culturali e nazionali, e in quanto tale gode dell’appoggio di molti dei grandi nomi di Internet.

Le etichette di classificazione possono essere applicate a tutti i livelli: dal livello di tutti i file trasmessi da un determinato server, indipendentemente dal dominio, fino ai singoli file.

Perché un filtro basato su PICS possa decidere, in base all’etichetta di classificazione del contenuto, se bloccare o meno un determinato file scaricato da un sito, che si tratti di un documento HTML, di un’immagine o altro, deve verificarsi una delle seguenti condizioni:

  1. Il file scaricato contiene un’etichetta di classificazione nelle informazioni di intestazione.
  2. Il filtro ha già nella cache un’etichetta che può essere applicata al contenuto in ingresso.

Ciò si traduce in due possibili metodi di etichettatura:

  1. Configurazione del server per l’inclusione di etichette PICS nell’intestazione HTTP di ciascun file trasmesso. Questo è il metodo più efficiente, in quanto l’operazione di etichettatura viene eseguita una volta per tutte. Il controllo dell’operazione è affidato ai tecnici dei server.
  2. Inclusione di un meta tag nell’intestazione HTML di ciascuna pagina. Ciò può essere realizzato mediante uno script che scriva intestazioni comuni per tutte le pagine, tramite SSI o, se non vi sono altre soluzioni, copiando e incollando il tag in ogni pagina statica. Con questi metodi il controllo dell’etichettatura è affidato ai webmaster.

Questo documento fornisce dettagli sui vari elementi che compongono un’etichetta PICS e tratta quindi delle modalità di utilizzo in base ai due metodi sopra descritti.

Torna a inizio pagina

2 Generazione di etichette

Le informazioni contenute in questo documento sono sufficienti per mettere in grado l’utente di scrivere da sé un’etichetta di classificazione ICRA. ICRA non ha alcuna obiezione a riguardo. Esistono tuttavia metodi di più semplice attuazione e, dal punto di vista di ICRA, preferibili.

Oltre al generatore di etichette principale presente sul sito ICRA, vi sono diversi generatori di etichette disponibili per il download. Questi vanno da un modulo HTML di base che richiama uno script sul server ICRA per la generazione dell’etichetta fino a un generatore autonomo costituito da un singolo file HTML/JavaScript che può essere usato online o offline. Lo scopo di tali strumenti è quello di facilitare la generazione delle etichette. È possibile esaminare e scaricare le varie versioni all’indirizzo www.icra.org/label/download/.

L’utilizzo delle etichette ICRA, sia generate automaticamente sia scritte a mano, è soggetto alle condizioni contrattuali presenti sul sito ICRA.

2.1 Z 0 – l’opzione “non so”

Quando si etichetta una grande rete costituita da più proprietà non è sempre possibile determinare la classificazione da applicare a determinati contenuti. I propri server, ad esempio, potrebbero ospitare del contenuto sul quale non si ha un controllo diretto. Come etichettare tali aree?

Una possibilità consiste nell’utilizzo esplicito di un descrittore “z 0.”

Ad esempio, un’etichetta completa che dichiari la presenza in una risorsa di imprecazioni blande sarebbe

la 0 lb 0 lc 1 lz 0

Ciò significa che “linguaggio con riferimenti sessuali espliciti” è assente (la 0), “parole volgari o bestemmie” è assente (lb 0), “imprecazioni blande” è presente (lc 1), “nessuno dei descrittori suddetti” non è quindi applicabile (lz 0).

Per brevità, un’etichetta ICRA non include effettivamente tutti questi termini, ma è sufficiente scrivere lc 1, poiché i termini con valore zero sono sottintesi dalla loro assenza. L’impostazione a zero di tutti i descrittori di linguaggio ha quindi un significato indefinito:

la 0 Linguaggio con riferimenti sessuali espliciti assente
lb 0 Parole volgari o bestemmie assenti
lc 0 Imprecazioni blande assenti
lz 0 “Nessuno dei descrittori suddetti” non applicabile

In teoria è possibile omettere tutti i descrittori di linguaggio, ma in pratica si utilizza sempre almeno un descrittore per categoria. Se poi si desidera effettivamente dichiarare il valore 0 per tutti i descrittori di linguaggio, si indica esplicitamente lz 0: “nessuno dei descrittori suddetti” non applicabile. In assenza di descrittori dichiarati, ciò si traduce in linguaggio naturale con “non viene fatta alcuna dichiarazione riguardo al contenuto linguistico”. In parole povere, non si sa.

Ciò che è rilevante per i genitori è la possibilità, nell’impostare un filtro, di richiedere che sia dichiarato lz 1, oppure di accettare lz 0 in caso di assenza di altri descrittori impostati su 1. Nella schermata sottostante è visualizzata la relativa sezione del pannello di controllo di ICRAplus.

Se si seleziona “Block all bad language, or choose specifically to block/allow” (bloccare tutto il contenuto linguistico indesiderato, oppure scegliere di bloccare/consentire in modo specifico), le altre opzioni saranno disattivate, in quanto il filtro richiede la presenza del descrittore lz 1. Nella situazione qui illustrata, è bloccato il contenuto con descrittori la 1, lb 1 o lc 1, ma è consentito l’accesso sia a lz 1, sia a lz 0.

Una logica simile può essere applicata alle altre categorie. Nelle categoria “violenza” e “scene di nudo e materiale a sfondo sessuale” è possibile scrivere un’etichetta che dica: “questo contenuto può essere o meno presente ma, se presente, è inserito in un contesto medico, didattico o artistico ed è adatto ai giovanissimi”.

Torna a inizio pagina

3 Elementi di un’etichetta PICS

Un’etichetta PICS di base ha il seguente formato:

(pics-1.1 “URL SERVIZIO DI CLASSIFICAZIONE” l r (CLASSIFICAZIONE))

Descrizione degli elementi:

pics-1.1 Definisce la versione di PICS utilizzata

URL SERVIZIO DI CLASSIFICAZIONE URL indicato sempre tra virgolette doppie (anche se queste non sono gestite correttamente da alcuni strumenti di creazione di pagine Web). Tale URL funge da identificatore univoco del servizio di classificazione, oltre a indicare la fonte dalla quale è possibile ottenere informazioni sul servizio. Nel caso di ICRA, l’URL del servizio di classificazione è http://www.icra.org/ratingsv02.html.

l “L” minuscola che rappresenta l’abbreviazione di labels (etichette). È anche possibile scrivere la parola labels per esteso. Questa è la dichiarazione dell’inizio dell’etichetta o dell’elenco di etichette che segue. Tutte le etichette utilizzano il servizio di classificazione definito.

r Abbreviazione di ratings (classificazioni), che è anche possibile scrivere per esteso. Si tratta dell’effettiva classificazione in base al servizio di classificazione.

La sintassi richiede che l’etichetta sia racchiusa tra virgolette semplici e parentesi, come illustrato.

Ed ecco il primo esempio di etichetta ICRA completa:

Esempio 1: un’etichetta ICRA di base

‘(pics-1.1 “http://www.icra.org/ratingsv02.html” l r (cz 1 lz 1 nz 1 oz 1 vz 1))’

Le classificazioni illustrate in questo esempio rappresentano i codici ICRA per “nessuno dei descrittori suddetti” in tutte le categorie. In pratica questa etichetta dichiara che il sito non contiene:

  • · servizi di chat o forum di discussione (cz 1)
  • · linguaggio potenzialmente offensivo (lz 1)
  • · immagini, descrizioni o rappresentazioni di nudi o di attività sessuale (nz 1)
  • · alcuno dei descrittori nella categoria “altro” (oz 1)
  • · immagini, descrizioni o rappresentazioni di violenza di alcun genere (vz 1)

I codici utilizzati nelle classificazioni sono illustrati sul sito ICRA all’indirizzo.

Come accennato in precedenza, se le etichette sono presenti solo in alcuni dei file trasmessi, ma devono essere applicate a del contenuto non contrassegnato da etichette proprie, è necessario inserire informazioni aggiuntive che controllino il modo in cui le applicazioni di filtro conservano nella cache e applicano tali etichette. A tale scopo si utilizza un’istruzione di questo genere:

gen true for “http://www.example.org/”

gen Abbreviazione di generico. Questo flag può essere impostato su true o false. Se è true, qualsiasi URL che cominci con la stringa presente nell’istruzione for è coperto dall’etichetta. Le etichette gen true sono memorizzate nella cache dei filtri per essere utilizzate in seguito. Se il flag gen è impostato su false, l’etichetta può essere applicata solo all’URL specificato. Le etichette gen false contengono quindi, in genere, un riferimento a una pagina specifica piuttosto che a un nome di dominio:

gen false for “http://www.example.org/page.html”

Esempio 2: un’etichetta ICRA completa per un intero dominio

Un’etichetta ICRA completa che dichiari “nessuno dei descrittori suddetti” in tutte le categorie per il dominio di esempio foo.com avrebbe quindi la seguente struttura:

‘(pics-1.1 “http://www.icra.org/ratingsv02.html” l gen true for “http://www.example.org/” r (cz 1 lz 1 nz 1 oz 1 vz 1))’

È più utile inserire una simile etichetta in un meta tag HTML piuttosto che nelle intestazioni HTTP di risposta del server.

3.1 RSACi

Il sistema di classificazione ICRA rappresenta un’evoluzione del sistema RSACi, che al momento della stesura di questo documento costituisce ancora il servizio predefinito utilizzato da Contenuto verificato di Microsoft Internet Explorer ed è incluso in altro software non recente (NetWatch di Netscape 4.x, NetNanny e CyberPatrol). È quindi consigliabile, sebbene non indispensabile, includere anche descrittori RSACi. Un’etichetta con entrambi i descrittori ha questa struttura:

Esempio 3: un’etichetta combinata ICRA / RSACi

‘(pics-1.1 “http://www.icra.org/ratingsv02.html” l r (cz 1 lz 1 nz 1 oz 1 vz 1) “http://www.rsac.org/ratingsv01.html” l r (n 0 s 0 v 0 l 0))’

Sono state qui omesse le istruzioni gen – for per maggiore chiarezza, ma è possibile includerle. Anche le classificazioni RSACi, di tipo scalare e intrinsecamente soggettivo, sono illustrate nel dettaglio all’indirizzo www.icra.org/decode/. È perfettamente possibile estendere le etichette per includere elementi di altri servizi di classificazione PICS, qualora lo si desideri.

Torna a inizio pagina

4 Commenti generali sulla configurazione del server

Innanzitutto due premesse che serviranno a facilitare la successiva esposizione:

  1. Se si include un’etichetta in ogni file trasmesso, non è necessario indicare a quali pagine l’etichetta fa riferimento, in quanto si riferisce al file contenente l’etichetta.
  2. La configurazione di Apache o di IIS per includere un’etichetta in ogni file trasmesso è di facile attuazione.

Nelle due sezioni che seguono si descrive come impostare i server Apache e IIS in modo che inseriscano le etichette PICS. In queste sezioni si parte dal presupposto che la configurazione del server consentirà di includere etichette in ogni file trasmesso. Tutti i file inviati al client con funzionalità di riconoscimento PICS conterranno un’etichetta. Se si preferisce inviare etichette con informazioni aggiuntive da memorizzare nella cache e applicare ad altre risorse, in modo da ridurre il numero di etichette trasmesse, consultare anche la sezione sui meta tag HTML. Tale sezione illustra l’impiego degli elementi gen-true, mediante i quali le etichette sono memorizzate nella cache e applicate a risorse prive di etichetta propria.

Torna a inizio pagina

5 Configurazione di apache

La trattazione che segue presuppone una conoscenza di base della configurazione di Apache.

NB.
Per includere delle etichette PICS nelle intestazioni HTTP di risposta è necessario utilizzare il modulo mod_headers. Questo modulo non fa parte dei moduli predefiniti e dovrà essere compilato e caricato prima di procedere.

Esempio 4: impostazione di un’etichetta predefinita per tutto il contenuto trasmesso da un singolo computer

Header set pics-label: ‘(pics-1.1 “http://www.icra.org/ratingsv02.html” l r (cz 1 lz 1 nz 1 oz 1 vz 1) “http://www.rsac.org/ratingsv01.html” l r (n 0 s 0 v 0 l 0))’

È sufficiente inserire questa istruzione nel file config , esternamente a eventuali direttive di blocco, perché nell’intestazione HTTP di ogni file trasmesso sia inserita questa etichetta.

Il significato dei vari elementi dell’etichetta è il seguente:

Header set pics-label: Istruisce il server Apache a impostare l’intestazione dell’etichetta PICS sul valore che segue. L’utilizzo di set, preferibile in ogni caso ad append o add, comporta la sostituzione di qualsiasi etichetta eventualmente impostata in precedenza.

‘(pics-1.1 “http://www…)’ L’etichetta stessa, ovvero, per quanto riguarda il server Apache, il valore dell’intestazione pics-label. Fare attenzione alle virgolette semplici che racchiudono l’etichetta. È necessario utilizzare le virgolette singole e doppie come illustrato. Pur se generalmente consentito da vari sistemi di codifica, il sistema PICS non consente di interscambiarne l’utilizzo.

5.1 Controllo delle etichette mediante le direttive di blocco Apache

Le intestazioni HTTP di risposta possono essere impostate nelle seguenti direttive di blocco:

(impostazione predefinita) e e

e

Queste direttive di blocco supportano i caratteri jolly (“?” che corrisponde a un singolo carattere e “*” che corrisponde a un numero qualsiasi di caratteri) e le espressioni regolari per trovare corrispondenze in base a criteri dettagliati. Nei file .htaccess è possibile impostare solo le direttive e . Si ritornerà a breve su questi argomenti.

NB. In una precedente versione di questo documento si affermava che le intestazioni HTTP di risposta non potevano essere impostate in una direttiva di blocco . L’esperienza ha dimostrato che ciò non è vero, almeno per quanto riguarda la versione 1.xx. Procedere comunque con cautela se si utilizza una direttiva .

L’ordine dell’elenco delle direttive è importante. ha la precedenza su , che ha a sua volta la precedenza su .

Per informazioni dettagliate sulle direttive di blocco, consultare la documentazione ufficiale Apache, in particolare http://httpd.apache.org/docs/sections.html.

La considerazione fondamentale in tutto ciò, naturalmente, è che è possibile applicare diverse etichette a sezioni diverse del contenuto di un sito. Poiché esiste documentazione che suggerisce che la direttiva non supporta le intestazioni HTTP di risposta, per etichettare un determinati sito Web su un server si consiglia di applicare una direttiva di blocco o , in questo modo:

Esempio 5: impostazione di intestazioni all’interno di una direttiva di blocco Directory

Header set pics-label: ‘(pics-1.1 “http://www.icra.org/ratingsv02.html” l r (cz 1 lz 1 nz 1 oz 1 vz 1) “http://www.rsac.org/ratingsv01.html” l r (n 0 s 0 v 0 l 0))’

Per etichettare un intero sito Web, dir deve corrispondere al percorso assoluto della directory principale del sito Web sul server.

La stessa direttiva di blocco può essere utilizzata per etichettare una particolare sezione di un sito Web se tutti i file del sito sono memorizzati nella stessa directory. Sarà sufficiente definire un’altra direttiva di blocco con il parametro dir opportunamente impostato. Si può ad esempio immaginare di voler etichettare www.animals.com/birds/ diversamente da www.animals.com/insects/.

Apache elabora le direttive di blocco in ordine crescente in base al numero di elementi. Quindi è elaborata prima di . . L’etichetta che si intende applicare alla directory della sezione sostituirà quindi correttamente la precedente. Per ulteriori informazioni vedere la sezione 11.

Le direttive di blocco e sono elaborate nell’ordine in cui appaiono nel file config.

Esempio 6: impostazione di intestazioni per un file specifico

Ai nostri fini, si tratta semplicemente di un’estensione logica della direttiva di blocco . Si immagini ad esempio di avere un sito a cui debba essere applicata la classificazione A, ma alla cui sola pagina iniziale debba essere applicata la classificazione B. Tale risultato si ottiene con la seguente etichetta:

Header set pics-label: ‘(pics-1.1 “http://www.icra.org/ratingsv02.html” l r (cz 1 lz 1 nz 1 oz 1 vz 1) “http://www.rsac.org/ratingsv01.html” l r (n 0 s 0 v 0 l 0))’

Si noti che la direttiva di blocco contiene un percorso relativo (a DocumentRoot), non un percorso assoluto.

Esempio 7: utilizzo della direttiva di blocco

A seconda delle situazioni, questa può forse essere la direttiva di blocco più facile da usare, poiché prende come argomento un URL piuttosto che un nome file o un percorso sul server. L’etichetta di www.example.org diventa:

Header set pics-label: ‘(pics-1.1 “http://www.icra.org/ratingsv02.html” l r (cz 1 lz 1 nz 1 oz 1 vz 1) “http://www.rsac.org/ratingsv01.html” l r (n 0 s 0 v 0 l 0))’

5.2 Utilizzo di caratteri jolly ed espressioni regolari

Gli esempi presentati finora sono tutti molto specifici. Le direttive di blocco Apache, tuttavia, sono molto più flessibili di quanto finora illustrato. Ciò fornisce diversi vantaggi in termini di etichettatura.

Ad esempio, la matrice di etichettatura ICRA comprende una sezione sulle chat. ca 1 codifica le chat (o i forum di discussione) non moderate, cb 1 codifica le chat moderate e cz 1 dichiara che non vi sono servizi di chat né forum di discussione. È quindi possibile avere per la maggior parte di un sito un’etichetta predefinita che dichiari il descrittore cz 1, ma lo stesso sito potrebbe anche mettere a disposizione uno strumento per la creazione di chat, ed è probabile che tutti gli URL che offrono chat contengano il termine “chat”. In tal caso si può utilizzare un carattere jolly in questo modo:

Esempio 8: utilizzo di caratteri jolly per etichettare un tipo di contenuto

Header set pics-label: ‘(pics-1.1 “http://www.icra.org/ratingsv02.html” l r (ca 1 lz 1 nz 1 oz 1 vz 1) “http://www.rsac.org/ratingsv01.html” l r (n 0 s 0 v 0 l 0))’

Questa etichetta contrassegnerà sempre le aree di chat indipendentemente dal numero di aggiornamenti, modifiche e aggiunte a tali pagine da parte dei webmaster.

Il rischio, naturalmente, è che a qualsiasi URL contenente i quattro caratteri consecutivi “chat” sia applicata questa etichetta. Probabilmente non è quanto si desidera per un sito su Chateaubriand.

È qui che entra in gioco il coordinamento all’interno dell’organizzazione. Se la direttiva di blocco nell’Esempio 8: viene modificata con il semplice inserimento di una barra dopo la parola “chat”, così: , allora l’etichetta sarà applicata solo a quel contenuto il cui URL contenga la parola “chat” immediatamente seguita da una barra.

Esempio 9: utilizzo delle espressioni regolari

L’argomento “espressioni regolari” costituisce l’oggetto di molti libri, e non si pretende qui di fornirne una trattazione esaustiva. Si tratta tuttavia di uno strumento molto potente. Si immagini un server che ospita quattro siti Web:

  • cani.com
  • gatti.com
  • suricati.com
  • zebre.com

È possibile etichettare tutto il contenuto dei siti sui cani, sui gatti e di eventuali altri siti che cominciano con le lettere da “a” a “m” con una direttiva di blocco di questo genere:

D’altra parte i suricati, le zebre e tutta la fauna della seconda parte dell’alfabeto può essere gestita mediante questa direttiva di blocco:

Poiché si sono già ampiamente illustrate le etichette PICS, ci si limita in questi esempi ai tag di apertura della direttiva di blocco.

Esempio 10: impostazione di uno schema di classificazione personalizzato

L’utilizzo di caratteri jolly o di espressioni regolari consente di definire facilmente un sistema di classificazione personalizzato, semplicemente denominando i file in base a criteri predefiniti. È possibile ad esempio stabilire di suddividere il contenuto di un sito in categorie di età. Si può decidere di attribuire la classificazione “PG” o “12” a determinati contenuti. In tal caso sarà sufficiente impostare le due seguenti direttive :

e

In tal modo, a qualsiasi file del sito contenente la stringa “-pg.” immediatamente prima dell’estensione sarà attribuita la classificazione PG, mentre a qualsiasi file contenente la stringa “-12.” immediatamente prima dell’estensione sarà attribuita la classificazione 12. Ai file che non contengono alcuna delle due stringhe immediatamente prima dell’estensione sarà attribuita l’etichetta predefinita (se impostata).

5.3 Utilizzo di un file .htaccess

È possibile aggiungere, eliminare o correggere le etichette PICS relative a contenuti Web senza necessità di arrestare e riavviare il server, inserendo le intestazioni HTTP di risposta in un file .htaccess.

NB. Nei file .htaccess non è possibile utilizzare le direttive di blocco o , ma unicamente e .

I pro e i contro dell’utilizzo di un file .htaccess sono ovvi (flessibilità contro carico del server). Per gli scopi qui illustrati tale metodo è probabilmente più indicato per l’etichettatura di contenuto con vita breve. Tuttavia, il suggerimento fornito di seguito può essere di interesse per organizzazioni e reti geograficamente diversificate.

5.3.1 Un suggerimento

Può essere opportuno impostare un file .htaccess secondario dedicato in modo specifico alla gestione delle etichette. Apache supporta file .htaccess multipli, quindi una possibilità è quella di includere una configurazione di questo genere:

AccessFileName .htaccess, .filename

Il file .htaccess conserverebbe il contenuto attuale, mentre il file separato .nomefile sarebbe utilizzato unicamente per l’etichettatura.

Sono state eseguite delle prove con le seguenti direttive :

Header set pics-label: ‘(pics-1.1 “http://www.icra.org/ratingsv02.html” l r (cz 1 lb 1 nz 1 oz 1 vz 0) “http://www.rsac.org/ratingsv01.html” l r (n 0 s 0 v 0 l 0))’ Header set pics-label: ‘(pics-1.1 “http://www.icra.org/ratingsv02.html” l r (cb 1 lb 1 lc 1 nz 0 oz 1 vz 0) “http://www.rsac.org/ratingsv01.html” l r (n 0 s 0 v 0 l 0))’

Inizialmente è stata eseguita una prova con l’inserimento di una direttiva di blocco in ciascuno di due file distinti: .htaccess e un altro file denominato .picslabels (il nome non è significativo), e l’esito è stato negativo. Aveva effetto solo la direttiva di blocco inserita nel file dichiarato per secondo nella dichiarazione AccessFileName del file config. Se entrambe le direttive di blocco erano inserite in un solo file, invece, funzionavano perfettamente, che il file fosse dichiarato per primo o per secondo nell’elenco di AccessFileName.

Le implicazioni di ciò a livello di organizzazione e politiche aziendali sono che è possibile affidare a una persona la manutenzione di un file di etichette come entità separata. È sufficiente fornire alla persona addetta l’accesso FTP alla relativa directory sul server perché questa possa gestire tutti i compiti in modalità remota.

Torna a inizio pagina

6 Configurazione di Microsoft IIS

Microsoft ha facilitato notevolmente la configurazione di IIS per l’inclusione delle etichette PICS. Le informazioni di intestazione sono impostate nella pagina delle proprietà delle intestazioni HTTP mediante la funzione Intestazioni HTTP personalizzate. IIS utilizza un’architettura gerarchica, dove la pagina delle proprietà delle intestazioni HTTP è configurabile ai seguenti livelli:

  • Server Web
  • Directory iniziale / sito Web (IIS versione 4 e successive supporta siti Web multipli)
  • Directory virtuale
  • Cartella
  • Pagina

Per impostare le proprietà delle intestazioni HTTP selezionare il livello richiesto, fare clic con il pulsante destro del mouse e selezionare Proprietà, quindi selezionare la pagina delle proprietà delle intestazioni HTTP. La schermata sottostante visualizza la pagina delle proprietà delle intestazioni HTTP per il sito Web predefinito. Come mostrato, è anche possibile trasmettere nell’intestazione HTTP un indirizzo e-mail e una data di scadenza del contenuto. Questi dati sono indipendenti dalle etichette PICS.

Evitare di utilizzare la funzione [Modifica classificazioni]. Se si copia il file .rat di ICRA (il file di definizione del sistema di classificazione ICRA all’interno dello standard PICS) nella cartella System32, sarà possibile visualizzare le classificazioni ICRA nella relativa finestra di dialogo. Tuttavia IIS non genera codici corretti in quanto utilizza i vecchi identificatori RSACi e le etichette risultanti non sono leggibili da parte dei filtri. Si raccomanda quindi di limitarsi a utilizzare le intestazioni personalizzate.

Fare clic sul pulsante Aggiungi, inserire l’etichetta PICS nel campo Nome intestazione personalizzata e l’etichetta stessa nel campo Valore intestazione personalizzata, come sotto illustrato:

È tutto. A condizione che si disponga di un server dedicato per il proprio sito, che la stessa classificazione sia legittimamente applicabile a ogni pagina e che si utilizzi IIS, l’inserimento di questi dati comporterà l’etichettatura dell’intero sito senza necessità di far ricorso a un solo meta tag.

È possibile applicare etichette a directory e pagine specifiche procedendo allo stesso modo (è sufficiente fare clic sulla directory o sul file con il pulsante destro del mouse). Tuttavia, alcune delle utili funzioni offerte da Apache, quali la manutenzione e la memorizzazione delle etichette in un file separato, non sono disponibili in IIS.

Torna a inizio pagina

7 Visualizzazione delle intestazioni HTTP di risposta

L’unico modo reale per verificare l’efficacia dell’etichettatura di un sito consiste nell’esplorare il sito stesso con un filtro attivato. Contenuto verificato di Microsoft Internet Explorer assolve al compito egregiamente, ma sarà necessario installare dapprima il file .rat di ICRA. In alternativa, è possibile utilizzare il programma gratuito ICRAplus.

Per visualizzare le etichette nelle intestazioni HTTP di risposta è possibile accedere al sito con telnet, ma in Internet sono disponibili diversi strumenti che consentono di visualizzarle più facilmente, come il visualizzatore di intestazioni HTTP di DJ Delorie, all’indirizzo http://www.delorie.com/web/headers.html.

Torna a inizio pagina

8 Etichettatura di siti mediante meta tag HTML

In alternativa alle intestazioni HTTP di risposta, le etichette PICS possono essere trasmesse come metadati nella sezione HEAD delle pagine HTML.

Esempio 11: un’etichetta ICRA / RSACi completa per www.example.org

Gli elementi di questa etichetta sono esattamente gli stessi descritti nella sezione 3 , ma l’etichetta è trasmessa come meta tag http-equiv. Se si utilizza questo metodo, gli elementi gen – for sono di cruciale importanza. Si tenga presente che, perché un filtro possa attribuire un’etichetta di classificazione a una determinata risorsa Web, l’etichetta deve essere trasmessa insieme alla risorsa, oppure (ciò è rilevante per questa trattazione) il filtro deve già avere nella cache un’etichetta applicabile alla risorsa.

Inoltre, HTTP è un protocollo stateless (senza memorizzazione dello stato): ogni chiamata a un file esterno rappresenta una transazione completamente distinta tra client e server.

Esempio 12: un semplice frammento di codice HTML (senza etichetta):

1)
2)
3) Un titolo
4)
5)
6)
7)

Lo stesso titolo

8)
5)
6)
7)
8)

Lo stesso titolo

9)

Questo meta tag etichetta effettivamente tutti gli URL che cominciano per “http://www.example.org/chat/” con il descrittore ICRA ca 1, che rappresenta il codice delle chat non moderate (non esiste un descrittore RSACi equivalente).

Il punto fondamentale è questo:

se un filtro ha un’etichetta nella cache per “http://www.example.org/” , ma riceve successivamente un’etichetta per “http://www.example.org/bar/”, questa etichetta sarà applicata a tutti gli URL nella directory /bar/ in luogo dell’etichetta “più generica”.

È inoltre possibile utilizzare un tag gen false per etichettare in modo specifico un documento HTML:

Esempio 15: un’etichetta specifica (gen false)

In questo esempio, la specifica pagina bar.htm contiene un’etichetta che dichiara parole volgari o bestemmie nel sistema ICRA e moderate imprecazioni o bestemmie nel sistema RSACi.

D. Che etichetta sarebbe applicata a eventuali immagini presenti nella pagina?
R. Un’eventuale etichetta generica memorizzata nella cache per la quale sia stata incontrata un’istruzione gen-true-for corrispondente, NON questa etichetta che si applica SOLO al documento HTML.
D. Questa etichetta verrebbe memorizzata nella cache?
R. No. Nella cache sono memorizzate solo le etichette gen true.

8.2 Etichette per risorse richiamate da altri domini

Cercare di individuare il problema nell’esempio seguente; vi è un’unica differenza rispetto all’Esempio 13:

Esempio 16: frammento di codice HTML

1)
2)
3) Un titolo
4)
5)
6)
7)
8)

Lo stesso titolo

9)

Non è ripetuta la parte iniziale del meta tag (l’identificatore del servizio di classificazione e la l minuscola), ma solo le istruzioni gen-true-for e le classificazioni tra parentesi.

In questo modo è possibile includere nel proprio sito un’etichetta che si riferisce a materiale richiamato da siti sui quali non si ha controllo. Ciò è particolarmente utile per i siti contenenti banner pubblicitari.

È possibile concatenare in questo modo un numero illimitato di etichette. L’esempio che segue è una combinazione di tutti gli esempi precedenti.

Esempio 18: quattro etichette in una

NB. Sono stati qui omessi gli elementi RSACi per maggiore chiarezza

8.3 Riepilogo sui meta tag HTML

Il concetto fondamentale da tenere sempre presente è che qualsiasi file, che si tratti di una pagina HTML o di oggetti da essa richiamati, deve pervenire al filtro con un’etichetta, oppure il filtro deve già avere nella cache un’etichetta con gli opportuni elementi gen-true-for che la rendano applicabile al contenuto in ingresso.

Se tutti i visitatori di un sito accedono sempre al sito attraverso la pagina iniziale, e se tutto il contenuto del sito deve essere classificato allo stesso modo, allora un singolo meta tag nel file index della directory principale può bastare a etichettare in modo efficace l’intero sito. È tuttavia palese che si tratta di un’ipotesi assai poco probabile.

Se si utilizzano i meta tag HTML per etichettare il sito, ogni pagina del sito deve essere contrassegnata da un’etichetta che si riferisca non solo alla pagina stessa, ma anche a tutti gli elementi richiamati nella pagina.

Torna a inizio pagina

9 Tecniche di creazione script, SSI, ecc.

Vi sono diversi modi in cui è possibile utilizzare script ed SSI per aggiungere etichette ai siti Web. La struttura di ogni sito determina le scelte migliori da compiere. Non verranno fornite in questa sede le soluzioni per ogni caso, ma unicamente alcune indicazioni.

9.1 La stessa SSI per ogni pagina

Se ogni pagina del sito utilizza, per scrivere la sezione , la stessa SSI o una SSI scelta da un insieme ristretto, l’inclusione di un meta tag ICRA è semplice.

9.2 Più domini che fanno riferimento a un singolo sito

Se vi sono più domini che fanno riferimento a un sito (in questo contesto i nomi di dominio con e senza il prefisso www contano per due), una SSI che richiama una variabile di sistema può consentire notevoli risparmi di spazio.

Esempio 19: inserimento del nome di dominio con una SSI