Das ICRA-System ist darauf ausgelegt, es Inhaltsanbietern zu ermöglichen, ihre Inhalte rasch, effizient und flexibel zu kennzeichnen. Um vorhersehbare Ergebnisse für Benutzer zu gewährleisten, müssen verschiedene Filter Kennzeichnungen einheitlich verarbeiten. Die empfohlenen Verarbeitungsregeln sind nachfolgend angegeben, um Inhaltsanbietern eine Beurteilung darüber zu ermöglichen, welches Verfahren am praktischsten für die Kennzeichnung ihres eigenen Materials ist.1
Für Filteranbieter sind auch ein Referenzmodul sowie detailliertere technische Informationen verfügbar, darunter wie Selbstkennzeichnungsdaten parallel zu Datenquellen von Drittanbietern verwendet werden können.
Für eine gegebene Ressource (eine Seite, ein Bild etc.) gibt es drei mögliche Quellen für eine Kennzeichnung:
- Es kann möglich sein, eine Kennzeichnung herzuleiten, indem Daten verarbeitet werden, die sich bereits im Cache (Speicher) des Filters befinden. Solche Kennzeichnungen werden nachfolgend als Typ 1 bezeichnet.
- Eine Ressource kann eine Verknüpfung zu Daten aufweisen, die Regeln enthalten, die zur Identifizierung einer Kennzeichnung befolgt werden können. Kennzeichnungen, die in von der Ressource selbst verknüpften Datenquellen identifiziert werden, werden nachfolgend als Kennzeichnungen des Typs 2 bezeichnet.
- Eine Ressource kann eine direkte Verknüpfung zu einer Kennzeichnung enthalten Kennzeichnungen, die eine direkte Verknüpfung von einer Ressource identifiziert werden, werden nachfolgend als Kennzeichnungen des Typs 3 bezeichnet.
Wie nachfolgend erläutert, SOLLTEN Filter jeder dieser Quellen aufsteigende Priorität zuordnen.
Figure 1: Die vor jeder Anforderung ans Internet durchzuführende Verarbeitung. |
Hat der Filter bereits eine Kennzeichnung für die angeforderte URL im Cache, ist Kennzeichnungstyp 1 sofort verfügbar. Wurde die Kennzeichnung ursprünglich von derselben Website wie die nun angeforderte URL abgerufen, SOLLTE die Kennzeichnung als Typ 2 betrachtet werden.
Wurden die Kennzeichnungsdaten im Cache von einer anderen Website abgerufen, bleibt die Kennzeichnung ein Typ 1, und die Ressource sollte abgeholt und auf weitere Daten überprüft werden.
Zum Beispiel:
- Eine Kennzeichnung des Typs 1 DARF NICHT verwendet werden, um den Zugang zu einer URL zu blockieren, bevor sie abgerufen wurde.
- Eine Kennzeichnung des Typs 2 KANN verwendet werden, um den Zugang zu einer URL zu blockieren, bevor sie abgerufen wurde.
Dafür gibt es mehrere Gründe, die jedoch alle auf den Grundgedanken zusammenlaufen, dass von einer Ressource verknüpfte Kennzeichnungen dem Inhaltsanbieter “näher” sind als Kennzeichnungen, die unter Umständen von jemandem mit wenig oder keiner Verbindung zu den beschriebenen Inhalten veröffentlicht wurden. Dies wird im nächsten Abschnitt ergänzt, indem Kennzeichnungen, die von der Ressource selbst verknüpft werden, weitere Priorität eingeräumt wird.
Kennzeichnungen des Typs 1 sind nicht mit Kennzeichnungen von Drittanbietern zu verwechseln. Ist ein Filter so konfiguriert, dass er Kennzeichnungen von der Quelle eines Drittanbieters wie einer Online-Datenbank oder einer Inhaltsanalyse anfordert, behandelt der Filter solche Daten separat. Kennzeichnungen des Typ 2 haben vornehmlich aus Gründen der Philosophie hiinter der Selbstkennzeichnung Vorrang gegenüber Kennzeichnungen des Typs 1.
Befinden sich keine Daten im Cache des Filters, MUSS die Ressource unter der URL abgefragt werden.
Figure 2 Die Verarbeitungsregeln nach dem Abrufen einer Ressource. |
Wenn die Ressource Verknüpfungen zu Kennzeichnungsdaten enthält, kann es notwendig sein, sie abzurufen und zu verarbeiten. (Bedenken Sie, dass Kennzeichnungen immer separat, nie innerhalb der Ressource selbst gespeichert sind.)
Wenn die Ressource eine Verknüpfung zu einer bestimmten Kennzeichnung enthält, fällt dies unter Typ 3. Da dies der höchsten Priorität der Hierarchie entspricht, ist es, wenn eine Kennzeichnung des Typs 3 verfügbar ist, nicht erforderlich, die korrekte Kennzeichnung für diese Ressource zu ermitteln.
Allerdings SOLLTEN Clients sehr wohl etwaige Hostrestriktionen prüfen. Eine Kennzeichnung sollte klarerweise nur dann als gültig anerkannt werden, wenn die Ressource, die darauf verweist, vom/von den deklarierten Host(s) stammt. Werden keine Hostrestriktionen deklariert, KANN ein Client die Kennzeichnung akzeptieren.
Die Kennzeichnungen des Typs 3 verliehene Priorität ist der entscheidende Schritt, der es Inhaltsanbietern ermöglicht, mit einer globalen Standardkennzeichnung und lokalen Ausnahmeregeln zu arbeiten.
Wenn die Ressource eine Verknüpfung zu derselben Ressource aufweist, die bereits zur Identifizierung einer Kennzeichnung des Typs 2 verarbeitet wurde, ist eindeutig keine weitere Verarbeitung notwendig; die korrekte Kennzeichnung wurde bereits ermittelt.
Wenn eine Verknüpfung jedoch auf eine andere Datenquelle als jene verweist, die bereits verwendet wurde, um eine Kennzeichnung des Typs 2 herzuleiten, SOLLTEN die neuen Daten verarbeitet werden. Der Grund dafür ist, dass die Möglichkeit besteht, auf einer Website eine beliebige Anzahl von Datendateien einzubauen, und es kann davon ausgegangen werden, dass diejenige, auf die von einer bestimmten Ressource verwiesen wird, der entspricht, deren Verwendung der Inhaltsanbieter beabsichtigt hat.
Sind in einer Ressource keine Verknüpfungen vorhanden, bleibt als einzige Information das, was vor dem Abholen der Ressource verfügbar war.
Wenn mehrere Kennzeichnungen desselben Typs verfügbar sind, stellt dies einen Fehler seitens des Inhaltsanbieters dar. Der Filter KANN beliebige davon verwenden, aus Gründen der Effizienz wird jedoch normalerweise nur die erste gefundene Kennzeichnung eines bestimmten Typs verwendet.
In dieser Phase hat der Filter überprüft, ob eine Kennzeichnung vorhanden ist, und, im Fall von mehreren Kennzeichnungen, die korrekte Kennzeichnung ausgewählt.
Ist für eine bestimmte Ressource keine Kennzeichnung vorhanden, empfiehlt die ICRA, dass Filter diese standardmäßig zulassen, es sei denn es handelt sich um eine (X)HTML-Webseite. Ob ungekennzeichnete (X)HTML-Webseiten blockiert oder zugelassen werden, sollte der Kontrolle des Benutzers obliegen.
Der Gedanke dahinter ist, dass, wenn eine Seite gekennzeichnet ist, der Ersteller vermutlich die Absicht hatte, alle Elemente innerhalb der Seite mit der Kennzeichnung abzudecken. Dem Ersteller ist unter Umständen gar nicht bewusst, dass für jedes Bild, jede externe Skript-Datei und jedes StyleSheet im Internet eine separate Anforderung erfolgt. Weit unüblicher ist der direkte Zugriff auf ein Bild, d. h. ohne dass es auf einer Seite angezeigt wird oder ohne dass der Benutzer über eine Verknüpfung von einer (X)HTML-Seite zu dem Bild gelangt.
Letztlich bleibt der Umstand, dass es zwar einfach für jeden Webmaster ist, Verknüpfungs-Tags in eine (X)HTML-Seite einzubauen, die Verknüpfung von Ressourcen wie Bildern zu einer Datenquelle jedoch das Konfigurieren des Servers bedingt. Dies ist in der Regel eine Aufgabe für professionelle Webmaster.