next up previous contents
Next: Der Annotations-Editor und Annotationsgraph Up: Die Architektur Previous: Der Browser

Der Proxy

Der Proxy kann wegen der verwendeten STRAND shell nur auf einem UNIX Rechner gestartet werden. Nach dem Start fängt er alle eingehenden HTTP-Kommandos ab und modifiziert sie teilweise.

So werden die an ihn gerichteten Anweisungen, wie z.B. das Laden der Begrenzungssymbole oder der Aufruf der Tools, herausgefiltert und die entsprechenden Antworten, also die Symbole oder der mit dem Tool gekoppelte MIME type, an den Browser zurückgeschickt. Diese Anweisungen beginnen alle mit dem Hinweis ,,myURL``, also z.B.

SPMquothttp://myURL/cmd_annotate?www.irgendwo.de/huhu.html?noneendquote

Für den Proxy ist dabei nur die Anweisung nach ,,myURL/`` (,,cmd_annotate``) wichtig, um in diesem Fall den MIME type ,,application/tk-tool`` zu schicken.

Handelt es sich bei dem angeforderten Objekt dagegen um ein HTML-Dokument, werden die ihm bekannten Annotations-Server (z.Zt. noch sequentiell) nach Annotationen befragt und diese dann gesammelt an den Cache-Server geschickt. Danach (auch dies könnte parallel ablaufen) wird die Anfrage unverändert an den eigentlichen Proxy weitergereicht.

Kommt jetzt vom WWW-Server das geforderte HTML-Dokument, wird es erst einmal komplett zwischengespeichert und die Annotations-Funktionalität, die Hinweise auf enthaltene Annotationen sowie die Anweisungen an den Proxy eingefügt, bevor es an den Browser weitergeleitet wird.

Zwei nicht sofort ersichtliche Probleme ergeben sich noch beim Auffinden der selektierten Textstellen, um die Hinweise auf Annotationen einzufügen. Erstens ist ein Browser, der ursprünglichen Philosophie von HTML folgend, frei in der Darstellung der Dokumente, insbesondere im Zeilenumbruch. Da wir die, eventuell mehrzeilige, Selektion direkt aus dem Browser entnehmen, enthält diese eingelesene Zeilenumbrüche, die i.d.R. nicht im Dokument vorhanden sind und umgekehrt.

Zweitens fehlen im selektierten Text alle HTML-Tags. Diese im Dokument enthaltenen Kennzeichnungen von z.B. Hyperlinks oder eines fettzuschreibenden Wortes wurden bereits vom Browser interpretiert und ausgeführt.

Beides muß beim Suchen berücksichtigt werden.

SPMquothttp://myURL/cmd_annotate?www.irgendwo.de/huhu.html?noneendquote

Für den Proxy ist dabei nur die Anweisung nach ,,myURL/`` (,,cmd_annotate``) wichtig, um in diesem Fall den MIME type ,,application/tk-tool`` zu schicken.

Handelt es sich bei dem angeforderten Objekt dagegen um ein HTML-Dokument, werden die ihm bekannten Annotations-Server (z.Zt. noch sequentiell) nach Annotationen befragt und diese dann gesammelt an den Cache-Server geschickt. Danach (auch dies könnte parallel ablaufen) wird die Anfrage unverändert an den eigentlichen Proxy weitergereicht.

Kommt jetzt vom WWW-Server das geforderte HTML-Dokument, wird es erst einmal komplett zwischengespeichert und die Annotations-Funktionalität, die Hinweise auf enthaltene Annotationen sowie die Anweisungen an den Proxy eingefügt, bevor es an den Browser weitergeleitet wird.

Zwei nicht sofort ersichtliche Probleme ergeben sich noch beim Auffinden der selektierten Textstellen, um die Hinweise auf Annotationen einzufügen. Erstens ist ein Browser, der ursprünglichen Philosophie von HTML folgend, frei in der Darstellung der Dokumente, insbesondere im Zeilenumbruch. Da wir die, eventuell mehrzeilige, Selektion direkt aus dem Browser entnehmen, enthält diese eingelesene Zeilenumbrüche, die i.d.R. nicht im Dokument vorhanden sind und umgekehrt.

Zweitens fehlen im selektierten Text alle HTML-Tags. Diese im Dokument enthaltenen Kennzeichnungen von z.B. Hyperlinks oder eines fettzuschreibenden Wortes wurden bereits vom Browser interpretiert und ausgeführt.

Beides muß beim Suchen berücksichtigt werden.


next up previous contents
Next: Der Annotations-Editor und Annotationsgraph Up: Die Architektur Previous: Der Browser
root
1999-08-24