Pharus@e-teaching.org

Aus THM-Wiki
(Weitergeleitet von Hilfe zu Pharus)
Wechseln zu: Navigation, Suche

Suchen auf der Website e-teaching.org: http://pharus.e-teaching.org/

Bild 1: Pharus-Suchfilter für e-teaching.org


Das Projekt Pharus

Seit 2010 wird die Open-Source-Suchmaschine Pharus an der Technischen Hochschule Mittelhessen entwickelt und produktiv genutzt: https://pharus.thm.de/. Als Deep-Web-Suchmaschine integriert Pharus die Informationsrecherche in Online-Diensten (HIS-LSF) und Plattformen (LMS, CMS). Bisher wurden im Pharus-Projekt drei Bachelor- und drei Masterarbeiten angefertigt, weitere sind in Planung. Die Suchmaschine, ihre Open-Source-Technologien und Suchkonzepte sind Gegenstand des Master-Moduls "Information Retrieval" im THM-Studiengang Informatik.

Pharus basiert auf renommierten und gut gepflegten Open-Source-Projekten der Apache Software Foundation: Solr/Lucene (Suchserver), Nutch (Web-Crawler) und Tika (Parser für PDF- und Office-Dokumente), siehe http://lucene.apache.org/solr/.

Pharus-Projektsite: https://scm.thm.de/pharus

Die Kooperation mit e-teaching.org

Das Hessische Ministerium für Wissenschaft und Kunst beteiligt sich seit Januar 2011 an der Förderung und Weiterentwicklung von e-teaching.org. In der Diskussion um das Thema "Content Syndication" mit den E-Learning-Akteuren der hessischen Universitäten und Hochschulen im Kompetenznetz „E-Learning Hessen“ keimte die Idee auf, die Inhalte von e-teaching.org mittels „facettierter Suche“ auf dem Volltextindex der Website zu erschließen. Die an der TH Mittelhessen entwickelte Suchmaschine Pharus bot sich sich hierfür an.

Auf dem Workshop "Content Syndication" im Februar 2012 wurde die Pharus-Suchmaschine den Kooperationspartnern vorgestellt. e-teaching.org erwägt, nach einer Pilotphase Pharus auf ihrer Website zu integrieren. Auch auf den E-Learning/Teaching-Seiten der kooperierenden Hochschulen und Landesportalen ist eine Integration der Pharus-Suchmaschine denkbar.

Facettierte Suche

Im Web gibt es prinzipiell zwei Wege, den Informationspool einer Website zu erschließen: erstens via Navigation entlang einer Taxonomie des Inhalts (Menü-Links, Rubriken bei e-teaching.org) und zweitens via Volltextsuche. Der Usability-Experte Jakob Nielsen hat in seinen jüngsten Studien herausgefunden, dass die Volltextsuche immer mehr bevorzugt wird. Laut seiner Untersuchung ist eine schlechte Suchfunktion der häufigste Grund für das Scheitern einer Informationsrecherche. Die Informationsarchitektur einer Website ist zwar wichtig, aber längst nicht mehr das zentrale Usability-Kriterium.

Die facettierte Suche kombiniert beide Ansätze des Information Retrievals: Navigation und Suche. Sie erleichtert das Navigieren in großen Treffermengen, die durch eine Volltextsuche generiert wurden. Um eine umfangreiche Trefferliste weiter einzuschränken, muss sich der Nutzer keine Stichworte für eine präzisere Suchanfrage ausdenken. Es werden ihm auch nur Facetten (= Suchfilter) angeboten, die Treffer enthalten. Die Suchfilter können durch Hinzufügen oder Entfernen beliebig kombiniert werden. Hierzu klickt man einfach auf die Suchfilter, wie im Bild 1 gezeigt. Als Filter werden mit Ausnahme von "Literatur" die Hauptrubriken von e-teaching.org verwendet. Wer sich zum Beispiel für "Lehrszenarien" oder "Didaktisches Design" interessiert, klickt auf die gleichnamigen Filter, um nur solche Treffer angezeigt zu bekommen. Der Ranking-Algorithmus bestimmt dann die Reihenfolge der Treffer in der Vereinigungsmenge der Filter. Die hierarchisch aufgebauten URL-Adressen der Inhalte von e-teaching.org erleichtern die Facettierung der Suchergebnisse.

Pharus vs. Google

Im Gegensatz zu Google darf Pharus auch die Tiefe ausleuchten, das Intranet einer Hochschule, bestehend aus Lernplattform, Content-Management-Systemen und Archiven für Modulbeschreibungen. Diese Informationssysteme haben eine eigene Zugangskontrolle (Login und Passwort) und ein eigenes Rollen- und Berechtigungskonzept. Pharus@THM erlaubt den Zugang zu den webbasierten Systemen der THM unter Berücksichtigung der im THM-Verzeichnis (LDAP) hinterlegten Benutzergruppe der suchenden Person. Treffer in den verschiedenen Informationssystemen werden durch einmaliges Authentifizieren am SSO-Dienst der Hochschule auf https://cas.thm.de/ mit einem Klick angezeigt. Hat das Informationssystem neben dem Rollenkonzept auch ein eigenes Berechtigungskonzept, zum Beispiel nur einzelne Mitglieder eines Moodle-Kurses dürfen eine Ressource sehen und diese herunterladen, so hält auch Pharus sich daran und zeigt dem Benutzer nur für ihn zugängliche Ergebnisse an.

Weitere Kriterien, die für Pharus sprechen: Metadatenauswertung beim Suchen zur Präzisierung der Treffer, Volltextindex geschützt im eigenen administrativen Bereich, transparenter Ranking-Algorithmus, funktional und flexibel erweiterbar.

Pharus vs. Suchfunktion auf e-teaching.org

Bild 2: Farbkodierung der Pharus-Treffer mit Vorschaufunktion


Pharus implementiert das Konzept "universal search": nur ein Suchfeld für alle Informationsquellen. Derzeit hat die Suche auf e-teaching.org für die Rubrik "NotizBlock" ein eigenes Suchfeld. Es fehlen der dortigen Suche Usability-Features wie eine Vorschlagsliste beim Eintippen einer Suchanfrage (Auto-Suggest) und eine Rechtschreibprüfung à la "Meinten Sie ...?".

Weiterhin ist auf der Haben-Seite von Pharus zu vermerken:

  • Klare Zuordnung der Treffer zu den Haupt- und Unterrubriken von e-teaching.org mittels Icons und Farbkodierung, siehe Bild 2. Die Farbnavigation unterstützt die Orientierung des Benutzers, indem die Zugehörigkeit von Inhalten zu einem Inhaltsbereich visuell betont wird. In der Vorschau von Pharus für Einzeltreffer wird die gesamte Webseite des Treffers mit Menü-Navigation angezeigt, um so die visuelle Zuordnung des Treffers zu einer Rubrik zu erleichtern.
  • Anzeige der Trefferanzahl für alle Hauptrubriken, siehe die Mengenangabe hinter den Suchfiltern im Bild 1. Hier wird der maximale Umfang aller Rubriken gezeigt, da nach "e-teaching.org" gesucht wurde.
  • Clustering ("Zeige mehr von ...") zusammengehöriger Treffer, dadurch werden auch weit hinten stehende semantisch bezogene Treffer direkt zugänglich und gehen nicht in der Treffer-Paginierung "PHAAA...RUS" verloren.
  • Das Pharus-Feature „Auf gut Glück!“ erweitert das gleichnamige Google-Feature um die Option, Treffer mit Stichwörtern zu versehen. Bei einer Suchanfrage soll der Suchende mit einem Klick zum besten Suchergebnis gelangen. Was das beste Suchergebnis ist, die Landing Page zur Suchanfrage, haben Themen-Experten und -Expertinnen bestimmt und mit Stichwörtern (Tags) markiert.

Kontakt zu den Entwicklern

Feature Requests und Bug Reports können im Forum des Pharus-Projekts übermittelt werden: https://scm.thm.de/redmine/projects/eteaching-pharus/boards

Projektleiter: Klaus Quibeldey-Cirkel

Chef-Entwickler: Julian Hochstetter