Die Suche nach der perfekten Suche

Schon seit einigen Monaten haben wir auf der Basis von Lucene an einer Volltextsuche für unsere Kurse gearbeitet. Überraschenderweise war das gar nicht so einfach gut lösbar und zwar deshalb nicht, weil der Textumfang eines Kurses deutlich geringer ist als der einer Online-Bibliothek.

So sieht das Suchergebnis aus. Unter "Weitere Ergebnisse" finden sich auch alle Erwähnungen - der Vollständigkeit halber.
So sieht das Suchergebnis aus. „Beste Ergebnisse“ zeigt ausschließlich Stellen, an denen der Suchbegriff behandelt wird. Unter „Weitere Ergebnisse“ finden sich auch alle Erwähnungen – der Vollständigkeit halber.

Eine typische Bibliothek hat bei Symposion etwa 10 Bücher mit jeweils 25 Kapitel a jeweils 25 Seiten. Mehr als 6.000 Seiten verteilen sich demnach auf 250 Kapitel. Das macht die Volltextsuche leicht: Die Suchmaschine stellt zunächst fest, in welchen der Kapitel sich ein Suchbegriff häuft und nimmt dann eine Gewichtung vor, die in der Lucene-Standardeinstellung schon sehr gut ist.

Aber durch die Auswertung solcher Häufungen bleibt eines der zentralen Probleme jeder Suche in der Regel verborgen: Die Unterscheidung zwischen einer Erwähnung und einer Behandlung des Suchbegriffs. Damit ist gemeint, dass es einen großen Unterschied macht, ob ein Kapitel mit dem Satz beginnt „<Suchbegriff> wird in diesem Kapitel nicht behandelt“ oder „In diesem Kapitel werden wir uns nun eingehend mit <Suchbegriff> beschäftigen“. Fall 1 wird im Ranking der Suchmaschine einfach deshalb nicht sehr weit oben auftauchen, weil der Suchbegriff vermutlich nur an dieser einen Stelle im Kapitel vorkommen wird. Fall 2 wird vermutlich sehr viel höher im Ranking zu finden sein, weil man erwarten kann, dass der Suchbegriff in diesem Kapitel häufiger vorkommt, vielleicht im Schnitt sogar mehr als einmal pro Seite.

Ein Kurs dagegen hat einen Textumfang von, sagen wir, 10 Kursteilen mit jeweils 80 Folien. Der Anspruch an eine Volltextsuche muss hier nicht nur sein, die Kursteile zu identifizieren, in denen der Suchbegriff häufig vorkommt, sondern zusammenhängende Folienbereiche, auf denen der Suchbegriff tatsächlich abgehandelt wird.

Auch das könnte die Suchmaschine zwar leicht lösen, da aber jeder Kursteil durch 3 Überschriftenhierarchien gegliedert wird, muss weiter berücksichtigt werden, dass das Vorkommen einer gleich- oder höherrangigen Überschrift einen Folienzusammenhang aufheben kann. Ein Beispiel: Eine Überschrift 2. Grades lautet „Über alles außer Grün“ und beherrscht die folgenden 10 Folien. Danach folgt eine weitere Ü2 „Über die Mischung aus Blau mit Gelb“, die weitere 10 Folien beherrscht, auf denen der Begriff „Grün“ achtmal vorkommt. Wenn nun nach <Grün> gesucht wird, dann darf das Suchergebnis weder nahelegen, dass der Bereich „Über alles außer Grün“ für den Suchenden relevanter sei als der Bereich „Über die Mischung aus Blau mit Gelb“, noch darf es als Ergebnis einen durchgehenden Bereich von 20 Folien präsentieren. Und wenn auf der letzten Folie im Bereich „Über alles außer Grün“ der Text „im nächsten Kursteil geht es dann um die Farbe Grün“ steht, dann sollte natürlich das Suchergebnis auch keinen Zusammenhang vorgaukeln, der auf dieser letzten Folie beginnt und sich bis zum Ende des folgenden Bereichs zieht.

Work in Progress: mit diesem komplizierten Suchergebnis können wir prüfen, ob die Suche den Unterschied zwischen Erwähnung und Behandlung gut verstanden hat.
Work in Progress: mit dieser etwas komplizierten Arbeitsansicht können wir prüfen, wie gut die Suche den Unterschied zwischen Erwähnung und Behandlung schon verstanden hat.

Das alles hört sich ziemlich konstruiert und theoretisch an, deshalb meine Empfehlung: Testen Sie die neue Kurssuche doch einfach einmal und schreiben Sie mir an wrede@symposion.de, was Sie davon halten, was wir verbessern sollten und welche Fehler Sie gefunden haben.

Video-Test

Idee von August 2015.

Die Startseite für die Tests unserer Online-Kurse könnte attraktiver gestaltet werden. Zum Beispiel könnte es einen kleinen, niedrigschwelligen Test geben, der Interessenten auch dann neugierig macht, wenn sie sich noch gar nicht auf die ernsthaften Tests einlassen wollen.

Gut geeignet könnte dafür ein Video-Test sein, der folgendermaßen funktioniert:

Ein Sprecher trägt die Definition des zentralen Begriffs des jeweiligen Kurses vor – z.B. im Kurs „Kundencontrolling“ entweder die Definition von „Kundencontrolling“ oder von „Kundenmanagement“. Doch in die Definition ist mindestens eine Aussage eingeschmuggelt worden, die gar nichts mit dem Begriff zu tun hat oder der korrekten Definition sogar widerspricht.

Der Nutzer hat nun die Aufgabe herauszufinden, welcher Satz oder welche Sätze nicht zur Definition passen.

Neuer Kurs und neue Startseite

Idee von Mitte 2014, realisiert im März 2015.

Seit ein paar Tagen ist der neue Kurs zum Thema „Lebensmittelsicherheit“ online. Er richtet sich an Mitarbeiter von Unternehmen, die Lebensmittel herstellen oder verarbeiten. Man kann sich gut vorstellen, dass es in diesem sensiblen Bereich eine Fülle von Gesetzen und Vorschriften gibt, die es zu beachten gilt. Es gibt aber natürlich auch die entsprechenden Methoden, mit denen die Unternehmen ihren Pflichten sicher, systematisch und gut dokumentiert nachkommen können.

Die beiden wichtigsten Methoden, HACCP und FMEA, werden in diesem Kurs ausführlich dargestellt und praxisorientiert vermittelt.

Insbesondere in der Lebensmittelindustrie, im Lebensmittelhandwerk und in der Gastronomie ist dieses Wissen unverzichtbar. Der Kurs richtet sich an Beauftragte für Lebensmittelsicherheit oder QM-Beauftragte, deren Mitarbeiter und andere beteiligte Personen in den Unternehmen.

Mit diesem Kurs führen wir ein neues Layout ein, das das Angebot übersichtlicher und intuitiver machen soll. Neu ist zum Beispiel die Startseite, die in Zukunft das „Schaufenster“ des jeweiligen Kurses sein wird.

Lebensmittelsicherheit Startseite

Die drei Bereiche „Kurs“, „Tests“ und „Bibliothek“ sind nun deutlich abgesetzt von ihren Untergliederungen. So hat zum Beispiel der Kursbereich von „Lebensmittelsicherheit“ neun Kursteile.

Lebensmittelsicherheit VideoBeim ersten Aufruf wird der Kursaufbau animiert dargestellt, damit es leichter wird, sich sofort zurecht zu finden.

Auf der Startseite bieten wir zukünftig immer ein Video an, das eine kurze Einführung in den Kurs gibt.

Dieses Video soll dem Interessenten helfen zu entscheiden, ob der Kurs eine gute Lösung für den Informationsbedarf seines Unternehmens ist.

Overheadprojektor 2.0

Eine Idee aus Dezember 2013.

Wer erinnert sich noch an den guten alten Overheadprojektor? In einem abgedunkelten Raum wurden transparente Folien auf ein großes, geräuschvolles (der Lüfter!) Gerät gelegt und der Vortragende zeichnete mit einem Farbmarker auf der Folie während er erklärte, was das bedeuten sollte.

Wir wollen diese gute Idee webifizieren. Dazu arbeiten wir mit Herrn Prof. Jansen und seinem Team von der   Hochschule Ruhrwest zusammen. In der Kooperation entwickeln wir eine Tablet-Anwendung, mit der Autoren zeichnend und sprechend Zusammenhänge besser erklären können. Aus Wort und Text wird von der Anwendung ein Video erstellt und nach Fertigstellung auf einen YouTube Kanal hochgeladen, von wo aus es dann in Produkte eingebunden werden kann, zum Beispiel in einen Online-Kurs.

Overhead Screen

Die Videos können bearbeitet werden. Es wird möglich sein, Videos an gewünschten Stellen zu unterbrechen um Fragen einzufügen. Solche Fragen muss der Lernende dann beantworten, bevor das Video fortgesetzt wird (mit der korrekten Antwort).

Overhead Quiz

Die letzte Präsentation der HS Ruhrwest fand vorgestern, am 16. März 2015, hier in Düsseldorf statt. Die Anwendung ist so gut wie fertig und die Präsentation war so spannend, dass ich glatt vergessen habe ein paar Fotos zu machen.

Neuer Kurs: Methoden des Qualitätsmanagements

Die Startseite des neuen Kurses
Die Startseite des neuen Kurses

Ich finde es gut, dieses Blog mit einem Post über den neuen Online-Kurs zu beginnen, den wir zusammen mit der RWTH Aachen entwickelt haben. Mit ihm werden in Zukunft über 1.000 angehende Ingenieurinnen und Ingenieure die wichtigsten QM-Methoden kennenlernen. Denn dieser Kurs begleitet die wahrscheinlich größte QM-Vorlesung Deutschlands. Es ist ja ein bekanntes Problem, dass der Nutzen von Vorlesungen für die Studenten tendenziell absinkt je größer die Anzahl der Hörer wird. Viele Studenten – und nicht die schlechtesten – gehen deshalb kaum noch zur Vorlesung, sondern bereiten sich anders vor (siehe diesen Meinungsbeitrag in der Zeit). Prof. Dr.-Ing. Robert Schmitt, Inhaber des Lehrstuhls für Fertigungsmesstechnik und Qualitätsmanagement, hatte die Idee, seinen Studenten mehr zu bieten, als nur ein Skript. In Zukunft sollen seine Hörer die Vorlesung nacharbeiten und den Stand ihres Wissens durch die Beantwortung von Fragen besser überprüfen können.

Einen kostenlosen Testzugang gibt es hier.

Prof Schmitt
Prof. Robert Schmitt
IDD
Beispiel für eine Image-Drag-and-Drop Frage

Die Arbeit mit Prof. Schmitt und seinen Mitarbeitern hat besonders viel Spaß gemacht. Wir als Verlag haben viel Neues über die Vermittlung von Inhalten gelernt und nicht zuletzt haben uns die Aachener auf ein neues interaktives Frageformat gebracht: Image-Drag-and-Drop. Beim IDD wird eine Frage dadurch beantwortet, dass Bildelemente an die richtige Stelle auf einem anderen Bild gezogen werden – sehr cool!

Zum ersten Mal haben wir für diesen Kurs auch Webcast-Videos produziert, kurze Animationen, mit denen komplexe Zusammenhänge leicht verständlich gemacht werden können.

Der Kurs vermittelt die Grundkenntnisse zu den Methoden des Qualitätsmanagements nach unserer Einschätzung so praxisbezogen, dass wir ihn auch an Qualitätsverantwortliche in Unternehmen verkaufen. Diese Teilnehmer werden eine Prüfung in Aachen ablegen können und damit ihr persönliches Zertifikat als „QM-Expert“ erlangen. So wird aus dem Schlagwort „lebenslanges Lernen“ ein ganz konkretes Angebot.