Die Volltextsuche
Ziel bei der Entwicklung von PicApport ist es Fotos zu finden ohne allzu viel Aufwand betreiben zu müssen. Zur Einführung möchten wir hier kurz die Möglichkeiten der Volltextsuche in PicApport erläutern.
Selbstverständlich kann PicApport noch viel mehr. Siehe hierzu auch die weiterführenden Links am Ende dieser Seite.
Nach welchen Informationen kann gesucht werden?
PicApport unterscheidet zwischen vier Arten von Information (Metadaten) die in einem Foto gespeichert sind (siehe hierzu auch unten angefügtes Beispielbild):
- Dateiname und Pfad zur Fotodatei (Im Bild gelb)
Wie das Beispiel unten zeigt kann schon durch eine geschickte Wahl von Verzeichnisnamen viel erreicht werden. - Aufnahmedatum (Im Bild rot)
Diese Information ist in jedem Foto vorhanden (falls das tatsächliche Aufnahmedatum nicht in den Foto-Metadaten vorhanden ist, wird das Erstellungsdatum der .jpg Datei herangezogen) - Metadaten in der Fotodatei (Im Bild blau)
Über Zusatzprogramme (z.B. RAW-Konverter oder auch mit PicApport) ist es möglich weitere Informationen (Metadaten)
für ein Foto zu erfassen. - Zusätzliche Metadaten die über Synonymwörterbücher (Thesaurus) ermittelt wurden (Im Bild grün)
Dies ist ein sehr mächtiges Werkzeug um die Trefferquote beim Suchen nach Fotos zu erhöhen.
Ist der PicApport Server einmal konfiguriert sucht er regelmäßig in der vorgegebenen Verzeichnissen nach neuen Bildern.
Für jedes neue gefundene Foto versucht PicApport nun möglichste viele "Wörter" aus den vorhandenen Metadaten zu extrahieren und diese zur Suche anzubieten.
Hierbei werden Sonderzeichen oder Wörter mit weniger als 3 Buchstaben usw. eliminiert. Das folgende Bild soll diesen Vorgang anhand eines Urlaubsfotos aufzeigen.
(Einfach auf das Bild klicken um es zu vergrößern)
Warum benötigt man einen Thesaurus? (Synonymwörterbuch)
Definition (Quelle: Wikipedia) Ein Synonymwörterbuch (auch: Synonymenwörterbuch) ist ein Wörterbuch, das zu den aufgeführten Stichwörtern andere Ausdrücke (Synonyme) angibt, die die gleiche oder zumindest eine ähnliche Bedeutung aufweisen.
Oft stammen die Fotos der eigenen Fotosammlung aus verschiedenen Quellen. Die Bilder wurden dann oft schon mit Metadaten versehen.
Ein typisches Beispiel hierfür wären Bilder, die man von Freunden oder Verwandten bekommt. Man selbst benutzt z.B. das Wort Reise für Urlaubsreisen der Sohn aber Urlaub. Eine Suche nach Reise wird dann die vom Sohn gemachten Bilder die mit Urlaub bezeichnet sind nicht finden.
Weitere typische Anwendungsfälle für Synonymwörterbücher sind:
- Zusammenfassung ähnlicher / gleichbedeutender Wörter wie z.B.
- Mutter, Mama, Mutti, Mami, Mammi
- Fastnacht, Fasching, Karnaval
- Verschiedene Schreibweisen von Namen:
- Eric, Erik, Erick
- Stefan, Stephan
- Einfache Singular / Plural anpassungen
- Foto, Fotos, Photo, Photos
- Reise, Reisen, Urlaubsreise, Urlaubsreisen
- Einfache nachträgliche Korrektur von Schreibfehlern oder neuerer Schreibweisen durch die Rechtschreibreform
Manchmal stellt man erst nach Jahren fest, das man einen Namen oder ein Wort in den Metadaten der Fotos falsch geschrieben hat.
Mit einem Thesauruseintrag lässt sich das Problem rasch beheben ohne die Metadaten der betroffenen Fotos ändern zu müssen:
Beispiel: Yugoslawien(falsch) Jugoslawien(richtig)
Wie man ein Synonymwörterbuch erstellt, ist inklusive einer gut dokumentierten Beispieldatei auf Die Verzeichnisstruktur des PicApport Servers (unter dem Eintrag picapport/thesaurus) beschrieben.
Phonetische Suche
Definition (Quelle: Wikipedia) Die phonetische Suche ist ein Suchverfahren zur Suche nach ähnlich klingenden Wörtern und Lauten in den menschlichen Sprachen. Dabei wird mit Hilfe der Phonetik bzw. der Phonologie versucht, eine phonetische („klangliche“) Repräsentation eines Wortes zu finden und nach dieser zu suchen – zwei Wörter „passen“ dann zueinander, wenn sie die gleiche phonetische Repräsentation aufweisen.
Seit Version 7.5 unterstützt PicApport die phonetische Suche (Kölner Phonetik ist Vorgabe auf deutschen Servern) über den ~~Operator (Doppel-Tilde-Operator).
Beispiel: Eingabe ~~Maier findet Maier, Mayer, Meier
Und was ist Fuzzy-Search?
Unter Fuzzy-Search (unscharfe Suche) fassen wir in der Dokumentation die Benutzung und Konfiguration der phonetischen Suche, des Synonymwörterbuchs und der Tilde(~) Operatoren zusammen.
In Zusammenhang mit der phonetischen Suche, dem Thesaurus und der Tilde(~) Operatoren bietet PicApport mehrere Konfigurationsmöglichkeiten an. Beispielsweise kann definiert werden, ob bei jeder Suchanfrage automatisch auch im Thesaurus und/oder über die phonetische Suche gesucht werden soll oder nicht.
Siehe hierzu: fuzzysearch.* Konfiguration Thesaurus (Synonymwörterbuch) und phonetische Suche im PicApport-Server Guide
Fotos finden mit der Landkarte
Moderne Kameras und Handys ermöglichen es Fotos schon bei der Aufnahme mit einem Geo-Tag zu versehen. Auch nachträglich ist es möglich, z.B. mit PicApport, Geo-Tags für Fotos zu erzeugen.
Sind Fotos mit einem Geo-tag versehen, können diese sehr einfach über das integrierte Kartenmodul von PicApport abgefragt werden.
Ein kurzes Videotutorial hierzu findet sich hier: https://youtu.be/EwJ_tGUbwao
Stöbern in der Fotosammlung mit der relativen Suche
Hat man Fotos über die Volltextsuche gefunden, sind diese oft thematisch nicht zusammenhängend. Über die relative Suche kann nun ausgehend von einem bestimmten Foto (Thumbnail) eine neue Abfrage gestartet werden:
- Fotos vom gleichen Tag
- Fotos vom gleichen Monat
- Fotos vom gleichen Jahr
- Fotos innerhalb der selben Stunde
- Fotos im gleichen Verzeichnis
- Fotos in der Nähe (wenn GPS Informationen vorhanden sind)
- Fotos mit den selben Tags (auswählbar)
Der folgende Screenshot zeigt die Anwendung:
Die Timeline und der Verzeichnisbrowser
Typischerweise werden Fotos auf dem Server in einer hierarchischen Verzeichnisstruktur abgelegt. Zusammengehörige Fotos sind dann in einem Verzeichnis abgelegt.
Beispiel: \fotos\2019\07-urlaub-in-italien
Der Verzeichnisbrowser ist direkt über die Startseite (Landing-Page) von PicApport über "Verzeichnisse" aufrufbar und ermöglicht die Navigation durch die für den PicApport Server
konfigurierte Verzeichnisstruktur.
Die Timeline (ab Version 8.1) zeigt alle Verzeichnisse in Ihrem zeitlichen Kontext, unabhängig von Ihrer Position im Verzeichnisbaum, an. Ausschlaggebend für
die Position (zeitliche Einordnung) eines Verzeichnisses in der Timeline ist jeweils das älteste Foto im Verzeichnis. Die Timeline ist immer absteigend sortiert und
ermöglicht so den Zugriff auf aktuelle Fotos mit nur 2 Klicks. Angezeigt wird der Name des Verzeichnisses und der Titel des ersten Fotos das gefunden wurde. Ist der
Titel in ( ) angegeben gibt es Fotos mit verschiedenen Titeln im Verzeichnis.
Die eingebaute Filterfunktion innerhalb der Timeline ermöglicht Volltextfilterung auf Verzeichnisnamen und Titel. Ebenso kann durch Eingabe einer vierstelligen Jahreszahl
nach dem Jahr gefiltert werden. Der folgende Screenshot zeigt die einzelnen Elemente und Möglichkeiten der geöffneten Timeline.
Die Timeline kann über Benutzerspezifische Programmoptionen (User-Options) bzw. das Benutzerrecht "Berechtigung die Timeline zu benutzen. (Sichtbarkeit: Timeline)" gesteuert werden.
Selbstverständlich kann man die Timeline auch in der Onlinedemo ausprobieren: https://onlinedemo.picapport.de/picapport
Der Keywordbrowser
Der Keywordbrowser kann zur Abfrage von Schlagwörten, Personen und Mytags verwendet werden. Ein langer Klick mit der Maus oder dem Finger öffnet ein Kontextmenue mit weiteren Optionen.
Weiterführende Themen
- Eine Referenz aller möglichen Suchoperatoren findet sich hier: Volltextsuche über alle Bilder
- Eine detaillierte technische Beschreibung der von PicApport unterstützten Metadaten findet sich hier: Beschreibung der in PicApport verwendeten Metadaten