Page tree
Skip to end of metadata
Go to start of metadata

Die Volltextsuche

Ziel bei der Entwicklung von PicApport ist es Fotos zu finden ohne allzu viel Aufwand betreiben zu müssen. Zur Einführung möchten wir hier kurz die Möglichkeiten der Volltextsuche in PicApport erläutern.
Selbstverständlich kann PicApport noch viel mehr. Siehe hierzu auch die weiterführenden Links am Ende dieser Seite.

Nach welchen Informationen kann gesucht werden?

PicApport unterscheidet zwischen vier Arten von Information (Metadaten) die in einem Foto gespeichert sind (siehe hierzu auch unten angefügtes Beispielbild):

  • Dateiname und Pfad zur Fotodatei (Im Bild gelb)
    Wie das Beispiel unten zeigt kann schon durch eine geschickte Wahl von Verzeichnisnamen viel erreicht werden.

  • Aufnahmedatum (Im Bild rot)
    Diese Information ist in jedem Foto vorhanden (falls das tatsächliche Aufnahmedatum nicht in den Foto-Metadaten vorhanden ist, wird das Erstellungsdatum der .jpg Datei herangezogen)

  • Metadaten in der Fotodatei (Im Bild blau)
    Über Zusatzprogramme (z.B. RAW-Konverter oder auch mit PicApport) ist es möglich weitere Informationen (Metadaten)
    für ein Foto zu erfassen.

  • Zusätzliche Metadaten die über Synonymwörterbücher (Thesaurus) ermittelt wurden (Im Bild grün)
    Dies ist ein sehr mächtiges Werkzeug um die Trefferquote beim Suchen nach Fotos zu erhöhen.

Ist der PicApport Server einmal konfiguriert sucht er regelmäßig in der vorgegebenen Verzeichnissen nach neuen Bildern.

Für jedes neue gefundene Foto versucht PicApport nun möglichste viele "Wörter" aus den vorhandenen Metadaten zu extrahieren und diese zur Suche anzubieten.
Hierbei werden Sonderzeichen oder Wörter mit weniger als 3 Buchstaben usw. eliminiert. Das folgende Bild soll diesen Vorgang anhand eines Urlaubsfotos aufzeigen.
(Einfach auf das Bild klicken um es zu vergrößern)


Warum benötigt man einen Thesaurus? (Synonymwörterbuch)

Definition (Quelle: Wikipedia) Ein Synonymwörterbuch (auch: Synonymenwörterbuch) ist ein Wörterbuch, das zu den aufgeführten Stichwörtern andere Ausdrücke (Synonyme) angibt, die die gleiche oder zumindest eine ähnliche Bedeutung aufweisen.

Oft stammen die Fotos der eigenen Fotosammlung aus verschiedenen Quellen. Die Bilder wurden dann oft schon mit Metadaten versehen.
Ein typisches Beispiel hierfür wären Bilder, die man von Freunden oder Verwandten bekommt. Man selbst benutzt z.B. das Wort Reise für Urlaubsreisen der Sohn aber Urlaub. Eine Suche nach Reise wird dann die vom Sohn gemachten Bilder die mit Urlaub bezeichnet sind nicht finden.

Weitere typische Anwendungsfälle für Synonymwörterbücher sind:

  • Zusammenfassung ähnlicher / gleichbedeutender Wörter wie z.B.
    • Mutter, Mama, Mutti, Mami, Mammi
    • Fastnacht, Fasching, Karnaval
  • Verschiedene Schreibweisen von Namen:
    • Eric, Erik, Erick
    • Stefan, Stephan
  • Einfache Singular / Plural anpassungen
    • Foto, Fotos, Photo, Photos
    • Reise, Reisen, Urlaubsreise, Urlaubsreisen
  • Einfache nachträgliche Korrektur von Schreibfehlern oder neuerer Schreibweisen durch die Rechtschreibreform
    Manchmal stellt man erst nach Jahren fest, das man einen Namen oder ein Wort in den Metadaten der Fotos falsch geschrieben hat.
    Mit einem Thesauruseintrag lässt sich das Problem rasch beheben ohne die Metadaten der betroffenen Fotos ändern zu müssen:
    Beispiel: Yugoslawien(falsch) Jugoslawien(richtig)

Wie man ein Synonymwörterbuch erstellt, ist inklusive einer gut dokumentierten Beispieldatei auf Die Verzeichnisstruktur des PicApport Servers (unter dem Eintrag picapport/thesaurus) beschrieben.

Phonetische Suche

Definition (Quelle: Wikipedia) Die phonetische Suche ist ein Suchverfahren zur Suche nach ähnlich klingenden Wörtern und Lauten in den menschlichen Sprachen. Dabei wird mit Hilfe der Phonetik bzw. der Phonologie versucht, eine phonetische („klangliche“) Repräsentation eines Wortes zu finden und nach dieser zu suchen – zwei Wörter „passen“ dann zueinander, wenn sie die gleiche phonetische Repräsentation aufweisen. 

Seit Version 7.5 unterstützt PicApport die phonetische Suche (Kölner Phonetik ist Vorgabe auf deutschen Servern) über den ~~Operator (Doppel-Tilde-Operator).

Beispiel:  Eingabe ~~Maier findet Maier, Mayer, Meier

Und was ist Fuzzy-Search?

Unter Fuzzy-Search (unscharfe Suche) fassen wir in der Dokumentation die Benutzung und Konfiguration der phonetischen Suche, des  Synonymwörterbuchs und der Tilde(~) Operatoren zusammen.

In Zusammenhang mit der phonetischen Suche, dem Thesaurus und der Tilde(~) Operatoren bietet PicApport mehrere Konfigurationsmöglichkeiten an. Beispielsweise kann definiert werden, ob bei jeder Suchanfrage automatisch auch im Thesaurus und/oder über die phonetische Suche gesucht werden soll oder nicht.

Siehe hierzu: fuzzysearch.* Konfiguration Thesaurus (Synonymwörterbuch) und phonetische Suche im PicApport-Server Guide

Fotos finden mit der Landkarte

Moderne Kameras und Handys ermöglichen es Fotos schon bei der Aufnahme mit einem Geo-Tag zu versehen. Auch nachträglich ist es möglich, z.B. mit PicApport, Geo-Tags für Fotos zu erzeugen.

Sind Fotos mit einem Geo-tag versehen, können diese sehr einfach über das integrierte Kartenmodul von PicApport abgefragt werden.

Ein kurzes Videotutorial hierzu findet sich hier: https://youtu.be/EwJ_tGUbwao

Stöbern in der Fotosammlung mit der relativen Suche

Hat man Fotos über die Volltextsuche gefunden, sind diese oft thematisch nicht zusammenhängend. Über die relative Suche kann nun ausgehend von einem bestimmten Foto (Thumbnail) eine neue Abfrage gestartet werden:

  • Fotos vom gleichen Tag
  • Fotos vom gleichen Monat
  • Fotos vom gleichen Jahr
  • Fotos innerhalb der selben Stunde
  • Fotos im gleichen Verzeichnis
  • Fotos in der Nähe (wenn GPS Informationen vorhanden sind)
  • Fotos mit den selben Tags (auswählbar)

Der folgende Screenshot zeigt die Anwendung:

Weiterführende Themen

  • No labels