Enterprise Search 2.0
Erleichterter Zugang zu gesuchten Informationen dank Semantikanalyse
CELI integriert
Semantiktechnologien in die Suchmaschine DocDigger.
DocDigger analysiert den Inhalt von Portalen sowie Wissensdatenbanken und bietet dem Endnutzer innovative und verbesserte
Zugangsmöglichkeiten zu den enthaltenen Dateien.
Der Hauptvorteil von DocDigger besteht darin, optimale Ergebnisse
zu Spezialbereichen zu liefern. Im Gegensatz zu den herkömmlichen, im Internet verbreiteten allgemeinen Suchmaschinen
ist DocDigger in der Lage, Dateien bis zu einem gewissen Grade zu verstehen
und Fachausdrücke den jeweiligen Suchbereichen gemäß zu disambiguieren.
Dies erlaubt beispielsweise die Begriffsklärung eines Stichwortes wie "Note" in den jeweiligen Bedeutungen: Note (Musik), Schulnote, Banknote
bzw. Eigennamen wie Gerda Note.
Diese Treffsicherheit verdankt DocDigger der Integration von Semantikanalyse-Technologien, die das Ergebnis jahrzehntelanger
Forschung und Entwicklung sind.
Unter Berücksichtigung jüngster Forschungsergebnisse aus dem Bereich der Wissenschaft
integriert die Maschine insbesondere Symbolanalyse-Technologien (unter Verwendung von Wörterbüchern, Grammatiken, Thesauri, usw.)
mit Statistikanalyse-Algorythmen zur Potenzierung von Vorgängen wie der automatischen Klassifikation von Dateien,
Cluster-Bildung usw.
Für den Endnutzer bedeutet dies erhöhte Genauigkeit beim
Zugang zu relevanten Informationen sowie verkürzte Suchzeiten
Eigenschaften von DocDigger
Die linguistischen Fähigkeiten von Sophia Semantic Engine bieten Besserungen bei der Suche auf
Portalen sowie Wissensdatenbanken.
- Freitextsuche (erlaubt die Identifizierung der vom Benutzer eingegebenen Keywords
unabhängig von ihrer morfologischen Form).
- Identifizierung der
in bestimmten Dateien am häufigsten vorkommenden Begriffe sowie deren Verwendung
als Keyword zur erweiterten Suche.
- Automatische Zusammenfassung der in einer Datei enthaltenen Begriffe (Snapshot View).
- Erweiterung nach Begriffsähnlichkeit.
- Ansicht nach Kategorien.
- Automatische Klassifikation.
- Clustering (Dateiengruppierung nach nicht zuvor vom Nutzer bestimmten Ähnlichkeitsklassen)
- Automatische Extrahierung von Einheiten sowie deren Gebrauch bei der Suche (z.B.: Mail-Adressen, Datumsangaben, Firmennamen, Personennamen, Zahlen, usw. )
- Mehrsprachigkeit (derzeit verfügbare Sprachen: Italienisch, Englisch, Französisch)
Facetten-Browsing
DocDigger basiert auf Facettenklassifikation (Faceted Classification),
die über die Einschränkungen herkömmlicher Ordnungssysteme hinausgeht.
Dies ermöglicht einen mehrdimensionalen Ansatz, auf dessen Grundlage
Inhalte in Bezug auf ihre verschiedenen "Facetten" beschrieben und nach verschiedenen
Kriterien gefunden werden können.
Die mehrdimensionale Klassifikation erleichtert den Umgang mit Inhalten,
und dank der auf das Netz anwendbaren Taxonomie werden Hinweise sowie Anregungen zur erweiterten Suche
unter Berücksichtigung von Bedürfnissen und Erwartungen der Nutzer geboten.