Zum Untermenü Springen Sie zum Katalogsuchfeld Springen Sie zum Website-Suchfeld Springen Sie zur Seite mit Informationen zur Barrierearmut Springen Sie zum Inhalt
Seitenleiste öffnen/schließen

Die Bibliothek der Milliarden Wörter

ESF-Nachwuchsforschergruppen-Projekt in Kooperation mit der Abteilung Automatische Sprachverarbeitung (ASV) und der Abteilung Bild- und Signalverarbeitung des Instituts für Informatik (BSV)

Genauso wie Bücher die Grundlage für traditionelle geistes­wissen­schaftliche Arbeit sind, werden im Forschungsgebiet der Digitalen Geisteswissenschaften (Digital Humanities) Text-Datenbanken benötigt. Gedruckte Texte sind leicht zugänglich, nicht zuletzt durch Bibliotheken wird der Zugang gewährleistet. Das Angebot an digitalen Textformaten hingegen ist stark heterogen und erschwert so die Nutzung. Die Nachwuchsforscher im Projekt "Die Bibliothek der Milliarden Wörter" entwickeln einen Prozeß mit dem sowohl neue als auch alte Werke als Volltext nachhaltig verfügbar gemacht werden sollen. Hierbei steht die Nutzung von bereits existierenden Open-Source-Softwarelösungen, sowie etablierte Daten-Standards im Vordergrund. Die Bibliothek soll als Lieferant für qualitativ hochwertige Texte, und weiter ihrer atomaren Bestandteile, Wörtern, gedacht und entworfen werden - die Bibliothek der Milliarden Wörter.