Ziele

Seit einigen Jahren verstärkt sich die Wahrnehmung, dass digitale Sprachressourcen ein hohes Potenzial besitzen, herkömmliche Forschungsmethoden der Sprachwissenschaft und der Geistes- und Sozialwissenschaften zu revolutionieren. Die Vision einer Nutzung von Big-Data-Methoden in diesen Wissenschaften erfordert den Einsatz moderner computergestützter Verfahren und Techniken, die umfangreiche sprachliche Datenmengen verarbeiten, analysieren und in strukturierter und skalierbarer Weise visualisieren können, und die flexibel auf neue Parameter und Anwendungskontexte anpassbar sind.

Der Leibniz-WissenschaftsCampus „Empirical Linguistics and Computational Language Modeling“ greift diese Entwicklung auf und bringt zwei international anerkannte Akteure in den beteiligten Wissenschaftsfeldern – der korpusbasierten empirischen Linguistik und der computationellen Sprachverarbeitung – in einem kollaborativen Forschungsumfeld zusammen. Im Leibniz-WissenschaftsCampus werden das IDS und das ICL durch die Analyse und Verarbeitung umfangreicher Korpusressourcen unterschiedlicher sprachlicher Genres und Domänen gemeinsam innovative Forschungsmethoden in empirischer Linguistik und computationeller Sprachverarbeitung entwickeln. Die resultierenden Forschungsmethoden und Sprachverarbeitungskomponenten werden in neuen Anwendungen der digitalen Geisteswissenschaften erprobt.

Der Leibniz-WissenschaftsCampus etabliert Kooperationen mit starken Partnern in der Linguistik und Computerlinguistik und wird mit Partnern aus den Geistes- und Sozialwissenschaften interdisziplinäre Inkubator-Projekte durchführen.