-
Article
Open AccessSearch and Harvesting across NFDI Consortia – Gaps and Challenges
Search and harvesting use cases on harmonised metadata play an important role in several activities on National Research Data Infrastructures (NFDI). The working group Search and Harvesting of the NFDI section...
-
Chapter
Text und Text Mining
Text repräsentiert Wissen. Im Unterschied zu den strukturierten Daten in einer Datenbank stellen Texte unstrukturierte Daten dar. Eine wichtige Eigenschaft natürlicher Sprachen ist Redundanz. Im Text Mining we...
-
Chapter
Maschinelle Verarbeitung von Text
In diesem Kapitel werden verschiedene Ansätze zum Verarbeiten von elektronisch verfügbarem Text dargestellt. Dies umfasst insbesondere die regelbasierte Verarbeitung durch Extraktionsmuster, die Verarbeitung d...
-
Chapter
Sprachstatistik
Anliegen der Sprachstatistik ist es, die Texte nur als Wortfolgen zu betrachten und aus diesen Folgen sinnvolle Zusammenhänge zu extrahieren. Dies beginnt mit Untersuchungen zu Worthäufigkeiten, speziell dem Z...
-
Chapter
Beispielanwendungen
Von der Vielzahl an Verwendungsmöglichkeiten des Text Mining werden in diesem Kapitel sechs Anwendungen vorgestellt, welche den Einsatz der in den vorangegangenen Kapiteln besprochenen Konzepte und Verfahren b...
-
Chapter
Linguistische Repräsentationen
In diesem Kapitel behandeln wir die linguistischen Strukturen eines Textes, die beim Text Mining mit ausgewertet werden müssen. Grundlage ist die auf den linguistischen Strukturalismus zurückgehende Beobachtun...
-
Chapter
Sprachdaten: Lexika und Korpora
Dieses Kapitel widmet sich der Auswahl der verwendeten Daten für das Text Mining. Hier unterscheiden wir Textdaten für die Erstellung von Korpora und lexikalische Ressourcen wie Lexika oder Wortlisten. Bei der...
-
Chapter and Conference Paper
Putting Users in the Loop: How User Research Can Guide AI Development for a Consumer-Oriented Self-service Portal
This study investigates three challenges for develo** machine learning-based self-service web apps for consumers. First, we argue that user research must accompany the development of ML-based products so tha...
-
Chapter
Maschinelles Lernen für Sprachverarbeitung
In diesem Kapitel werden Aspekte des maschinellen Lernens behandelt, welche für die Verarbeitung von Text relevant sind. Im maschinellen Lernen erfolgt die Repräsentation sprachlicher Objekte wie Wörter oder D...
-
Article
Open AccessErratum zu: Editorial
-
Article
Multi-modal page stream segmentation with convolutional neural networks
In recent years, (retro-)digitizing paper-based files became a major undertaking for private and public archives as well as an important task in electronic mailroom applications. As first steps, the workflow u...
-
Chapter
CLARIN-D: An IT-Based Research Infrastructure for the Humanities and Social Sciences
The paper discusses the idea of bridging the gap between computer sciences and the humanities by referring to an e-humanities infrastructure that provides tools and services for well-defined and frequently enc...
-
Article
Open AccessEditorial
-
Article
Open AccessThe Road Map to FAME: A Framework for Mining and Formal Evaluation of Arguments
Two different perspectives on argumentation have been pursued in computer science research, namely approaches of argument mining in natural language processing on the one hand, and formal argument evaluation o...
-
Chapter and Conference Paper
Convolutional Attention on Images for Locating Macular Edema
Neural networks have become a standard for classifying images. However, by their very nature, their internal data representation remains opaque. To solve this dilemma, attention mechanisms have recently been ...
-
Article
A Big Data Case Study in Digital Humanities
While the volume of primary data in the text oriented humanities is small in comparison to the terabytes that are nowadays standard in Big Data applications, secondary data that are the result of scholarly ann...
-
Chapter and Conference Paper
The Null Result Portal
Null results occur in every discipline and research field. While positive results are usually published null results are underrepresented in the literature. Nevertheless, they can contribute to knowledge of t...
-
Article
Editorial
-
Chapter and Conference Paper
Exploiting Co-Occurrence of Low Frequent Terms in Patents
This paper investigates the role of co-occurrence of low frequent terms in patent classification. A comparison is made between indexing, weighting single term features and multi-term features based on low freq...
-
Chapter
Soziale Netzwerke und inhaltsbasierte Suchein P2P-Systemen
Im Folgenden präsentieren wir eine Anwendung der netzwerkbasierten Analyse von sozialen Strukturbildungsprozessen in der Informatik für eine Verbesserung der Dokumentensuche in Netzwerken, die auf sog. Peer-to...