RegExtract: Daten extrahieren leicht gemacht
17.02.2025, 00:00 Uhr
Aber bitte typsicher
RegExtract ist eine moderne Bibliothek zur Extraktion von Daten aus Texten. Das Projekt kombiniert die Mächtigkeit regulärer Ausdrücke mit der Typsicherheit von C#.
Mit regulären Ausdrücken verhält es sich wie mit Trauben-Nuss-Schokolade: Die einen lieben sie, die anderen verabscheuen sie. Anspruchsvoll ist die komplexe Syntax allemal und führt nicht selten zu schwer lesbarem Code. Verschachtelte Gruppen und Capture-Groups erschweren noch dazu die Wartbarkeit. Fehlerhafte Muster bleiben oft bis zur Laufzeit unentdeckt, da die statische Typsicherheit von .NET hier nicht greift. Tests für die regulären Ausdrücke sind zwar möglich und wichtig, aber aufgrund der Komplexität der Muster ebenfalls aufwendig und komplex. Die Standard-Implementierung von RegEx erfordert zudem umständliche Typkonvertierungen, wenn extrahierte Werte in stark typisierte Objekte überführt werden sollen.
RegExtract [1] bietet einen neuen Lösungsansatz für diese Probleme. Die Bibliothek steht im Fokus dieser Episode der Kolumne Frameworks und mehr und ergänzt die bekannten RegEx-Funktionen von .NET um ein typsicheres API. Sie wandelt reguläre Ausdrücke automatisch in stark typisierte Extraktoren um. Muster lassen sich weiterhin als Strings definieren, die aber von Compile-Zeit-Prüfungen und direkter Konvertierung in Zieltypen profitieren. Die Bibliothek integriert sich nahtlos in bestehende .NET-Projekte und ermöglicht eine prägnante, wartbare Implementierung von Textextraktionen.
Jetzt 1 Monat kostenlos testen!
Sie wollen zukünftig auch von den Vorteilen eines plus-Abos profitieren? Werden Sie jetzt dotnetpro-plus-Kunde.
- + Digitales Kundenkonto,
- + Zugriff auf das digitale Heft,
- + Zugang zum digitalen Heftarchiv,
- + Auf Wunsch: Weekly Newsletter,
- + Sämtliche Codebeispiele im digitalen Heftarchiv verfügbar