Neuentwicklung OCR Pipeline in Scala 3
Projektrolle:Lead Developer|Software Architekt
Projektdauer:07/2025 — 08/2025
Branche:FinTech

Ralf Waldvogel
Neuentwicklung der OCR-Verarbeitungspipeline in funktionalem Scala 3 als Nachfolger des Java-basierten Systems. Integration von Tesseract OCR mit ALTO XML Output. Implementierung von Services für OcrXml-Verarbeitung, Zell-Merging und Debug-Visualisierung. Verwendung von ZIO-Effektsystem für robuste Fehlerbehandlung.
Technologien
- Scala 3 |
- SBT |
- Tesseract OCR |
- ALTO XML |
- ZIO (Effektsystem) |
- ScalaTest |
- JaCoCo (Code Coverage)