Projektbeschreibung
Neuentwicklung OCR Pipeline in Scala 3
Branche FinTech
von 07/2025
bis 08/2025
Neuentwicklung der OCR-Verarbeitungspipeline in funktionalem Scala 3 als Nachfolger des Java-basierten Systems. Integration von Tesseract OCR mit ALTO XML Output. Implementierung von Services für OcrXml-Verarbeitung, Zell-Merging und Debug-Visualisierung. Verwendung von ZIO-Effektsystem für robuste Fehlerbehandlung.
Technologien
- Scala 3 |
- SBT |
- Tesseract OCR |
- ALTO XML |
- ZIO (Effektsystem) |
- ScalaTest |
- JaCoCo (Code Coverage)