Joined the team
Textbausteine
Textbausteine in Urteilen markieren
Um schnell zu erkennen, was in einem Urteil neu ist, sollen immer wieder verwendete Textbausteine eingefärbt werden.
In jedem Urteil finden sich Textbausteine, die zuvor schon in zahlreichen anderen Urteilen zu lesen waren. Diese Challenge soll ein Tool hervorbringen, das zeigt, welche Textelemente in einem Urteil tatsächlich neu sind und welche schon in vielen anderen Urteilen enthalten waren. Dies kann durch Einfärbung oder Ausblenden oder Einklapp- bzw. Ausklapp-Funktion ermöglicht werden.
Research
Event finished
Joined the team
- consider implementing a consistent syntax to be used for all future BGEs (structured, ie. XML- or JSON-based)
Conclusions relative to HTML parser: - works reasonably well so far, there may be some occasional data loss - too many inconsistencies in the text data to reliably re-structure the data ; human post-processing of the script output is a must.
splitting references to extract their Art./Abs./lit. components.
data pulled from bger.li is unstructured ; parser tries to address this issue
dedicated HTML parser for bger.li
Project
Joined the team
Event started
Joined the team
First post View challenge