Latviešu prozas skaitītājs ir eksperimentāla teksta analīzes iespēju demonstrācijas vietne, kas ļauj aplūkot dažādus latviešu 19. un 20. gs. literāro darbu kvantitatīvos parametrus, piemēram, vārdu lietojuma biežumu, teikumu garuma statistiku, vārdšķiru sadalījumu, autoru lietotās leksikas bagātību, kā arī datus par korpusā iekļauto autoru dzīves ilgumu un darbu izdošanas laiku.

Laika gaitā tiek papildināts gan analizēto prozas darbu klāsts, gan funkcionalitātes.

Latviešu prozas skaitītāju veido Latvijas Nacionālā bibliotēka. Prozas korpusā iekļautie darbi atrodami Latvijas Nacionālajā digitālajā bibliotēkā. Tekstu morfoloģiskā marķēšana tiek veikta, izmantojot Latvijas Universitātes Matemātikas un informātikas institūta Mākslīgā intelekta laboratorijas izstrādāto rīku NLP-PIPE: Latvian NLP Tool Pipeline. Dati par autoriem un literārajiem darbiem tikuši apkopoti sadarbībā ar Latvijas Universitātes Literatūras, folkloras un mākslas institūta pētniekiem, izmantojot datubāzi literatura.lv. Analīze tiek veikta Jupyter Notebook programmēšanas vidē.


Digitālās pētniecības seriāls - Teksta datoranalīze un vizualizācija

Digitālās pētniecības seriāls - Periodikas digitalizācija