« Frantext intégral 19.1 »

En date du 23/04/2019, le corpus Frantext intégral 19.1 comportait 5 390 textes de la période 1125-2013. 328 001 530 éléments ont été indexés par le moteur Allegro 1.4 build 1849, soit 293 730 326 tokens (253 357 922 mots + 40 372 404 ponctuations) et 34 271 204 balises XML-TEI. Le corpus Frantext intégral 19.1 disposait également d'un ensemble de données prédéfinis : 10 corpus, 3 liste(s) de mots, 1 grammaire(s), 3 lexique(s) et 3 type(s) de données.

Nombre de textes et de tokens (mots + ponctuations)