« Frantext intégral 19.2 »

En date du 03/06/2019, le corpus Frantext intégral 19.2 comportait 5 415 textes de la période 1125-2018. 329 652 072 éléments ont été indexés par le moteur Allegro 1.4.1 build 2692, soit 295 212 076 tokens (254 641 419 mots + 40 570 657 ponctuations) et 34 439 996 balises XML-TEI. Le corpus Frantext intégral 19.2 disposait également d'un ensemble de données prédéfinis : 9 corpus, 3 liste(s) de mots, 1 grammaire(s), 3 lexique(s) et 3 type(s) de données.

Nombre de textes et de tokens (mots + ponctuations)