« Frantext intégral 19.4 »

En date du 12/12/2019, le corpus Frantext intégral 19.4 comportait 5 430 textes de la période 1125-2019. 331 665 822 éléments ont été indexés par le moteur Allegro 1.4.1 build 2962, soit 296 994 863 tokens (256 165 357 mots + 40 829 506 ponctuations) et 34 670 959 balises XML-TEI. Le corpus Frantext intégral 19.4 disposait également d'un ensemble de données prédéfinis : 10 corpus, 3 liste(s) de mots, 1 grammaire(s), 3 lexique(s) et 3 type(s) de données.

Nombre de textes et de tokens (mots + ponctuations)