Frantext intégral 18.3 »

En date du 20/12/2018, le corpus Frantext intégral 18.3 comportait 5 350 textes de la période 1125-2013. 312 170 591 éléments ont été indexés par le moteur Allegro 1.2 build 1143, soit 291 058 214 tokens (251 243 880 mots + 39 814 334 ponctuations) et 21 112 377 balises XML-TEI. Le corpus Frantext intégral 18.3 disposait également d'un ensemble de données prédéfinis : 10 corpus, 3 liste(s) de mots, 1 grammaire(s), 3 lexique(s) et 3 type(s) de données.

Nombre de textes et de tokens (mots + ponctuations)