« Frantext intégral 20.1 »

En date du 06/10/2020, le corpus Frantext intégral 20.1 comportait 5 469 textes de la période 950-2019. 334 333 851 éléments ont été indexés par le moteur Allegro 1.4.1.1 build 3979, soit 299 308 409 tokens (258 177 340 mots + 41 131 069 ponctuations) et 35 025 442 balises XML-TEI. Le corpus Frantext intégral 20.1 disposait également d'un ensemble de données prédéfinis : 9 corpus, 3 liste(s) de mots, 1 grammaire(s), 3 lexique(s) et 3 type(s) de données.

Nombre de textes et de tokens (mots + ponctuations)