« Frantext intégral 23.1 »

En date du 16/06/2023, le corpus Frantext intégral 23.1 comportait 5 633 textes de la période 950-2023. 348 121 551 éléments ont été indexés par le moteur Allegro 1.4.1.2 build 6709, soit 311 540 326 tokens (268 765 094 mots + 42 775 232 ponctuations) et 36 581 225 balises XML-TEI. Le corpus Frantext intégral 23.1 disposait également d'un ensemble de données prédéfinis : 9 corpus, 3 liste(s) de mots, 1 grammaire(s), 3 lexique(s) et 3 type(s) de données.

Nombre de textes et de tokens (mots + ponctuations)