L'Uni de Neuchâtel met 700 millions de mots en ligne pour l'étude du français

02 févr. 2010, 10:02

L'Université de Neuchâtel, en collaboration avec l'Université de Leipzig, lance une nouvelle banque de données: Corpus français.

Comprenant quelque 700 millions de mots tirés de la presse, du web et de Wikipédia, cette banque de données permet de multiples recherches dans le domaine du lexique français contemporain écrit. Simple d'accès, le Corpus français est destiné à la fois aux chercheurs et au grand public.

Même s'il n'a pas la prétention de remplacer le dictionnaire, ce nouveau corpus de français en est un complément indispensable. Il présente l'avantage de mettre en évidence les mots et expressions les plus usités du français contemporain écrit.

Un outil particulièrement utile pour les non-francophones qui veulent apprendre la langue. Des chercheurs de l'Université de Neuchâtel s'appuient déjà sur ce corpus pour élaborer un manuel d'orthographe. /comm-réd.


Site internet: http://wortschatz.uni-leipzig.de/ws_fra