Un corpus parallèle bilingue est un ensemble de textes dans deux langues (par exemple, anglais et français) où chaque phrase ou segment dans une langue est aligné avec sa traduction correspondante dans l’autre langue.
Ces corpus sont essentiels pour :
Ils permettent de comparer directement les structures linguistiques et les choix de traduction entre deux langues.
| Nom du corpus | Description | Accès |
|---|---|---|
| Cadlaws | Corpus juridique anglais-français basé sur des documents canadiens co-rédigés pour garantir l’équivalence légale. Plus de 16 millions de mots par langue. | Cadlaws PDF |
| CLARIN Parallel Corpora | Infrastructure européenne regroupant plus de 80 corpus parallèles, dont plusieurs en anglais-français. Utilisé pour la recherche linguistique et la traduction automatique. | CLARIN ERIC |
| ParCoLab | Corpus multilingue aligné au niveau des phrases, incluant le français et l’anglais (ainsi que d'autres langues). Utile pour la recherche linguistique et l’enseignement. | ParCoLab |