Bienvenue sur Tatoeba

– Pourrais-tu te présenter ?
Trang : Je suis Trang, fondatrice du projet Tatoeba et je suis récemment diplômée ingénieur en informatique.
– Et le projet Tatoeba ? Qu’est-ce que c’est ?
Trang : Tatoeba c’est une base de données de phrases traduites dans tout plein de langues.L’un des intérêts du projet est que les utilisateurs peuvent chercher un mot ou un groupe de mot, et trouver des phrases d’exemples contenant le(s) mot(s) recherché(s).On a actuellement plus d’un demi-million de phrases au total, dont 35000 phrases en espéranto.
C’est aussi un projet collaboratif où tout le monde peut venir enrichir la base de données avec ses propres phrases et corriger les phrases des autres, donc le contenu est en constante évolution.
Et puis c’est un projet libre, dans la mesure où on redistribue les phrases sous licence Creative Commons Attribution (CC-BY) et que le code source du site est sous licence AGPL.
– Comment t’es venue l’idée de lancer ce site ?
T : À l’époque où j’ai commencé le projet, j’étais entre autres assez frustrée que les dictionnaires en ligne soient si pauvres en phrases d’exemples alors qu’elles sont très utiles pour apprendre une langue. Je voulais un outil dans lequel on peut chercher n’importe quel mot, et on trouverait systématiquement des traductions, toujours accompagnées de phrases d’exemples, quelle que soit la langue d’origine et la langue cible.
– Tatoeba… ça veut dire quoi ? D’où vient ce nom ?
T : Tatoeba signifie “par exemple” en japonais. Le projet a été nommé comme ça parce qu’il fournit entre autre des phrases d’exemple pour des mots donnés. J’ai choisi un mot japonais par affinité. Le projet était initialement assez orienté vers le japonais vu que mon but était de rassembler en priorité des phrases d’exemple français-japonais.
– Quel est le portrait-robot de l’utilisateur de Tatoeba ?
T : Le point commun entre tous les contributeurs c’est qu’ils aiment les langues. Ce n’est pas rare qu’un contributeur sache parler plus de trois langues. Pour le reste c’est assez varié. On a des contributeurs de nationalités très variées et de toutes les tranches d’âge.
– A quel rythme se développe le projet ?
T : Au niveau du contenu, ces derniers mois on a facilement plus de 1000 nouvelles phrases ou traductions par jour (assez souvent 2000 même). L’espéranto est la langue qui a progressé le plus rapidement d’ailleurs.
Au niveau du site en lui-même, ça n’a pas énormément évolué parce que la communauté a grandi de manière assez importante et que le système en lui-même a atteint une certaine maturité. Mais il reste tout plein de fonctionnalités que l’on aimerait pouvoir implémenter, il faut juste qu’on trouve le temps…
– Et quels sont les projets pour la suite ?
T : On prévoit une nouvelle version du site, plus performante que la version actuelle, avec des fonctionnalités qui permettent aux contributeurs de contribuer de manière plus confortable. Mais c’est pas pour tout de suite.
En novembre (le 13 plus précisément) on va tenter de mettre en place notre premier “jour Tatoeba” qui aura lieu tous les mois. C’est un jour pendant lequel nos fervents contributeurs vont tenter de battre le record du nombre de phrases ajoutées en un jour (actuellement à 3465 phrases, le 18 août comme on peut le voir ici : http://tatoeba.org/eng/contributions/activity_timeline).

Print Friendly, PDF & Email