Disons-le d’entrée, le bouleversement de notre paysage romand journalistique nous effraie: arrivera-t-on encore à penser ? La crainte est justifiée, le coup d’assommoir certain, mais il est plus que jamais urgent de scruter l’horizon apparemment obscure.
A l’ère du hacking et des hackers, la réserve d’images symboliques de la piraterie possède un rôle primordial: celui de la vigie. Grimper sur le mât, scruter, flairer ce qui peut advenir. C’est au printemps 2013 que j’ai appris l’existence d’un métier nouveau à mes oreilles: biocurator. Quatre ans plus tard, je vois poindre à l’horizon un nouveau métier potentiel pour les chercheurs issus des sciences humaines: les DH curators. Mais que recouvre donc ce jargon?
De part et d’autre, il s’agit de prendre soin, d’avoir cure des données informatiques, pour ce qui concerne les sciences de la vie avec les biocurators, et pour ce qui concerne les sciences humaines numériques, avec de potentiels Digital Humanists curators, ou DH curators, comme je propose de nommer ce qui pourrait être un nouveau métier.
Le biocurator exerce son métier en bioinformatique, ce nouveau domaine né du séisme de la rencontre entre biologie et informatique, et fédérée au sein de l’Institut Suisse de Bioinformatique. L’explosion de la littérature scientifique dans ces domaines a vu également l’augmentation du nombre d’erreurs publiées, au point qu’il a fallu mettre sur pied un métier devenu indispensable: le biocurator “assure la cohérence et la valeur des contributions de la communauté des usagers, en collaborant à maintenir des ressources libres d’erreurs”, comme l’explique un article de la revue scientifique Database.
La mutation numérique des sciences humaines pourrait donner naissance à ce type de métier, qui permettrait à certains docteurs de trouver une finalité à leur formation de pointe. Un outil autrichien créé dans le cadre d’un projet européen semble conduire à l’émergence d’un tel métier : Transkribus. Cet outil permet la reconnaissance semi-automatique des manuscrits. Contrairement aux méthodes visant à une lecture entièrement automatique des manuscrits (ROC ou OCR), Transkribus fait le pari de la collaboration humain-machine. Un/e chercheur/se transcrit d’abord entre 5’000 et 10’000 mots d’un manuscrit spécifique, aussi ardu soit-il à lire, et en nourrit la machine à apprendre. Transkribus peut lire la suite de lui-même, en assurant un taux d’erreur fort respectable. Il ne reste ensuite plus qu’au DH curator à rendre le texte libre d’erreurs, de manière similaire au travail des biocurators. Ce type de tâche continuera à exiger la maîtrise parfaite des langues concernées par le manuscrit.
Tôt au tard, on aura besoin de ce type de profil, même si, bien sûr, les sciences humaines ne sauraient rivaliser avec l’ampleur et les retombées économiques des sciences de la vie. Mais ces besoins vont néanmoins émerger. Il reste toutefois entre eux et nous un océan à traverser, vigie en alerte : l’apprivoisement de cet espace collaboratif entre l’humain et la machine.