Le Mercure chez RetroNews

C’était cette fin août 2020 faite de déconfinements ébouriffés, de raves parties endiablées et de match de foot perdus. Avec mon ami Jean-Luc nous nous lamentions comme d’habitude sur les numéros du Mercure de France manquants, conversation récurrente chez tous les Léautaldiens.

Et j’achète des numéros papier par paquets de cinquante (surtout lui) et je scanne comme un forcené quelques numéros mythiques autant qu’introuvables dont je gorge la messagerie de l’autre… Et il y a des Picsous qui les vendent cinquante €uros. Dieu que l’humanité est basse…

Et les jours de désespoir et de pleine lune il y a RetroNews, site français, comme son nom l’indique. Quand l’humanité n’est pas basse, elle n’est pas si haute que cela sauf les jours d’équinoxe.

Bref RetroNews, c’est pour les désespérés. La chose est tellement triste et mal fichue qu’on dirait, je ne sais pas… Quelque chose pour les alcooliques anonymes. C’est plein d’espoir, en fait.

RetroNews on y va vraiment quand on ne peut pas faire autrement, quand Gallica et les copains ont fait tout ce qu’ils pouvaient. On s’abonne au mois pour pouvoir résilier, et en route pour le remplissage des champs.

Le brave homme télécharge, c’est toujours plus commode que les outils des uns et des autres. On exploite ce dont on a besoin dans des outils que l’on connaît, on jette le reste.

Donc le brave homme a besoin d’un numéro, il le télécharge. Il consulte son téléchargement et il se rend compte qu’il n’y a que les 99 premières pages. Mais un Mercure de France, ça fait couramment deux-cents pages, parfois trois-cents. Et il se dit, tiens, ils n’ont pas scanné la totalité du numéro et il trouve ces gens bizarres, mais il y en a, il paraît même qu’il en faut.

Ce qu’il ne sait pas le brave homme — parce que sur le web ce n’est pas vraiment comme ça que ça se passe — c’est qu’il faut demander les 99 pages suivantes, puis les suivantes encore, parfois quatre fois, pour un gros Mercure. Ni Gallica ni Archive.org ni Gutenberg ni d’autres sites gratuits ne nous ont habitués à ça.       
« Oui, mais Retronew, c’est payant.  
— Ah c’est payant ?  
— Oui.     
— Et même en payant il y a toujours le gros logo moche sur chaque page ?      
— Oui… »

Pour passer pour une andouille auprès de vos amis, RetroNew, il n’y a rien de mieux.

Surtout que — tous les amateurs le savent — les pages les plus intéressantes sont les dernières. Les premières ne sont que des extraits de romans. Oui, c’est bien, les romans, on ne dit pas, mais le Mercurologue et plus largement le lecteur de presse ancienne, ce n’est pas vraiment ce qu’il cherche.

Et comment fait-on pour les pages suivantes ?

Il y a deux barres d’outils. Celle de droite représentée ci-contre et celle de gauche, ci-dessous :

Cette barre d’outils à gauche n’a comme utilité que d’indiquer le nombre de page du numéro en cours. En effet il ne faut pas indiquer un nombre supérieur sauf à se faire rappeler à « utiliser la syntaxe ».
Lorsque l’on clique sur « Télécharger », s’ouvre la boîte de dialogue :

On se rend compte grâce à cette chatoyante boîte de dialogue qu’il faut entrer les pages voulues à la main sans jamais dépasser le volume de 99 pages ni le nombre de pages du numéro, indiqué dans la barre d’outils de droite (ici 292). C’est que ça ne rigole pas du côté des calculettes.

Ne vous laissez pas abuser par la case à cocher « PDF – Toutes les pages », ce n’est qu’une arnaque, qui ne permet absolument pas de télécharger « toutes les pages » d’un numéro du Mercure.

Mais il y a un autre problème (il faut savoir si l’on est chez les intellos de gauche ou chez les footballeurs). C’est qu’il y a parfois des pièges cachés, un peu comme dans les jeux vidéo où la surprise fait le sel du truc.

En effet, certaines pages de certains numéros ne peuvent pas être téléchargées. On ne vous dira pas lesquelles sinon ce ne serait plus un jeu. Enfin on va vous en donner une ou deux quand même. Prenons par exemple le numéro de mai 1903, qui comporte 292 pages. Une requête demandant les pages 200 à 292 affichera une page d’erreur. En fait on ne peut télécharger que jusqu’à la page 281. Il est possible de se rendre à la page 282 et de la lire, ce qui prouve que cette page existe bien. Mais rien d’autre. Un clic sur « Télécharger/Page active » ne permettra que de télécharger une OCR.

Si l’on cherche un peu plus avant, on se rend compte que si l’on demande le téléchargement des pages 283-292, ça fonctionne. Il se passe donc simplement que la page 282 provoque une erreur. C’est un coup classique du delirium tremens.

On peut aussi s’amuser avec le numéro du premier novembre 1906 où c’est la page 4 qui bloque le système. Le brave homme souhaitant télécharger les pages de 1 à 99 n’y arrivera pas. Ayant lu les paragraphes ci-dessus il fera un essai à 1-50 sans davantage de succès. Il tentera in piteux 1-10 puis laissera tomber. Non, il faut juste ne pas vouloir télécharger la page 4. D’ailleurs vous êtes sûr d’en avoir vraiment besoin ? Si ça se trouve c’est le sommaire. Qui a besoin d’un sommaire ?

Revenons à cette histoire d’OCR. Bien entendu le maniaque pervers aura tendance à vouloir récupérer l’OCR et l’insérer à la place de la page manquante. Et là, surprise, l’OCR et impeccable. Quand on s’est OCRisé les 6 500 pages Journal de Paul Léautaud et de nombreux autres documents, on est forcément champion olympique de l’OCR et il ne faut pas nous en raconter. En 2022, nous serons sur le podium. On sait bien que le résultat d’une OCR ne sera pas meilleur que la qualité du scan. Alors comment obtenir une OCR meilleure que le scan ? C’est qu’en est parti d’un autre scan, forcément.

En clair, RetroNew a scanné les Mercure en bonne qualité puis a réalisé les OCR et a ensuite dégradé la qualité des scans, parfois fortement — au point de rendre le texte illisible — avant de les proposer aux chercheurs qui ne méritent que la prison. Ils ne voudraient tout de même pas que nous travaillions (illi, subjonctif) confortablement, non ? Et puis quoi encore ?

Et vive la BNF !

Michel Courty