URL Checking (Vérification de l'URL)

La fonction URL Checking:

  • recense les URL du document (qu'elles se présentent déjà sous la forme d'un hyperlien Word ou non),

  • en fait des champs Hyperlink de Word et, ainsi, des hyperliens sur lesquels il est possible de cliquer, si ce n'est pas déjà le cas,

  • corrige automatiquement les problèmes courants de caractères spéciaux ou d'espaces,

  • vérifie sur le Web que le lien est valide.

Les URL valides – celles qui peuvent être suivies sans redirection vers le site Web indiqué – ne sont pas balisées. Les URL dont le code HTTP n'est pas 200 (ce code indiquant qu'il n'existe aucune erreur HTTP) feront l'objet d'un commentaire Word destiné à attirer l'attention de l'auteur sur le fait que l'URL n'est pas valide et à indiquer l'erreur rencontrée à l'occasion de l'essai du lien.

Par exemple, un lien qui renvoie à une page qui n'existe pas fera l'objet d'un commentaire Word dans lequel sera indiqué que le serveur a retourné une erreur HTTP 404 ("Not Found", non trouvé): http://www.inera.com/~kdkdkd

L'URL n'a pas été validée, car la page http://www.inera.com/~kdkdkd n'existe pas (erreur HTTP 404).

En outre, la fonction URL Validation (validation de l'URL) essaiera aussi de rectifier les URL qui contiennent des caractères invalides ou des espaces, qui sont parfois insérés dans le processus d'édition. Par exemple, une URL contient parfois un espace, ce qui la rend inutilisable dans un navigateur. Si possible, la fonction de validation de l'URL supprimera les espaces fautifs et incorporera un message de ce type:

The URL "http://dtd.nlm.nih.gov/  faq.html" has been corrected. One or more spaces were removed.

Le nettoyage peut aussi consister à remplacer les tirets demi-cadratin par des traits d'union ou des caractères analogues par un simple tilde.

Il est préférable d'exécuter la fonction URL Checking après la fonction Bibliographic References, car les URL sous forme d'hyperliens cliquables qui figurent dans des listes de références nuisent à la reconnaissance des références électroniques pendant le traitement via la fonction Bibliographic References.

Par ailleurs, eXtyles corrige les URL, sans le notifier, quand la seule modification consiste à changer http par https. Dans ces cas, une fois qu'une URL a été correctement validée, le message suivant apparaît:

URL redirigées

Il ressort des données d'expérience que le message d'avertissement le plus fréquemment reçu dans le cadre de l'utilisation de la fonction URL Checking est qu'une URL a été redirigée vers une URL finale différente. Ce changement a de nombreuses explications, y compris les suivantes:

  • Un site Web a été réorganisé et le responsable (avisé) du site a automatiquement redirigé les anciennes URL vers les nouvelles pages. Dans ces cas de figure, il est souhaitable de mettre à jour l'URL dans le document pour qu'elle corresponde à la dernière URL en date.

  • Une URL de vanité a été utilisée. Par exemple, certains fabricants de médicaments enregistreront un domaine pour un nom de médicament, mais l'URL du site Web du médicament renverra en fait sur la page d'accueil du site Web du fabricant. Dans ces cas, il est souhaitable de conserver l'URL de vanité pour le médicament (malgré le message d'avertissement concernant la redirection), car le fabricant de médicament pourrait être racheté, et la page d'accueil finale changée. En d'autres termes, quand une URL est redirigée, nous recommandons de conserver dans le document l'URL dont la durée de validité sera probablement la plus longue.

  • Certaines URL sont toujours redirigées. Par exemple, les articles publiés sur le site Web du New York Times ont une nouvelle URL finale unique à chaque visite, même si l'URL sur laquelle vous cliquez au départ est toujours la même. En l'espèce, les URL sont redirigées à des fins de suivi des visiteurs Web. Dans ces cas, il est possible de passer outre le message d'avertissement concernant la redirection.

URL exclues

La fonction URL Checking ne vérifie pas les URL qui renvoient à PubMed ou à Crossref, car il est probable que ces liens aient été ajoutés par eXtyles.

Limites à la fonction URL Checking

Les limites de la fonction URL Checking sont les suivantes:

  • Si un hyperlien ne fait l'objet d'aucun commentaire après validation de l'URL, rien ne garantit qu'il renvoie vers une page existante. Sur certains sites Web, les liens vers des pages désormais disparues sont redirigés vers une page type qui indique que la page souhaitée a été déplacée. Pour les cas complexes, rien ne remplace à ce jour la vérification manuelle de chaque page.

  • Un hyperlien Word fondé sur une propriété "mailto", qui indique qu'il renvoie vers une adresse mail, ne sera pas validé.