Problème UTF-8 importation scar

Bonjour,

J’ai créé des QCM (.quiz) via l’XML et dans ces QCM j’ai des accents (dans les questions ou réponses).
Une fois mes QCM finis, je crée le .scar avec mes QCM dedans.
J’importe le scar dans Scenari mais j’ai un problème d’UTF-8 comme ceci :


Pourtant dans mon XML j’ai bien la balise <?xml version="1.0" encoding="UTF-8"?> au début du fichier.
Comment puis-je régler ce problème ?

Merci d’avance

Bonjour,

Si je comprends bien, vous avez créé vous-même ces fichiers xml.

L’indication <?xml version="1.0" encoding="UTF-8"?> ne suffit pas à ce que le fichier soit réellement en UTF-8, et ce n’est manifestement pas le cas, mais très probablement de l’ISO-8859-1 (ou une variante proche si vous êtes dans Windows). Il vous faut revoir la manière dont vous créez vos flux xml en indiquant dans le langage de programmation ou à l’outil d’édition que vous utilisez qu’il faut enregistrer les chaines de caractères dans les fichiers avec l’encoding UTF-8.

1 « J'aime »

Oui j’ai créé moi-même les fichiers XML avec des scripts Python sur Jupyter. Ce qu’il me semble étrange c’est que si j’ouvre le fichier XML de base dans un éditeur de texte classique, l’encodage est bien pris en compte, c’est uniquement lors de l’importation qu’il me met une erreur de ce type.

Contrairement à un vrai parser xml, un éditeur de texte ne prend pas en compte l’indication <?xml version="1.0" encoding="UTF-8"?>. A la place, en général, il « sniffe » le contenu pour détecter l’encoding. Regardez bien dans les menus de votre éditeur de texte, vous avez souvent une indication de l’encoding détecté du fichier.

1 « J'aime »

C’était effectivement cela, c’est rajouté l’indication encoding = « utf-8 » lors de ma création de fichier et cela fonctionne lors de l’importation.
Merci