Aller au contenu principal

📋 E-facturatie wordt verplicht in steeds meer EU-landen. Download UBL Buddy en wees voorbereid.

Type something to search...

Convertir une facture PDF en UBL — est-ce possible ? Ce qui fonctionne (et ce qui ne fonctionne pas) lors de la conversion d'une facture PDF en XML

  • Facturation electronique
  • 30 Apr, 2026
  • 8 min de lecture

En bref : convertir une facture PDF en véritable facture UBL/Peppol n’est pas une simple conversion de fichier — c’est de l’OCR couplé à de l’extraction de données. C’est possible, mais le résultat n’est jamais plus fiable que le moteur d’OCR utilisé. Pour les factures entrantes, la conversion est rarement nécessaire : votre fournisseur doit vous transmettre un véritable XML. Pour vos propres factures sortantes, mieux vaut les émettre directement au format UBL depuis votre logiciel de comptabilité.

Vous avez une pile de factures PDF à intégrer dans votre système, ou un fournisseur exige de l’UBL alors que vous n’avez qu’un PDF. La question évidente : peut-on simplement convertir un PDF en UBL ?

La réponse courte est oui, mais pas comme on l’imagine. Voici ce qui se passe exactement — et quand mieux vaut s’en abstenir.

Pourquoi la conversion PDF vers UBL n’est pas une conversion « ordinaire »

Lorsque l’on convertit un Word en PDF, le contenu reste identique, seul le format change. La conversion PDF vers UBL fonctionne sur un principe radicalement différent.

Une facture PDF est un document visuel : des pixels et du texte conçus pour des yeux humains. Une facture UBL est un fichier de données structuré : chaque champ (numéro de facture, fournisseur, numéro de TVA, lignes, IBAN, montants) est étiqueté proprement en XML pour qu’un logiciel puisse le traiter automatiquement.

Pour passer du PDF à l’UBL, un logiciel doit :

  1. Extraire le texte du PDF (extraction directe ou OCR pour les PDF scannés)
  2. Comprendre quel mot correspond au fournisseur, quel chiffre représente le taux de TVA, lequel est un IBAN, etc.
  3. Placer chaque fragment de donnée dans le bon champ UBL

L’étape 2 est la plus difficile. Chaque fournisseur conçoit ses factures différemment. Le « Total » peut figurer en bas à droite, en haut, ou au milieu. La TVA peut être détaillée par ligne ou seulement en total. L’ordre des champs varie. Il ne s’agit donc pas d’une conversion mais d’une extraction de données par reconnaissance de motifs — autrement dit, de l’OCR doté d’intelligence facture.

Ce qui fonctionne : l’OCR de factures

Il existe des outils qui lisent des PDF et en extraient des données structurées. Quelques catégories :

Logiciels de comptabilité avec scan-and-recognize

Des solutions comme Pennylane, Sage, Cegid, EBP ou Sellsy proposent du scan-and-recognize pour les factures entrantes. Vous y déposez un PDF, leur OCR identifie les champs et propose une écriture comptable. La plupart n’exportent pas explicitement vers UBL — mais la facture entrante figure bien sous forme structurée dans votre comptabilité.

Pour qui : les entreprises dont la comptabilité est déjà tenue dans l’un de ces outils.

Limite : l’UBL/XML n’est généralement pas exporté comme fichier vers l’extérieur ; il reste à l’intérieur du système.

Services d’OCR de factures dédiés

Des services comme Klippa, Rossum, Hypatos et autres API similaires se spécialisent dans l’OCR de factures et produisent une sortie JSON ou XML structurée. Cette sortie peut, moyennant un peu de travail, être transformée en UBL.

Pour qui : les entreprises traitant de gros volumes de PDF de manière automatisée.

Limite : facturation par document (typiquement 0,05 € à 0,30 € la facture), et fiabilité dépendante de la qualité de l’OCR.

Plateformes de facturation électronique

Certains points d’accès Peppol et plateformes de facturation électronique intègrent un OCR pour les fournisseurs incapables de produire de l’UBL. Le PDF entre, l’UBL sort et est expédié sur Peppol.

Pour qui : les entreprises basculant entièrement vers la facturation électronique alors que leurs fournisseurs ne suivent pas encore.

Limite : nécessite un abonnement plateforme et un paramétrage initial.

Quand vaut-il mieux ne pas le faire

Deux scénarios où la conversion PDF → UBL est une perte de temps, d’argent et d’énergie.

Scénario 1 : vous recevez une facture PDF et voulez la comptabiliser

Votre fournisseur devrait simplement vous envoyer une véritable facture UBL/Peppol — et non un PDF que vous devriez ensuite convertir. Dans les pays où la facturation électronique devient obligatoire (voir le panorama par pays), c’est même encadré par la loi.

Mieux : demandez à votre fournisseur un fichier UBL ou son inscription sur Peppol. La plupart des logiciels de comptabilité l’exportent en un clic.

Ou : importez le PDF directement dans votre logiciel de comptabilité via le scan-and-recognize. Inutile de le convertir d’abord en UBL — les données arrivent directement dans votre journal d’achats.

Scénario 2 : vous voulez émettre vos factures en UBL

Vous tentez de produire vos propres factures de vente en UBL en générant d’abord un PDF dans Word/Pages puis en le convertissant. C’est prendre le problème à l’envers.

Mieux : utilisez un logiciel de comptabilité capable d’émettre directement de l’UBL/Peppol. Pennylane, Sellsy, Sage et la plupart des solutions françaises le font nativement. Vous saisissez la facture une seule fois et le système génère à la fois un PDF (visuel) et un UBL (traitement automatique).

Quand la conversion est-elle réellement pertinente ?

Quelques cas d’usage légitimes :

  • Factures historiques — des milliers d’anciens PDF archivés que vous souhaitez rendre interrogeables. L’OCR + extraction vers données structurées est utile, même si le résultat n’est pas un UBL exact.
  • Fournisseurs réellement incapables de produire de l’UBL — si vous devez être conforme Peppol pour le B2G et qu’un fournisseur refuse de coopérer, un point d’accès doté d’OCR peut combler le manque.
  • Migration depuis un ancien système — si un système hérité n’exportait que des PDF et que vous basculez vers la facturation électronique.

Dans les trois cas, retenez que la sortie d’un OCR est statistique, pas exacte. Comptez sur une correction manuelle de 5 à 15 % des champs, en particulier pour les factures complexes ou multilingues.

L’inverse : de l’UBL/XML vers le PDF

On veut parfois l’opération inverse : transformer en PDF une facture UBL reçue, pour l’imprimer, l’archiver ou la transmettre à quelqu’un qui ne dispose pas de visualiseur.

Là, il s’agit techniquement d’une vraie conversion simple — toutes les données sont présentes, il suffit d’appliquer une mise en page sur le XML. Des outils comme UBL Buddy affichent une facture UBL avec une mise en forme soignée sur Mac, iPhone ou iPad. Depuis l’application, vous pouvez imprimer en PDF via la boîte de dialogue d’impression standard de macOS (Fichier → Imprimer → Enregistrer au format PDF).

Questions fréquentes

Existe-t-il un convertisseur PDF vers UBL gratuit ?

Pas de manière fiable. Des convertisseurs en ligne gratuits existent, mais la qualité de l’OCR reste limitée et vous téléversez des données de facturation sensibles vers des serveurs inconnus. Pour un usage ponctuel, cela peut dépanner ; pour un traitement professionnel, ce n’est pas recommandé.

ChatGPT ou un outil d’IA peut-il convertir un PDF en UBL ?

Une IA peut lire le texte d’un PDF et le placer dans un modèle UBL. En pratique, cela fonctionne raisonnablement pour des factures simples, mais :

  • Les marges d’erreur sont imprévisibles — vous ne savez si les champs sont corrects qu’après vérification
  • Les codes TVA et codes devises doivent être strictement conformes à la norme UBL (par ex. S pour TVA standard, codes ISO pour les devises)
  • Pour la conformité (validation Peppol, contrôles VIES), le XML doit rester strict
  • Envoyer des données sensibles à une IA externe constitue un risque RGPD

Pour une facture isolée à titre expérimental : peut-être. Pour un usage en production : non.

Quelle est la différence entre UBL et XML ?

XML est le format générique (une manière de structurer des données). UBL (Universal Business Language) est une norme spécifique au sein de XML dédiée aux documents commerciaux comme les factures. Un fichier UBL est donc toujours un fichier XML, mais l’inverse n’est pas vrai. Peppol utilise UBL comme format sur son réseau.

UBL Buddy peut-il convertir mes PDF en UBL ?

Non. UBL Buddy est un visualiseur pour les factures UBL/Peppol que vous recevez — pas un outil d’OCR. Pour extraire des données de PDF, utilisez plutôt votre logiciel de comptabilité ou un service d’OCR de factures dédié.

Que faire si mon fournisseur s’obstine à envoyer du PDF ?

À partir de 2026, la facturation électronique B2B devient obligatoire dans un nombre croissant de pays européens, dont la Belgique (1er janvier 2026), l’Allemagne (émission à partir de 2027) et la France (septembre 2026). Les factures PDF seules deviendront alors juridiquement invalides pour les transactions B2B. Vous pouvez d’ores et déjà sensibiliser votre fournisseur à cette échéance et lui demander de se raccorder à Peppol. La plupart des logiciels de comptabilité le proposent en un clic.

Pour aller plus loin

Tags:
  • Pdf
  • Ubl
  • Xml
  • Conversion
  • Peppol
Partager:

Articles similaires

Facturation électronique en Norvège (2026)

  • Facturation electronique
  • 01 May, 2026

En bref : la Norvège impose la facturation électronique en B2G (entreprise vers administration) depuis 2012 et utilise EHF (Elektronisk Handelsformat) — un profil national d'UBL — comme standard, écha...

Lire la suite

Comment envoyer une facture Peppol

  • Facturation electronique
  • 30 Apr, 2026

En bref : pour envoyer une facture Peppol, il vous faut trois éléments : (1) un identifiant Peppol, (2) un point d'accès qui vous raccorde au réseau et (3) un logiciel de comptabilité capable de produ...

Lire la suite

Peppol vs UBL : quelle est la différence ?

  • Facturation electronique
  • 30 Apr, 2026

En bref : UBL est le format de fichier — une structure XML spécifique pour les factures. Peppol est le réseau — le canal de transmission sécurisé qu'utilisent les entreprises pour échanger ces fichier...

Lire la suite