Converter fatura em PDF para UBL — é possível? O que funciona e o que não funciona ao converter faturas em PDF para XML
- Faturação eletrónica
- 30 Apr, 2026
- 7 min de leitura
Em resumo: Converter uma fatura em PDF para uma verdadeira fatura UBL/Peppol não é uma simples conversão de ficheiros — é OCR mais extração de dados. É possível, mas o resultado é apenas tão fiável quanto o motor de OCR. Para faturas recebidas, a conversão normalmente não é necessária: o seu fornecedor deve enviar-lhe um XML verdadeiro. Para as suas próprias faturas emitidas, é melhor enviá-las diretamente a partir do software de contabilidade em formato UBL.
Tem uma pilha de faturas em PDF que quer integrar no seu sistema, ou um fornecedor pede-lhe UBL e só tem PDF. A pergunta óbvia: é possível converter um PDF para UBL?
A resposta curta é sim, mas não como esperaria. Eis o que acontece exatamente — e quando é melhor não o fazer.
Porque PDF para UBL não é uma conversão “normal”
Numa conversão de Word para PDF, o conteúdo permanece igual e só muda o formato. PDF para UBL funciona de forma fundamentalmente diferente.
Uma fatura em PDF é um documento visual: pixels e texto criados para humanos. Uma fatura UBL é um ficheiro de dados estruturado: cada campo (número da fatura, fornecedor, NIF, linhas de artigos, IBAN, montantes) está corretamente identificado em XML para que o software o possa processar automaticamente.
Para passar de PDF para UBL, o software tem de:
- Extrair o texto do PDF (extração de texto ou OCR em PDFs digitalizados)
- Compreender qual a palavra que representa o fornecedor, qual o número que indica a taxa de IVA, qual é um IBAN, etc.
- Colocar esses fragmentos de dados nos campos UBL corretos
O passo 2 é o difícil. Cada fornecedor desenha a sua fatura de forma diferente. “Total” pode estar em baixo à direita, em cima ou ao centro. O IVA pode aparecer por linha ou como total. A ordem dos campos varia. Por isso, isto não é uma conversão, mas sim extração de dados com reconhecimento de padrões — ou seja, OCR com inteligência de faturas.
O que funciona: OCR para faturas
Existem ferramentas que leem PDFs e extraem deles dados estruturados. Algumas categorias:
Software de contabilidade com digitalização e reconhecimento
Pacotes como Moneybird, Yuki, Exact Online, Twinfield e Teamleader oferecem digitalização e reconhecimento para faturas recebidas. Arrasta um PDF, o OCR identifica os campos e propõe um lançamento. A maioria não exporta explicitamente para UBL — mas a fatura recebida fica estruturada na sua contabilidade.
Para quem: Empresas que já fazem a contabilidade nesse tipo de pacote.
Limitação: O UBL/XML muitas vezes não é exportado como ficheiro; permanece dentro do sistema.
Serviços dedicados de OCR para faturas
Serviços como Klippa, Rossum, Hypatos e APIs semelhantes especializam-se em OCR de faturas e produzem JSON ou XML estruturados. O resultado pode, com algum trabalho adicional, ser transformado em UBL.
Para quem: Empresas com grandes volumes de PDFs que precisam de processamento automatizado.
Limitação: Tem custo por documento (tipicamente 0,05–0,30 € por fatura), e a fiabilidade depende da qualidade do OCR.
Plataformas de faturação eletrónica
Alguns access points Peppol e plataformas de faturação eletrónica oferecem OCR integrado para fornecedores que ainda não conseguem entregar UBL. Entra o PDF, sai um UBL e é enviado por Peppol.
Para quem: Empresas a transitar totalmente para a faturação eletrónica e cujos fornecedores ainda não estão preparados.
Limitação: Exige uma assinatura de plataforma e configuração.
Quando é melhor não o fazer
Dois cenários em que a conversão PDF→UBL é tempo, dinheiro e esforço mal investidos.
Cenário 1: Recebe uma fatura em PDF e quer registá-la
O seu fornecedor deve enviar-lhe simplesmente uma verdadeira fatura UBL/Peppol — não um PDF que tenha de converter. Em países onde a faturação eletrónica passa a ser obrigatória (ver panorama por país) isto está mesmo regulado por lei.
Melhor: Peça ao seu fornecedor um ficheiro UBL ou registo no Peppol. A maioria dos sistemas de contabilidade exporta isto com um clique.
Ou: Importe o PDF diretamente no seu software de contabilidade com digitalização e reconhecimento. Não precisa de o converter primeiro para UBL — os dados entram diretamente no seu livro de compras.
Cenário 2: Quer faturar você mesmo em UBL
Tenta entregar as suas faturas emitidas em UBL criando primeiro um PDF em Word/Pages e depois convertendo-o. É o mundo ao contrário.
Melhor: Use software de contabilidade que envia diretamente UBL/Peppol. Moneybird, Teamleader, Yuki e a maioria dos pacotes em Portugal fazem-no por defeito. Preenche a fatura uma vez e o sistema gera tanto um PDF (visual) como um UBL (para processamento automático).
Quando é que converter faz sentido?
Alguns casos de uso legítimos:
- Faturas históricas — milhares de PDFs antigos em arquivos que pretende tornar pesquisáveis. Aqui, OCR + extração para dados estruturados é útil, mesmo que não resulte num UBL exato.
- Fornecedores que realmente não conseguem fornecer UBL — se tem de cumprir Peppol para B2G e o fornecedor se recusa a colaborar, um access point com OCR pode preencher essa lacuna.
- Migração de um sistema antigo — se um sistema legado só exportava PDFs e está agora a transitar para a faturação eletrónica.
Nos três casos, vale a regra: o resultado do OCR é estatístico, não exato. Conte com correção manual de 5–15% dos campos, sobretudo em faturas complexas ou multilingues.
Ao contrário: UBL/XML para PDF
Por vezes quer o inverso: converter uma fatura UBL recebida em PDF para imprimir, arquivar ou reencaminhar a alguém que não tenha visualizador.
Isso é, do ponto de vista técnico, uma conversão simples — todos os dados estão lá, basta aplicar um modelo ao XML. Ferramentas como UBL Buddy mostram-lhe uma fatura UBL com formatação cuidada no seu Mac, iPhone ou iPad. A partir daí pode imprimir para PDF através da caixa de diálogo de impressão padrão do macOS (Ficheiro → Imprimir → Guardar como PDF).
Perguntas frequentes
Existe um conversor gratuito de PDF para UBL?
Não de forma fiável. Existem conversores online gratuitos, mas a qualidade do OCR é normalmente limitada e está a enviar dados sensíveis de faturas para servidores desconhecidos. Para uso pontual pode resultar; para processamento empresarial não é recomendável.
O ChatGPT ou uma ferramenta de IA consegue converter um PDF para UBL?
Uma IA consegue ler texto de um PDF e colocá-lo num modelo UBL. Na prática, isto funciona razoavelmente para faturas simples, mas:
- As margens de erro não são previsíveis — só sabe se os campos estão corretos depois de verificar
- Os códigos de IVA e códigos de moeda têm de seguir exatamente a norma UBL (ex.:
Spara IVA padrão, códigos ISO para moedas) - Para conformidade (validação Peppol, verificações VIES) o XML continua a ser estrito
- Enviar dados sensíveis através de uma IA externa é um risco em termos de RGPD
Para uma fatura experimental isolada: talvez. Para uso em produção: não.
Qual é a diferença entre UBL e XML?
XML é o formato genérico (uma forma de armazenar dados de forma estruturada). UBL (Universal Business Language) é uma norma específica dentro de XML para documentos comerciais como faturas. Um ficheiro UBL é portanto sempre um ficheiro XML, mas o inverso não é verdade. O Peppol usa UBL como formato na rede.
O UBL Buddy converte os meus PDFs para UBL?
Não. O UBL Buddy é um visualizador de faturas UBL/Peppol que recebeu — não é uma ferramenta de OCR. Para extração de PDF, use antes o seu software de contabilidade ou um serviço dedicado de OCR de faturas.
E se o meu fornecedor insistir em PDF?
A partir de 2026, a faturação eletrónica B2B passa a ser obrigatória num número crescente de países europeus, incluindo Bélgica (1 de janeiro de 2026), Alemanha (envio a partir de 2027) e França (setembro de 2026). As faturas só em PDF tornam-se juridicamente inválidas para transações B2B. Pode chamar a atenção do fornecedor já hoje para esses prazos e pedir adesão ao Peppol. A maioria dos pacotes de contabilidade oferece-o com um clique.
Leitura adicional
- O que é uma fatura Peppol? — explicação da norma
- Como abrir uma fatura XML no Mac — se acabou de receber um UBL
- Fatura XML recebida por e-mail — e agora? — primeiros socorros para anexos XML
- Faturação eletrónica por país — quando o PDF deixa de ser válido no seu mercado?
Tags:
- Ubl
- Xml
- Conversão
- Peppol