Het probleem: PDF is niet gemaakt voor computers
Een jaarrekening in PDF-formaat is prettig leesbaar voor mensen. U ziet netjes opgemaakte tabellen met balansposten, bedragen en toelichtingen. Maar voor een computer is een PDF weinig meer dan een verzameling losse tekst en lijnen op een pagina. Er zit geen structuur in die zegt: “dit bedrag hoort bij vaste activa” of “deze kolom bevat de cijfers van vorig jaar.”
XBRL is het tegenovergestelde. Elk gegeven is voorzien van een tag — een machineleesbaar label dat precies beschrijft wat het is, in welke context het staat, en hoe het zich verhoudt tot andere gegevens. De uitdaging bij PDF-naar-XBRL conversie is het overbruggen van die kloof: hoe maak je van ongestructureerde PDF-data een volledig gestructureerd, gevalideerd XBRL-bestand?
Bij SBR direct hebben we een pijplijn gebouwd die dit proces in vier stappen uitvoert, grotendeels automatisch. In dit artikel nemen we u mee achter de schermen.
Stap 1: PDF uploaden en AI-herkenning
Het begint bij het uploaden van uw jaarrekening-PDF. Zodra het bestand binnenkomt, wordt het in zijn geheel naar een AI-model gestuurd dat gespecialiseerd is in het begrijpen van documenten. Dit model leest uw jaarrekening sectie voor sectie: eerst de balans, dan de winst-en-verliesrekening (indien aanwezig), vervolgens de toelichting en overige onderdelen.
Wat herkent de AI precies?
- Balansposten — Vaste activa, vlottende activa, eigen vermogen, voorzieningen, langlopende schulden, kortlopende schulden.
- Winst-en-verliesrekening — Netto-omzet, kostprijs, brutowinst, bedrijfskosten, financiele baten en lasten, resultaat.
- Bedragen — Zowel het lopend boekjaar als vergelijkende cijfers van het voorgaand boekjaar.
- Toelichtingen — Tekstuele beschrijvingen bij balansposten en grondslagen voor de waardering.
- Metadata — Bedrijfsnaam, KVK-nummer, boekjaarperiode, ondertekeningsdatum.
De AI verwerkt de output in behapbare stukken om de nauwkeurigheid hoog te houden. Door niet het hele document in één keer te verwerken, maar sectie voor sectie, voorkomt het systeem dat posten door elkaar gehaald worden of dat bedragen bij de verkeerde regel terechtkomen.
Stap 2: Automatische XBRL-tag koppeling
Zodra de AI de financiële posten heeft herkend, moet elke post gekoppeld worden aan de juiste XBRL-tag uit de Nederlandse NT20-taxonomie. Dit is het meest complexe deel van het proces, want de NT20-taxonomie bevat duizenden mogelijke tags. “Vaste activa” kan bijvoorbeeld verwijzen naar FixedAssets, IntangibleAssets, TangibleFixedAssets of nog andere varianten, afhankelijk van de context.
Hoe vindt het systeem de juiste tag?
SBR direct gebruikt een Google AI-pipeline die in twee stappen werkt:
- Intelligente taxonomie-zoekopdracht — Voor elke herkende post doorzoekt het systeem de volledige NT20-taxonomie en selecteert de tien meest waarschijnlijke XBRL-tags op basis van betekenis. Het systeem begrijpt dat “debiteuren” en “handelsvorderingen” hetzelfde betekenen, net zoals een ervaren boekhouder dat zou doen.
- AI-selectie — Een tweede AI-model bekijkt de tien kandidaten en selecteert de beste match. Dit model heeft context over de gehele jaarrekening: het weet of een post op de balans staat of in de winst-en-verliesrekening, of het een subtotaal is of een detailpost, en welke grootteklasse van toepassing is.
Dit tweestaps-proces combineert de breedte van een volledige taxonomie-doorzoek (niets over het hoofd zien) met de precisie van een AI die de context begrijpt. Het resultaat is een koppeling die in de meeste gevallen direct correct is.
Stap 3: Berekeningen en validatie
Na de tagkoppeling controleert het systeem of alles klopt. Dit gebeurt op meerdere niveaus:
Rekenregels uit de taxonomie
De NT20-taxonomie definieert rekenregels (de calculation linkbase) die beschrijven hoe posten bij elkaar opgeteld moeten worden. Bijvoorbeeld: Vaste activa + Vlottende activa = Totaal activa. Het systeem berekent automatisch subtotalen en totalen op basis van deze regels en controleert of ze kloppen met de waarden uit uw PDF.
Balanscontrole
De belangrijkste controle: sluit de balans? Totaal activa moet gelijk zijn aan het totaal van eigen vermogen, voorzieningen en schulden. Het systeem controleert dit met een tolerantie van maximaal €1 (voor afrondingsverschillen). Sluit de balans niet, dan krijgt u direct een melding.
Verplichte velden
Afhankelijk van de grootteklasse van uw BV (micro, klein of middelgroot) zijn bepaalde velden verplicht. Een micro-BV hoeft geen winst-en-verliesrekening in te dienen, maar moet wel de balansposten en basisgegevens zoals KVK-nummer en boekjaarperiode aanleveren. Het systeem controleert automatisch of alle verplichte velden aanwezig zijn en geeft een waarschuwing als er iets ontbreekt.
Arelle-validatie
Als laatste stap valideert het systeem het gegenereerde XBRL-bestand met Arelle, de officiële open-source XBRL-validator. Dit is dezelfde validator die Digipoort (de digitale poort van de overheid) gebruikt om aangeleverde bestanden te controleren. Als Arelle het bestand goedkeurt, weet u dat het technisch correct is.
Stap 4: Review en export
Hoewel het proces grotendeels automatisch verloopt, geeft SBR direct u volledige controle over het eindresultaat. Na de automatische verwerking ziet u een overzichtelijk scherm met:
- Alle herkende posten met de gekoppelde XBRL-tags — u ziet precies welke tag aan welke post is gekoppeld.
- De bron van elke koppeling — of deze door de AI is gemaakt, berekend is op basis van rekenregels, of uit de configuratie komt.
- Validatieresultaten — eventuele fouten of waarschuwingen worden direct getoond.
- Ontbrekende posten — als het systeem een verplicht veld niet in uw PDF heeft gevonden, kunt u het handmatig invullen.
Elke koppeling is aanpasbaar. Vindt u dat een post aan een andere XBRL-tag gekoppeld moet worden? Dan kunt u dat met een paar klikken wijzigen. Het systeem herberekent vervolgens automatisch alle afhankelijke totalen en valideert opnieuw.
Bent u tevreden met het resultaat? Dan downloadt u het XBRL-bestand met één klik. Het bestand is klaar om via uw accountant of SBR-softwarepakket bij Digipoort aangeleverd te worden.
Wat als er iets niet klopt?
Geen enkel automatisch systeem is perfect. Er zijn situaties waarin de AI een post niet herkent of een verkeerde tag selecteert. Daarom heeft SBR direct een gap detection-systeem ingebouwd:
- Ontbrekende verplichte velden worden automatisch gedetecteerd en gemarkeerd. U ziet precies welke informatie nog ontbreekt.
- Onzekere koppelingen worden visueel gemarkeerd zodat u ze kunt controleren.
- Handmatige aanpassing is altijd mogelijk — u kunt bedragen wijzigen, tags aanpassen of ontbrekende posten toevoegen.
Het doel is niet om menselijke controle te vervangen, maar om het zware werk — het doorzoeken van duizenden taxonomie-tags en het handmatig invullen van XBRL-velden — te automatiseren. De uiteindelijke beoordeling blijft bij u.
Waarom dit anders is dan handmatige invoer
Traditioneel vereist het aanmaken van een XBRL-bestand dat iemand — uw accountant of uzelf — elk bedrag handmatig aan de juiste XBRL-tag koppelt. Dat is tijdrovend en foutgevoelig: een typefout, een verkeerde tag of een vergeten subtotaal kan ertoe leiden dat Digipoort het bestand afkeurt.
De aanpak van SBR direct verschilt op drie punten:
- Snelheid — De volledige conversie duurt minuten in plaats van uren. De AI leest uw PDF en stelt de koppelingen voor; u hoeft alleen te controleren en eventueel bij te sturen.
- Minder fouten — Automatische rekencontroles en taxonomie-validatie vangen fouten op die bij handmatige invoer gemakkelijk over het hoofd worden gezien.
- Actuele taxonomie — Het systeem werkt altijd met de meest recente versie van de NT20-taxonomie, inclusief de nieuwste tags en rekenregels. U hoeft zelf geen taxonomie-updates bij te houden.
Zelf ervaren?
Wilt u zien hoe de PDF-naar-XBRL conversie in de praktijk werkt? U kunt gratis een proefmapping uitproberen. Upload uw jaarrekening-PDF, bekijk hoe het systeem uw posten herkent en aan XBRL-tags koppelt, en beoordeel zelf het resultaat. U betaalt pas wanneer u het definitieve XBRL-bestand wilt exporteren.
Probeer een gratis proefmapping of lees meer over de technologie achter SBR direct.