Importera data från pdf till Excel utan en ”converter”
Att hämta data från en PDF-fil har blivit så mycket enklare nu med Excel 365 för Windows. Det finns inget behov av att installera en ”pdf to Excel converter” eller dyra eller krångliga program. Allt finns inbyggt i Excel. Kortfattat gör du bara så här:
- I fliken Data väljer du: Hämta data i gruppen Hämta och transformera data.
- Välj Från fil -> Från PDF
- Välj din PDF-fil.
- I Navigatören väljer du den tabell du vill importera, och klicka på Läs in.
- Justera och fixa till tabellen så att allt blir korrekt och snyggt och prydligt.
I den här artikeln så går jag igenom stegen lite mer noggrannare och förklarar steg för steg hur du gör för att kopiera tabeller från en pdf in till Excel och hur man hanterar begräsningar och problem som kan uppstå. Även om det är fem korta punkter så går det inte alltid precis som man har tänkt sig.
Hämta data från PDF till Excel
För att hämta data från en PDF-fil inne i Excel så använder man Excels funktion ”Hämta och transformera” som finns under fliken Data.
Det här innebär också att den data man hämtar kan transformeras med Excels ”Power Query Redigerare”, vilket är en väldigt kraftfullt verktyg för att transformera om eller konvertera den data man importerat.
1 Välj: Hämta Data -> Från Fil -> Från PDF.
Leta upp den PDF-fil som du vill läsa in. Om PDF-filem är väldigt omfattande kan de vara smart att korta ner den till de väsentliga sidorna innan du importerar då blir det lite enklare att hitta rätt tabell och hela proceduren går snabbare.
2 Klicka på importera.
Dialogrutan ”Navigatör” visar sig där Excel analyserar PDF-filen och identifierar text och tabeller.
Tabellerna dyker upp som Tabell 1, 2 3 osv.
Bläddra igenom tabellerna tills du ser den som du vill ha som man vill ha in.
OBS! Om detta inte fungerar: Kolla det jag skrivit under rubriken ” Problem att exportera PDF till Excel”
3 När du hittat den tabell du vill importera så väljer du ”Läs in” eller ”Läs in till” (klicka på pilen bredvid ”Läs in”). Med Läs in till så kan man styra mer var tabellen skall hamna och det är det val jag själv oftast väljer.
Sedan bör du ha din tabell i Excel. I nedanstående exempel ser du hur det ser ut när jag importerat SKF:s resultaträkning till Excel.
Granskar vi den lite noggrannare så kan vi se att det inte är helt perfekt.
Det finns normalt vissa justeringar vi man kommer att behöva göra. Nedan listar jag några av de vanligaste korrigeringarna som behövs (i min film så visar jag hur jag gör).
Tips på vanliga justeringar av data importerad från PDF-filer
Följande sex steg går igenom de vanligaste justeringarna man ofta behöver göra:
- Kopiera hela tabellen och klistra in den som värde på en annan plats
- Kontrollera och justera felaktiga tecken
- Korrigera tal inläst som text
- Lägg in summeringar som en kontroll
- Putsa till formatet
- Radera den importerade PDF-filen
1. Kopiera hela tabellen och klistra in den som värde på en annan plats
Anledningen till att jag börjar med detta är att tabellen jag har fått är en Power Query länk till PDF-filen. Om källan vore dynamisk (dvs att siffrorna kommer att ändras) så skulle detta vara riktigt bra och vi kunde då få uppdaterade data i Excel med ett litet klick.
Men i detta fall är PDF-filen helt statisk. Vi har inget behov av att vår Excelfil länkar till en extern källa och det blir bara bökigt att få frågan om vi villuppdatera vår data. Arbetsböcker med externa länkar har också en liten varningsflagg på sig så alla som du skickar arbetsboken till kommer att få en varning om den externa länken.
Så vad jag gör:
Kopiera tabellen (Ctrl +C) gå till en annan plats och välj Klistra in special: som Värde.
Nu har även allt format försvunnit och du kan justera din tabell från grunden.
2. Kontrollera och justera felaktiga tecken
I min import så har minustecknen blivit bindestreck. Det gör att dessa tal överhuvudtaget inte går att göra några beräkningar på.
Dessa korrigerar jag genom att kopiera bindestrecket och sedan göra en Sök och Ersätt.
I startfliken väljer du Sök och markera – Ersätt. Klistra in bindestrecket (eller vilket tecken det är i rutan för Sök efter och skriv tecknet som du vill att det skall ersättas med.
Ibland är det konstiga tecknet inte synligt, det blir bara som en blanktecken – fast det inte är et blanktecken. Dessa kan oftast också korrigeras genom att man klipper ut ett tecken (dvs det ”blanka” i teckensträngen) och sedan som ersätt skriver man ”” (dvs två citationstecken efter varandra = ersätt med ”ingenting”).
3. Korrigera tal inläst som text
Efter att vi justerat för konstiga och dolda tecken så kan man korrigera det andra problemet. Att siffrorna som lästes in tolkas som text och inte som tal.
Ledtråden för det är att siffrorna är text i tabellen är att de är vänsterjusterade. I Excel är alltid text vänsterjusterat och tal högerjusterat. Så här kan vi se att båda kolumnerna med tal ligger till vänster i kolumnen.
Visserligen brukar dess ”textsiffror” gå att räkna med, men inte alltid och de kan skapa stora problem för vissa funktioner. Framförallt i funktioner som innehåller någon form av sortering eller rangordning. Siffror som är text sorteras nämligen annorlunda än siffror som är tal. Jämför siffran 21 med 6. Sorterad i stigande ordning som tal så kommer naturligtvis 6 före 20. Men som text så blir det tvärt om. Man skulle kunna jämföra det med BA och F. Sorterad i stigande bokstavsordning kommer BA (21) före F (6), …
Hursomhelst, ta alltid för vana att konvertera siffror som visas som text till tal.
Ibland kan det finnas en liten ”varningstriangel” eller felkontroll i cellen som säger något om att ”Tal är formaterade som text”. Finns en sådan så kan man bara klicka på den och välja konvertera till tal.
Men i detta fall syns inte någon felkontroll. Då kan man ta till ett trix med att Klistra in special:
- Skriver in en etta (1) i en cell vid sidan om.
- Markera cellen och kopierar den (Ctrl+C).
- Sen markerar jag alla celler med siffror som jag vill konvertera till tal.
- Högerklicka och välj ”Klistra in special”
- Som åtgärd väljer du ”Multiplicera”
- Klicka på OK och alla ”textsiffror” skall ni vara tal, snyggt och prydligt högerjusterat.
Det här kommer att innebära att alla siffror i markeringen kommer att multipliceras med ett. Det påverkar inte storleken, men i den processen så kommer siffrorna bli tal.
4. Lägg in summeringar som en kontroll
Om din tabell innehåller summeringar. I mitt exempel finns t.ex. bruttoresultatet som är försäljning minus Kostnad sålda varor.
Här rekommenderar jag att du ersätter värdena för dessa med korrekta summeringar. Använd t.ex. bara knappen Autosumma.
Fördelen med detta är att du enklare kommer upptäcker eventuella felaktigheter. Det mest förrädiska felet som kan uppstå är om Excel har läst en siffra fel, t.ex. om siffran 8 i dokumentet har lästs in som 6. Om PDF-filen har bra kvalité så uppstår sällan sådana grova fel. Men tag för vana att alltid kontrollräkna så lång du kan och orkar. Om din analys är viktig och har någon betydelse så kan ju en felaktig siffra få stora konsekvenser.
I min film gjorde jag dessutom ett slarvfel när jag klippte ut bindestrecken (istället för att bara kopiera) – och det upptäckte jag när jag skulle summera.
Ibland vill man ju också bygga mer dynamiska modeller – t.ex. vad händer om vi ökar försäljningen med 10 procent. Sådana modeller kräver naturligtvis att hela kedjan av beräkningar hänger ihop. Och det är inte säkert att man vet alla tillämpningar av de importerade datan när man importerar och justerar. Så ta för vana att lägga till summeringar där du kan.
5. Putsa till formatet
Här får man naturligtvis göra efter tycke och smak. Men tänk på att en slarvigt formaterad tabell i Excel är en varningsflagg att det kan finnas andra fel. Slarvigt utförande – slarvigt tänkt…
I mitt fall snyggar jag bara till med lite kantlinjer, tusentalsavgränsare etc. Jag försöker göra så att min importerade tabell i Excel ser så snarlig ut som den tabell som fanns i pdf-filen.
6. Radera den importerade PDF-filen.
När min tabell är snygg och prydlig och färdig så behöver jag inte längre den ursprungliga importerade tabellen från PDF-filen.
Jag har behållit den ända till slutet som en kontroll av min justerade tabell. Men nu när jag kan se att allt verkar överensstämma med varandra så har den tabellen gjort sitt och kan raderas.
Markera kolumnerna som täcker den importerade tabellen och klick på Ta bort.
Problem att exportera PDF till Excel
Om det inte fungerar så beror det troligen på att PDF-filen inte har rätt kvalité. Ett första steg är att använda ett program som läser av PDF-filen och konverterar bilder till text. Den funktionen finns t.ex. ofta inbyggd i mer avancerade PDF-läsare (t.ex. Acrobat Acrobats pro-versioner), men det finns också alternativ som ABBYY FineReader och PDF Alchemist. Här är en artikel i PC för alla som diskuterar detta: ”Så förvandlar du bilden till text med ett ocr-program”.
Jag gissar också att den eventuella google-reklam som dyker upp i anslutning till denna bloggpost kan innehålla tips på alternativa lösningar värda att prova.
Importera PDF till en Mac
Har du Excel för Macintosh så är problemet med den lösning jag visar här att den använder Microsoft Power Query. Tyvärr verkar det som att detta verktyg finns i Excel för Mac.
Jag använder själv inte Mac sedan cirka 30 år tillbaka, så jag är inte uppdaterad i de senaste versionerna (mer än vad jag sett när jag försöker hjälpa studenter eller familjemedlemmar (!) som har valt Mac. Men vad jag sett så fungerar i alla fall det inte med att använda Hämta & Transformera Data som PDF till en Mac. Power Query har begränsningar. Känner du till någon alternativ läsning eller vet du hur detta kan lösas så skulle jag vara grymt tacksam om du kunde lämna en kommentar om detta. För (tyvärr) verkar en väldigt stor del av mina studenter valt Macintosh. Antar att den är bra att se film på, och sen är den snygg… Men för avancerade tillämpningar i Excel är den i alla fall fortfarande hopplöst efter… Motbevisa mig gärna!
Avslutningsvis
Så kan alltså man läsa in en tabell från en PDF-fil in i Excel…
Nedan har du filmen som visar allt det jag skrivit om steg för steg.
Har du frågor eller kommentarer så kan du ställa dem här nere. Observera dock att jag normalt inte har tid att lösa privata Excelproblem och att det kan ta lite tid innan jag svarar.
Var det här ett tips som hjälpte så for du gärna klicka på Facebook gilla-knappen eller dela min post. Då kan du även följa med när det kommer fler smarta tips. Framförallt är jag intresserad av alternativa lösningar, inte minst för Macintosh.
Kolla även min sida med boktips om du vill lära dig mer om Excel. Där tipsar jag om mina fem bästa böcker inom olika kategorier, från böcker för nybörjaren till avancerade böcker i VBA.
Om du inte gör det så skall du naturligtvis prenumerera på kanalen AndersExcel på YouTube så du inte missar när det kommer fler filmer. Kanalen är nu världens största kanal för Excelkunskap på svenska (probably…) Just nu är vi 3500 prenumeranter och med din hjälp kanske vi kan bli 4000 innan året är slut… Klicka bara på knappen nedan:
Hej Anders! Jag har en fråga. Vi har en pdf med 90 sidor med olika fakturor på varje sida, ibland flera fakturor på varje sida. Vet du hur man kan importa PDFen till Excel så att alla tabeller med fakturor kommer med? För gör jag som beskrivningen kan jag ju endast välja en tabell i taget.
Ha en fin dag!☀️
Hej
Att importera tabeller från en PDF med flera fakturor och placera dem i Excel kan vara lite komplicerat, särskilt om det finns flera tabeller på samma sida och du vill undvika allt för mycket manuellt arbete.
Det är själv inget jag har gjort. Men vad jag tror är att du antingen behöver programmera något i Excel Power Query eller något specialiserade Verktyg (Tredjepartsprogram).
Det senare är nog att föredra om man inte är så bra på att programera. Dock kan man nog få rätt bra hjälp numera med det av ChatGPT eller andra AI-modeller.
Några kända tredjepartsprogram (som jag dock själv aldrig prövat) är:
Able2Extract Professional: https://www.investintech.com/prod_a2e.htm
PDFTables: https://pdftables.com/
SmallPDF: https://smallpdf.com/
Återkom gärna om du hittar en lösning. Skulle vara intressant att veta hur.
Mvh
Anders
Hej
Har försökt men det bli fortfarande så att varje blad i pdf:en kommer på en egen flik. Det blr inte en tabell: Har du hittat nån lösning
Hej,
Nej, tyvärr inte.
mvh Anders
Hej,
jag har inte pdf när jag väljer -> Välj Från fil -> Från PDF, vad gör jag för fel?
Hälsningar
Michel
Mest troligt att du inte har Microsoft 365 för Windows. Vad jag förstår så saknas detta alternativ för macOS (och äldre Excelversioner).
Kolla denna jämförelse:
https://support.microsoft.com/sv-se/office/importera-data-fr%C3%A5n-datak%C3%A4llor-power-query-be4330b3-5356-486c-a168-b68e9e616f5a#ID0EBF=Windows_newer_versions
Jag tror det finns workarounds för detta för Mac. Googla ” import pdf to Excel on a mac”
Mvh
Anders
Finns det något sätt att kopiera hela pdf-tabellen? Har ca 187 sidor och blir lite jobbigt om ska göra ovan beskrivna procedur för varje tabell som skapas när läst in den. Behöver dessutom bara en kolumn från alla sidor i slutändan.
Dock enda sätt där sett att resultatet läsbart ( per tabell) när använt xlsx funktionen . Ingen konverterare kommer i närheten. Men inte klarat att transformera datan jag behöver ut då skapas 187 separata tabeller.
Hej
Ja proceduren med att läsa in pdf-tabell till Excel är visserligen fiffig, men inte alltid helt problemfri.
Ibland delas tabeller upp och inläsningen blir inte heller alltid rätt (t.ex. brukar minustecken istället bli något konstigt bindestreck).
Om du har en tabell som spänner över 187 sidor, eller har du ett dokument som är 187 sidor med en tabell på varje sida?
Det finns nog en del sätt att automatisera detta, men inget jag kan ge några detaljerade instruktioner om.
Testa att skriva in denna fråga i ChatGPT så kan du få lite mer konkret hjälp:
”I have a PDF document that is 187 pages long, containing tables on each page. Could you provide me with VBA code that imports every table from every page of the document? Additionally, I would appreciate very clear, step-by-step instructions on how to use the code, as I have never used VBA before.”
Mvh
Anders
Är en tabell per sida ( men samma format ) med namn/adress/telefon i bokstavsordning .
Läggs över snyggt men varje sida blir som sagt en egen query.
Tack för svar !
Hej sitter och kämpar med att få detta att fungera, men jag får inte till det? först tänkte jag att det hade med att jag sitter på en MAC version att göra , men dubbelkollade sen på min PC fungerar ändå inte som du beskriver det? Under fliken ”Data” har jag inte de valen du nämner? olika versioner? tacksam för lite hjälp 🙂
Adobe tjatar ju ihjäl mig med sin inbyggda licens konverter och abb, men jag har ju hört från flera håll att det skall gå utan.
Med vänlig hälsning, Philippe
Excel för Mac saknar tyvärr många av de funktioner som finns i Excel för Windows. Detta kan no vara en sådan funktion som saknas.
Sen finns denna funktion bara i senaste Excelversionen (jag har Excel 365).
Det verkar finnas ett antal workarounds för detta på mac – men inget jag har prövat då jag bara använder Windows. Kolla detta t.ex.:
https://www.google.com/search?q=import+data+pdf+to+excel+mac&sxsrf=APq-WBtYl5IbvV8hvZQc93YcrLUub2kwNg%3A1645172118728&source=hp&ei=llUPYoqNKcCIxc8P1Y-FuA0&iflsig=AHkkrS4AAAAAYg9jptL4ahjBlkZUk0Bj0d-NKeIRJoNn&ved=0ahUKEwiKsOnd54j2AhVARPEDHdVHAdcQ4dUDCAc&uact=5&oq=import+data+pdf+to+excel+mac&gs_lcp=Cgdnd3Mtd2l6EAMyBggAEBYQHjoECCMQJzoOCC4QgAQQsQMQxwEQowI6CwguEIAEEMcBEK8BOggIABCABBCxAzoICC4QsQMQgwE6DgguEIAEELEDEMcBEK8BOg4ILhCxAxCDARDHARDRAzoFCAAQgAQ6CAguEIAEELEDOg4ILhCABBCxAxDHARDRAzoFCC4QgAQ6CwgAEIAEELEDEIMBOgQIABAKOgUIABDLAToICAAQFhAKEB5QAFi8NWCDRWgAcAB4AIABbIgBzRCSAQQyNy4xmAEAoAEB&sclient=gws-wiz
mvh
Anders
Hej!
Tänkte kanske att du vill ändra ”IMPOTERA” i rubriken. : )
”IMPOTERA DATA FRÅN PDF TILL EXCEL UTAN EN ”CONVERTER””
Med vänlig hälsning,
Kjell
haha… Ja det har du rätt i… Fixat nu. mvh Anders
Hej
Jättebra instruktion! Jag undrar hur jag skall göra för att kopiera in ett bankkontoutdrag i Excel? Får varje tabell på flera flikar så bankkontoutdraget kommer på ca 15 ”sidor”.
Ha en bra dag
Elisabeth
Inget jag prövat själv tyvärr.. Det skiljer sig nog mellan banker. Men många har en exportfunktion som gör att man kan exporertera transaktioner till en excelfil.
mvh
Anders