Importera data från pdf till Excel utan en ”converter”

Att hämta data från en PDF-fil har blivit så mycket enklare nu med Excel 365 för Windows. Det finns inget behov av att installera en ”pdf to Excel converter” eller dyra eller krångliga program. Allt finns inbyggt i Excel. Kortfattat gör du bara så här:

  1. I fliken Data väljer du: Hämta data i gruppen Hämta och transformera data.
  2. Välj Från fil -> Från PDF
  3. Välj din PDF-fil.
  4. I Navigatören väljer du den tabell du vill importera, och klicka på Läs in.
  5. Justera och fixa till tabellen så att allt blir korrekt och snyggt och prydligt.

I den här artikeln så går jag igenom stegen lite mer noggrannare och förklarar steg för steg hur du gör för att kopiera tabeller från en pdf in till Excel och hur man hanterar begräsningar och problem som kan uppstå. Även om det är fem korta punkter så går det inte alltid precis som man har tänkt sig.

Hämta data från PDF till Excel

För att hämta data från en PDF-fil inne i Excel så använder man Excels funktion ”Hämta och transformera” som finns under fliken Data.

Det här innebär också att den data man hämtar kan transformeras med Excels ”Power Query Redigerare”, vilket är en väldigt kraftfullt verktyg för att transformera om eller konvertera den data man importerat.

1 Välj: Hämta Data -> Från Fil -> Från PDF.

Hämta och transformera data är en grupp kraftfulla verktyg för att dra in externa källor till Excel, t.ex. från webbplatser eller data från PDF

Leta upp den PDF-fil som du vill läsa in. Om PDF-filem är väldigt omfattande kan de vara smart att korta ner den till de väsentliga sidorna innan du importerar då blir det lite enklare att hitta rätt tabell och hela proceduren går snabbare.

2 Klicka på importera.

Naigatören i Hämta och transformera data hjälper dig att välja rätt tabell från din PDF-fil som du kan importera till Excel

Dialogrutan ”Navigatör” visar sig där Excel analyserar PDF-filen och identifierar text och tabeller.

Tabellerna dyker upp som Tabell 1, 2 3 osv.

Bläddra igenom tabellerna tills du ser den som du vill ha som man vill ha in.

OBS! Om detta inte fungerar: Kolla det jag skrivit under rubriken ” Problem att exportera PDF till Excel”

3 När du hittat den tabell du vill importera så väljer du ”Läs in” eller ”Läs in till” (klicka på pilen bredvid ”Läs in”). Med Läs in till så kan man styra mer var tabellen skall hamna och det är det val jag själv oftast väljer.

Sedan bör du ha din tabell i Excel. I nedanstående exempel ser du hur det ser ut när jag importerat SKF:s resultaträkning till Excel.

SKF:s resultaträkning 2019. Importerad från deras årsredovisning (en PDF-fil) till Excel

Granskar vi den lite noggrannare så kan vi se att det inte är helt perfekt.

Det finns normalt vissa justeringar vi man kommer att behöva göra. Nedan listar jag några av de vanligaste korrigeringarna som behövs (i min film så visar jag hur jag gör).

Tips på vanliga justeringar av data importerad från PDF-filer

Följande sex steg går igenom de vanligaste justeringarna man ofta behöver göra:

  1. Kopiera hela tabellen och klistra in den som värde på en annan plats
  2. Kontrollera och justera felaktiga tecken
  3. Korrigera tal inläst som text
  4. Lägg in summeringar som en kontroll
  5. Putsa till formatet
  6. Radera den importerade PDF-filen

1. Kopiera hela tabellen och klistra in den som värde på en annan plats

Anledningen till att jag börjar med detta är att tabellen jag har fått är en Power Query länk till PDF-filen. Om källan vore dynamisk (dvs att siffrorna kommer att ändras) så skulle detta vara riktigt bra och vi kunde då få uppdaterade data i Excel med ett litet klick.

Men i detta fall är PDF-filen helt statisk. Vi har inget behov av att vår Excelfil länkar till en extern källa och det blir bara bökigt att få frågan om vi villuppdatera vår data. Arbetsböcker med externa länkar har också en liten varningsflagg på sig så alla som du skickar arbetsboken till kommer att få en varning om den externa länken.

Så vad jag gör:

Kopiera tabellen (Ctrl +C) gå till en annan plats och välj Klistra in special: som Värde.

Nu har även allt format försvunnit och du kan justera din tabell från grunden.

2. Kontrollera och justera felaktiga tecken

I min import så har minustecknen blivit bindestreck. Det gör att dessa tal överhuvudtaget inte går att göra några beräkningar på.

Dessa korrigerar jag genom att kopiera bindestrecket och sedan göra en Sök och Ersätt.

I startfliken väljer du Sök och markeraErsätt. Klistra in bindestrecket (eller vilket tecken det är i rutan för Sök efter och skriv tecknet som du vill att det skall ersättas med.

Ibland är det konstiga tecknet inte synligt, det blir bara som en blanktecken – fast det inte är et blanktecken. Dessa kan oftast också korrigeras genom att man klipper ut ett tecken (dvs det ”blanka” i teckensträngen) och sedan som ersätt skriver man ”” (dvs två citationstecken efter varandra = ersätt med ”ingenting”).

3. Korrigera tal inläst som text

Efter att vi justerat för konstiga och dolda tecken så kan man korrigera det andra problemet. Att siffrorna som lästes in tolkas som text och inte som tal.

Ledtråden för det är att siffrorna är text i tabellen är att de är vänsterjusterade. I Excel är alltid text vänsterjusterat och tal högerjusterat. Så här kan vi se att båda kolumnerna med tal ligger till vänster i kolumnen.

Visserligen brukar dess ”textsiffror” gå att räkna med, men inte alltid och de kan skapa stora problem för vissa funktioner. Framförallt i funktioner som innehåller någon form av sortering eller rangordning. Siffror som är text sorteras nämligen annorlunda än siffror som är tal. Jämför siffran 21 med 6.  Sorterad i stigande ordning som tal så kommer naturligtvis 6 före 20. Men som text så blir det tvärt om. Man skulle kunna jämföra det med BA och F. Sorterad i stigande bokstavsordning kommer BA (21) före F (6), …

Hursomhelst, ta alltid för vana att konvertera siffror som visas som text till tal.

Ibland kan det finnas en liten ”varningstriangel” eller felkontroll  i cellen som säger något om att ”Tal är formaterade som text”.  Finns en sådan så kan man bara klicka på den och välja konvertera till tal.

Men i detta fall syns inte någon felkontroll. Då kan man ta till ett trix med att Klistra in special:

  1. Skriver in en etta (1) i en cell vid sidan om.
  2. Markera cellen och kopierar den (Ctrl+C).
  3. Sen markerar jag alla celler med siffror som jag vill konvertera till tal.
  4. Högerklicka och välj ”Klistra in special”
  5. Som åtgärd väljer du ”Multiplicera”
  6. Klicka på OK och alla ”textsiffror” skall ni vara tal, snyggt och prydligt högerjusterat.

Det här kommer att innebära att alla siffror i markeringen kommer att multipliceras med ett. Det påverkar inte storleken, men i den processen så kommer siffrorna bli tal.

4. Lägg in summeringar som en kontroll

Om din tabell innehåller summeringar. I mitt exempel finns t.ex. bruttoresultatet som är försäljning minus Kostnad sålda varor.

Här rekommenderar jag att du ersätter värdena för dessa med korrekta summeringar. Använd t.ex. bara knappen Autosumma.

Fördelen med detta är att du enklare kommer upptäcker eventuella felaktigheter. Det mest förrädiska felet som kan uppstå är om Excel har läst en siffra fel, t.ex. om siffran 8 i dokumentet har lästs in som 6. Om PDF-filen har bra kvalité så uppstår sällan sådana grova fel. Men tag för vana att alltid kontrollräkna så lång du kan och orkar. Om din analys är viktig och har någon betydelse så kan ju en felaktig siffra få stora konsekvenser.

I min film gjorde jag dessutom ett slarvfel när jag klippte ut bindestrecken (istället för att bara kopiera) – och det upptäckte jag när jag skulle summera.

Ibland vill man ju också bygga mer dynamiska modeller – t.ex. vad händer om vi ökar försäljningen med 10 procent. Sådana modeller kräver naturligtvis att hela kedjan av beräkningar hänger ihop. Och det är inte säkert att man vet alla tillämpningar av de importerade datan när man importerar och justerar. Så ta för vana att lägga till summeringar där du kan.

5. Putsa till formatet

Här får man naturligtvis göra efter tycke och smak. Men tänk på att en slarvigt formaterad tabell i Excel är en varningsflagg att det kan finnas andra fel. Slarvigt utförande – slarvigt tänkt…

I mitt fall snyggar jag bara till med lite kantlinjer, tusentalsavgränsare etc. Jag försöker göra så att min importerade tabell i Excel ser så snarlig ut som den tabell som fanns i pdf-filen.

6. Radera den importerade PDF-filen.

När min tabell är snygg och prydlig och färdig så behöver jag inte längre den ursprungliga importerade tabellen från PDF-filen.

Jag har behållit den ända till slutet som en kontroll av min justerade tabell. Men nu när jag kan se att allt verkar överensstämma med varandra så har den tabellen gjort sitt och kan raderas.

Markera kolumnerna som täcker den importerade tabellen och klick på Ta bort.

Den färdiga resultaträkningen från SKF, med data exporterat från pdf

Problem att exportera PDF till Excel

Om det inte fungerar så beror det troligen på att PDF-filen inte har rätt kvalité. Ett första steg är att använda ett program som läser av PDF-filen och konverterar bilder till text. Den funktionen finns t.ex. ofta inbyggd i mer avancerade PDF-läsare (t.ex. Acrobat Acrobats pro-versioner), men det finns också alternativ som ABBYY FineReader och PDF Alchemist. Här är en artikel i PC  för alla som diskuterar detta: ”Så förvandlar du bilden till text med ett ocr-program”.

Jag gissar också att den eventuella google-reklam som dyker upp i anslutning till denna bloggpost kan innehålla tips på alternativa lösningar värda att prova.

Importera PDF till en Mac

Har du Excel för Macintosh så är problemet med den lösning jag visar här att den använder Microsoft Power Query. Tyvärr verkar det som att detta verktyg finns i Excel för Mac.

Jag använder själv inte Mac sedan cirka 30 år tillbaka, så jag är inte uppdaterad i de senaste versionerna (mer än vad jag sett när jag försöker hjälpa studenter eller familjemedlemmar (!) som har valt Mac. Men vad jag sett så fungerar i alla fall det inte med att använda Hämta & Transformera Data som PDF till en Mac. Power Query har begränsningar. Känner du till någon alternativ läsning eller vet du hur detta kan lösas så skulle jag vara grymt tacksam om du kunde lämna en kommentar om detta. För (tyvärr) verkar en väldigt stor del av mina studenter valt Macintosh.  Antar att den är bra att se film på, och sen är den snygg… Men för avancerade tillämpningar i Excel är den i alla fall fortfarande hopplöst efter… Motbevisa mig gärna!

Avslutningsvis

Så kan alltså man läsa in en tabell från en PDF-fil in i Excel…

Nedan har du filmen som visar allt det jag skrivit om steg för steg.

Har du frågor eller kommentarer så kan du ställa dem här nere. Observera dock att jag normalt inte har tid att lösa privata Excelproblem och att det kan ta lite tid innan jag svarar.

Var det här ett tips som hjälpte så for du gärna klicka på Facebook gilla-knappen eller dela min post. Då kan du även följa med när det kommer fler smarta tips. Framförallt är jag intresserad av alternativa lösningar, inte minst för Macintosh.

Kolla även min sida med boktips om du vill lära dig mer om Excel. Där tipsar jag om mina fem bästa böcker inom olika kategorier, från böcker för nybörjaren till avancerade böcker i VBA.

Om du inte gör det så skall du naturligtvis prenumerera på kanalen AndersExcel på YouTube så du inte missar när det kommer fler filmer. Kanalen är nu världens största kanal för Excelkunskap på svenska (probably…) Just nu är vi 3500 prenumeranter och med din hjälp kanske vi kan bli 4000 innan året är slut… Klicka bara på knappen nedan:

Min YouTubefilm: Hur du konverterar PDF till Excel:

Min film på kanalen AndersExcel. Jag blev faktiskt så där förvånad när jag upptäckte hur enkelt det var att importera PDF till Excel. Några dagar tidigare hade jag spenderat timmar med att kopiera och klistrat in data från en PDF till Excel. I bildens nedre vänstra hörn ser du skymten av lilla Millie som undrar om det betyder att man skall få godis…
(Visited 23 086 times, 2 visits today)

15 comments

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *

Denna webbplats använder Akismet för att minska skräppost. Lär dig hur din kommentardata bearbetas.