Dansk LibreOffice forum Forum Indeks Dansk LibreOffice forum
da.libreoffice.org
LibreOffice i Danmark
 
 FAQFAQ   SøgSøg   GrupperGrupper   TilmeldTilmeld 
 ProfilProfil   LoginLogin 

Fra PDF dokument til redigerbar tekst!

 
Skriv nyt emne   Besvar indlægget    Dansk LibreOffice forum Forum Indeks -> Tekstbehandling
Vis foregående emne :: Vis næste emne  
Forfatter Besked
lindkaer



Indmeldt: 29. Jun 2007
Indlæg: 3
Geografisk sted: Hvidovre

IndlægSkrevet: Tirs Nov 17, 2009 0:29    Emne: Fra PDF dokument til redigerbar tekst! Besvar, med citat

Jeg har en del indscannede gamle maskinskrevne dokumenter gemt i pdf format. Kan jeg på nogen måde bruge Open Office til at "læse" dem og "oversætte" dem til redigerbar tekst Question Rolling Eyes
_________________
Mvh
Lindkær
Tilbage til toppen
Vis brugerens profil Send privat besked
Thiram



Indmeldt: 19. Sep 2007
Indlæg: 13
Geografisk sted: Nordjylland

IndlægSkrevet: Tirs Nov 17, 2009 9:05    Emne: Besvar, med citat

Måske kan du have glæde af denne udvidelse?

http://extensions.services.openoffice.org/search/node/pdf+import

Mvh. Thiram
Tilbage til toppen
Vis brugerens profil Send privat besked
SME



Indmeldt: 29. Sep 2008
Indlæg: 163
Geografisk sted: Silkeborg, Danmark

IndlægSkrevet: Tirs Nov 17, 2009 11:21    Emne: Besvar, med citat

Thiram henviser til SUN PDF Import udvidelsen, men denne kan du kun anvende, hvis teksten i PDF-filen er gemt som tekst.
Jeg tror dog, at siden indscannede dokumenter, står teksten som et billede. Derfor har du brug for et såkaldt OCR program ("Optical Character Recognition"). Har du MS Office installeret har du faktisk et program til det (Microsoft Office Document Imaging), men du har heldigvis et par gratis valgmuligheder.
Jeg må dog erkende, at jeg ikke har nogle erfaringer med nogle af programmerne, men her er hvad jeg fandt fra google.


  • Free Online OCR: Her kan du uploade dine PDF'er og få dem analyseret ganske gratis.
  • Free OCR: Et gratis program til OCR. Desværre kunne jeg ikke se noget på deres hjemmeside, men jeg fandt et sted hvor den muligvis kan downloades
  • Simple OCR: Endnu et gratis program.
  • Top OCR: Endnu et gratis program.


Jeg håber det hjælper dig meget!

/Stefan
_________________
OOo 3.1 kører fint på Vista Home Premium.
Tilbage til toppen
Vis brugerens profil Send privat besked Besøg brugerens webside
lindkaer



Indmeldt: 29. Jun 2007
Indlæg: 3
Geografisk sted: Hvidovre

IndlægSkrevet: Ons Nov 18, 2009 13:26    Emne: Fra PDF dokument til redigerbar tekst! Besvar, med citat

SME skrev:
Thiram henviser til SUN PDF Import udvidelsen, men denne kan du kun anvende, hvis teksten i PDF-filen er gemt som tekst.
Jeg tror dog, at siden indscannede dokumenter, står teksten som et billede. Derfor har du brug for et såkaldt OCR program ("Optical Character Recognition"). Har du MS Office installeret har du faktisk et program til det (Microsoft Office Document Imaging), men du har heldigvis et par gratis valgmuligheder.
Jeg må dog erkende, at jeg ikke har nogle erfaringer med nogle af programmerne, men her er hvad jeg fandt fra google.


  • Free Online OCR: Her kan du uploade dine PDF'er og få dem analyseret ganske gratis.
  • Free OCR: Et gratis program til OCR. Desværre kunne jeg ikke se noget på deres hjemmeside, men jeg fandt et sted hvor den muligvis kan downloades
  • Simple OCR: Endnu et gratis program.
  • Top OCR: Endnu et gratis program.


Jeg håber det hjælper dig meget!

/Stefan



Først tak til Thiram og Stefan for hjælpen! Very Happy
Som du rigtigt skriver, Stefan er mine gamle dokumenter gemt som PDF billeder, så man er afhængig af at have et OCR program til at læse teksten. Jeg troede, at et sådant program måske fandtes i Open office, men tak for dine forslag til andree løsninger, som jeg nu har haft lejlighed til at prøve.
Det viser sig, at det bedste af de foreslåede programmer til mit formål må siges at være "http://www.topocr.com/topocr.html", som dog ikke umiddelbart kan åbne PDF billeder. Men hvis man kopierer PDF dokumentbillederne ind i f.eks "Paint" og derfra gemmer dem som .jpg filer, kan de konverteres af "Top OCR" til redigerbar tekst med et glimrende resultat, som også får de specielle danske tegn æ,ø og å med, hvilket ikke var tilfældet med de andre programmer.
Nu må jeg så bare udforske mulighederne i programmet yderligere Wink
Tak igen for hjælpen!
_________________
Mvh
Lindkær
Tilbage til toppen
Vis brugerens profil Send privat besked
SME



Indmeldt: 29. Sep 2008
Indlæg: 163
Geografisk sted: Silkeborg, Danmark

IndlægSkrevet: Ons Nov 18, 2009 14:20    Emne: Besvar, med citat

Hej

Jeg er glad for at tingene virker.
Til PDF'er bruger jeg selv PDF-XChange Viewer, som er gratis og kan lidt mere end Acrobat Reader. Heriblandt kan man hurtigt eksportere hele pdf-filen til billeder (tiff, png, bmp etc.); du finder det under Filer - Eksportere.

/Stefan
_________________
OOo 3.1 kører fint på Vista Home Premium.
Tilbage til toppen
Vis brugerens profil Send privat besked Besøg brugerens webside
Lodahl



Indmeldt: 14. Sep 2005
Indlæg: 1927
Geografisk sted: Storkøbenhavn

IndlægSkrevet: Ons Nov 18, 2009 14:31    Emne: Besvar, med citat

Hej,
Indskannede pdf-filer, hvor teksten ligger som et billede, kan ikke umiddelbart konverteres til tekst. Der skal som nævnt bruges et OCR program.

Der findes flere forskellige netløsninger, men desværre er de ikke gode til at læse danske karakterer æ, ø og å.

Hvis du har en skanner, så kan det være at du har fået leveret et OCR program med. Ellers er min erfaring desværre, at gode OCR programmer, der kan æ, ø og å, koster en mindre formue.
_________________
Med venlig hilsen

Leif Lodahl
Blog: http://blog.magenta-aps.dk/category/kontor/
LibreOffice: http://da.libreoffice.org
Shop: http://libreoffice.spreadshirt.dk
Tilbage til toppen
Vis brugerens profil Send privat besked Besøg brugerens webside
lindkaer



Indmeldt: 29. Jun 2007
Indlæg: 3
Geografisk sted: Hvidovre

IndlægSkrevet: Tors Nov 19, 2009 13:42    Emne: Fra PDF dokument til redigerbar tekst! Besvar, med citat

Hej Stefan og Lodahl!
Tak for jeres hjælp Very Happy
Stefan, jeg har brugt dit link til PDF-XChange Viewer, og således har jeg let fået mine PDF billeder konverteret til .jpg. Jeg er nu godt i gang via "Top OCR" at overføre dem til tekst, hvilket går fint, men lidt langsomt, da jeg (vist nok) kun kan overføre en side ad gangen.
Og, Lodahl jeg synes, at resultatet er ganske fint - med æ,ø og å - især når man tager i betragtning, at originaldokumenterne har en del håndskrevne rettelser og komentarer, som naturligvis forstyrrer "oversættelsen"!
Jeg har forsøgt med "Simple OCR" at konvertere nogle håndskrevne dokumenter, men det blev næsten grinagtigt mislykket Laughing Exclamation
_________________
Mvh
Lindkær
Tilbage til toppen
Vis brugerens profil Send privat besked
Vis ikke emner ældre end:   
Skriv nyt emne   Besvar indlægget    Dansk LibreOffice forum Forum Indeks -> Tekstbehandling Alle tidspunkter er GMT + 2 timer
Side 1 af 1

 
Gå til:  
Du kan ikke skrive nye indlæg i dette forum
Du kan ikke besvare indlæg i dette forum
Du kan ikke rette dine indlæg i dette forum
Du kan ikke slette dine indlæg i dette forum
Du kan ikke stemme på afstemninger i dette forum


The Document Foundation  Open Source Licensed  No Software Patents! opendocument.xml.org