Scanning af dokument

Diverse d.  31. juli. 2010, skrevet af zmilet
Vist: 1157 gange.

zmilet
 
Overclocker
Tilføjet:
31-07-2010 16:05:09
Svar/Indlæg:
89/9
Hejsa

Jeg står og har købt mig en multimaskine, med scanner som har arkføder til 50 ark, min mening er nu at scanne alle mine papirer ind på min pc, så jeg har en digital løsning, så jeg kan slippe for alle ringbindene.

Min mening er at scanne dem ind først, så jeg kan få papirerne væk, og så senere hen redigere dem, så de får et bedre udseende, opretning af tekst osv.

Idet jeg gerne vil have at mine scannede dokumenter, bliver så redigerings venlige som mulig senere hen, hvilket filformat er det bedste at benytte til dette ???

Har prøvet at lege lidt med scanning som JPG og PDF, samt lidt OCR software, men er lidt i tvivl om hvilken fremgangsmåde er bedst ???

På forhånd tak

Zmilet
da9els
 
Chefredaktør
Tilføjet:
31-07-2010 21:17:11
Svar/Indlæg:
4438/91
.jpg er under alle omstændigheder nogo. Hellere .png eller noget andet lossless. Mener at .pdf gemmer billeder som .jpg embedded.


zmilet
 
Overclocker
Tilføjet:
31-07-2010 22:26:04
Svar/Indlæg:
89/9
#1

Ok, virkelig tak for input

Det vil sige at JPG er en dårlig løsning, og på en måde også PDF ???


da9els
 
Chefredaktør
Tilføjet:
31-07-2010 23:25:46
Svar/Indlæg:
4438/91
Du kan godt bruge .jpg, men så skal du sørge for at komprimeringen ikke falder til under 90% - for så ser det ret crappy ud, og jeg mener at .pdf som default komprimerer til 70% 😕 Så den setting skal du lige være ops på. Sagen er den at .jpg ved 90% komprimering fylder ca. det samme som .png - alt efter hvad der er på billedet selvfølgelig. Men hvis det ikke er pladsen der er et issue så havde jeg taget .png til hver en tid.
Så kan du altid lege med OCR bagefter 😛


zmilet
 
Overclocker
Tilføjet:
01-08-2010 00:24:02
Svar/Indlæg:
89/9
#3

En god forklaring, takker.

Fandt også lidt beskrivelser på de forskellige filformater.
TIFF skulle være det optimale til tryk osv. PNG skulle være til optimalt til nettet, men skulle begge være tabsfri


Svaret blev redigeret 1 gang, sidst af zmilet d. 01-08-2010 00:42:00.


zmilet
 
Overclocker
Tilføjet:
01-08-2010 00:39:32
Svar/Indlæg:
89/9
#3
Fandt lige denne
http://www.gbtryk.dk/Pages/Fil...


Svaret blev redigeret 1 gang, sidst af zmilet d. 01-08-2010 00:39:46.


zmilet
 
Overclocker
Tilføjet:
01-08-2010 00:43:23
Svar/Indlæg:
89/9
Pladsen er ikke det der skal afgøre det, men at filen er så optimal som mulig til videre behandling med OCR/redigering


da9els
 
Chefredaktør
Tilføjet:
01-08-2010 09:21:54
Svar/Indlæg:
4438/91
Tiff er klart en option. Hellere det end .bmp .. Men som du linker til i #5 så skriver de også at .png leverer så overbevisende god kvalitet at det i mange tilfælde godt kan erstatte .tiff.
Men hvis det meste er sort / hvid så vinder du stort set ingen ting ved at bruge .tiff frem for .png. Tværtimod vil jeg tro at du taber i det lange løb pga. .tiff er så meget større.


TBT
 
Superbruger
Tilføjet:
01-08-2010 13:02:03
Svar/Indlæg:
422/14
Det afhænger 100% af hvad der er tale om af dokumenter og efterfølgende brug!

Er der blot tale om alle de skattepapirer, forsikringer osv man går og gemmer i årevis, så er pdf langt at foretrække, du kan med adobe pro køre ocr på alle dokumenterne, og den rammer rigtigt i 99% af tilfældende hvis ellers der er tale om et ordenligt scan.

Og det er igen rigeligt til udskrift.

Er der tale om ren billedmateriale, så er det en anden sag, der ville jeg også vælge tif eller psd hvor du intet tab har, men til gengæld alle muligheder for kvalitetsgenskabelse ved udskrift.

pdf bruges altså også trykrelateret, alle mine dokumenter ligger i pdf, og selvom den kan gemme som embeded jpg, så er det ikke er krav.
Og der er altså tale om brochurer der udleveres TIL grafiske virksomheder, og de ville være de første til at klage over trykkvaliteten, hvis der var noget at komme efter!



Svaret blev redigeret 1 gang, sidst af TBT d. 01-08-2010 13:03:45.


zmilet
 
Overclocker
Tilføjet:
01-08-2010 13:27:56
Svar/Indlæg:
89/9
#7-8

Kan forstå ud fra jer, at TIFF er klart det bedste til farve foto, f.eks. fra mit digital kamera, men PNG kan også gå an. Det fik så lige øjnene op for nogle forhåbenlig bedre fotos, idet mit kamera altid bare har gemt i JPG, men kan gemme i TIFF.

Ang. mine dokumenter, er det nemlig som #8 skriver, skattepapirer osv. altså post man har fået ind af døren de sidste mange år, og der er PDF rigeligt ???
Og skal jo bare bruges til opbevaring.

Legede lidt med PNG, TIFF og JPG i nat, og synes ikke jeg kan se en forskel på de testede indscannede dokumenter.

Har indtil videre scannet dem i 300dpi, eller skal jeg gøre det i 600dpi for at få en bedre tekstgenkendelse ???
Prøvede finereader, og det sagde ved nogle af papirerne, at jeg skulle scanne i højere opløsning.


da9els
 
Chefredaktør
Tilføjet:
01-08-2010 14:21:36
Svar/Indlæg:
4438/91
#8 .. Jeg mener .tiff er embedded i .psd. Jeg syntes ikke det gir meget mening at gemme i et format til et program til 5K. Ej hellere at betale for Acrobat Pro. Der er rigtig godt freeware OCR software der ude.

#9 .. Jeps .tiff til billeder uden at gå på kompromis. Og .png til dokumenter - Så kan du altid sætte det sammen til .pdf'er hvis det skulle blive aktuelt.
600+ dpi når nu plads ikke er et issue 🙂


zmilet
 
Overclocker
Tilføjet:
01-08-2010 15:00:58
Svar/Indlæg:
89/9
#10

Ok, så må fremgangsmåden være som jeg har forstået det.

1. Scan dokument, gem filen som PNG, PDF (Har ikke leget endnu, men lyttet efter) 🙂
Så er papirerne væk fra hylderne og ringbind.

2. senere hen, åbne i et redigeringsprogram, og redigere div. billeder og logoer, hvis der er det på papirerne, regner med at det skal gøres inden OCR program ???
Gem igen som PNG, PDF.

3. Åbn filen i OCR program, og bearbejd teksten til genkendelse.
Gem derefter filen som PDF, som så er færdigt resultat


da9els
 
Chefredaktør
Tilføjet:
02-08-2010 10:12:54
Svar/Indlæg:
4438/91
#11 .. Jeps, det lyder som en meget fornuftig fremgangsmetode. Behold endelig de originale indscanninger 🙂

Finten ved at først at gemme til .pdf til sidst er at du der kan gruppere dem så du f.eks. har alle papirer fra banken år 2008 i et dokument sorteret efter dato 🙂 Og et .pdf dokument er jo dejlig nemt at søge i.


zmilet
 
Overclocker
Tilføjet:
02-08-2010 11:53:20
Svar/Indlæg:
89/9
#12

Nice, så bliver det måden at gøre det på.

Jeg siger mange tusind tak til jer begge 2, for jeres meget brugbare inputs.
Og man vil jo gerne have at det bliver ordenligt første gang 🙂

mvh. Zmilet


@ngler
 
Redaktør
Tilføjet:
04-08-2010 07:11:24
Svar/Indlæg:
4033/364
#12

Hvor kan man finde ocr program som freeware ?

Jeg ville bare gemme dem som pdf, medmindre du skal ændre i dem.

de pdf filer man fx får fra eboks er pdf med et søgbart lag som gør man kan trække teksten af med fx acrobat reader eller kodemæssigt med fx pdf2txt (har kodet i vba på arbejdet så den tager teksten fra synsindkaldelser , slår bilen op i vores database, skriver i et vandmærke hvilken bil det er og sender det til kunden og gemmer info om hvornår den skal til syn i databasen.