Kronologiske noter.
d. 1/10-07[]
- Objektiv: ca. 100mm, e.g. sigma105mm.
- Software -zope -pgdp
- Udviklingsserver - at home
- Server - absalon??
- testscanninger og eksperimenter.
- sp. fra report
d. 28/9-07[]
- Dokumentstruktur
- Initeringsfasen
- Præciser projekt...
- Målbarer successkriterier
- Faseplan
- Risikolog
- Opfyldelse af dokumentationskrav fra bs.
- Præciser projekt...
- 1. fase
- Software development
- Eksperimental prototype, baseret på pgdp, kaseres forhåbentligt senere - erfaringsopsamling og risikostyring
- Simple image preprocessing
- OCR - Finereader XIX anskaffet and running
- Skanning, udstyr på plads, studentermedhjælpere ansat og igang
- Sysadm
- backup plan and storage of scanned images
- Developmentserver choosen and running
- Software development
- 2. fase
- Udvikling af ny korrekturgrænseflade, m. masserettelse etc.
- Forbedret OCR via billed preprocessing
- (3. fase)
- Forbedret OCR via specialiseret software
- 4. fase
- Publisering, hvervning af korrekturlæsere
- overflytning til produktionsservere
- Initeringsfasen
d. 20/9-07[]
- Publiceringsplatform
- Mulighed: distributed proofreader
- Udgangspunkt i eksisterende løsning kan spare tid, hvis systemet er overskueligt/veldokumenteret
- Mulighed: zope from scratch
- Bedre integration med absalon.nu og bibliotek.kk.dk
- Mulighed: distributed proofreader
- Koordinater for ord fra pdf til korrektur sandsynligvis mulig via tilretning af jpedal
- Tilføj udtræk af koordinater til org.jpedal.grouping.PdfGroupingAlgorithms
Plan[]
- Stadsarkivet
- Scanner - kvalitet, samt special case ved små bøger
- KDB
- storage billedmateriale, backup
- server, oplægning
- zope integration
- wiki
- php-server etc. (distributed proofread)
d. 19/9-07[]
- Møde med Hamid
- Finereader XIX
- Skulle være ligetil, - udfordringen er skanningskvaliteten/preprocessing
- Skanning
- Lyssætning, kontrast, dpi
- BookDrive sandsynligvis ikke tilstrækkelig (NB: note to self, do testscans and sammenligning)
- Preprocessing
- Fælles filterkombination baseret på stikprøver/gennemsnit
- Finereader XIX
- Rådhusbiblioteket
- Størrelser
- 9x14cm indtil 1859
- 10x18cm indtil 1862
- 14x22cm indtil 1882
- 18x27cm derefter
- Fraktur ophørerer 1878
- Nogle af udgaverne er nedfotograferet, i 1863-1882
- 18x22cm
- Findes i stadsarkivet
- Størrelser
Plan[]
- Møde
- Workflow for skanning
- Software, finereader XIX?
- Skanningskvalitet, BookDrive DIY
- Generelt skanning
- Gotisk
- OCR teori og teknik
- Software, OSS
- Workflow for skanning
- Stadsbibliotek
- Årgange gotisk/ikke gotisk
- Bogstørrelse
- Overblik, husk medbring notesblok
d. 18/9-07[]
- Afklaring ifbm. ocr, server og skanner
- Møde med Hamid onsdag kl. 10, hb
- Møde med Niels torsdag kl. 13, stadsarkivet.
- Muligvis møde torsdag ?
Noter før møde[]
- Pre-meeting
- Set up wiki for projekt
- Ubuntu-cd for workstation
- Praktisk - server etc.
- Praktisk ifbm. ansættelse
- Plan for projektet
- Baseline
- Indskanning af de påkrævede hver femte årgang
- Se skanner etc.
- Koordinering af skanning, - via wiki?
- Ansættelse af studentermedhjælper
- Workflow for skanning
- Lagring og backup...
- OCR...
- kontakt kong.bib. for at tjekke at det er samme procedure/software som for prototypen.
- anskaf finereader
- Initier scanning med batches, start evt ud fra eksisterende skans.
- Oplægning.
- Find ud af det praktiske med server etc.
- Kig nærmere på, og vælg, base for løsning, i første omgang distributed proofreaders...
- Enkel tilretning, så sider kan vises/søges, samt korrekturlæses.
- Indskanning af de påkrævede hver femte årgang
- Version 2
- Evt. flere skannede sider
- visning med forkortelsesekspansion
- Open source OCR, evt. m. feedback fra korrektur
- PR for projekt, netværk mm. - biblioteker, runeberg, oca, ...
- værgning af korrekturlæsere
- Baseline
- Tidsplan
- Internal deadline baseline end october. Scanning start, end september.