Scratchpad

If you are new to Scratchpad, and want full access as a Scratchpad editor, create an account!
If you already have an account, log in and have fun!!

READ MORE

Scratchpad
Advertisement

Kronologiske noter.

d. 1/10-07[]

  • Objektiv: ca. 100mm, e.g. sigma105mm.
  • Software -zope -pgdp
  • Udviklingsserver - at home
  • Server - absalon??
  • testscanninger og eksperimenter.
  • sp. fra report

d. 28/9-07[]

  • Dokumentstruktur
    • Initeringsfasen
      • Præciser projekt...
        • Målbarer successkriterier
      • Faseplan
      • Risikolog
      • Opfyldelse af dokumentationskrav fra bs.
    • 1. fase
      • Software development
        • Eksperimental prototype, baseret på pgdp, kaseres forhåbentligt senere - erfaringsopsamling og risikostyring
        • Simple image preprocessing
      • OCR - Finereader XIX anskaffet and running
      • Skanning, udstyr på plads, studentermedhjælpere ansat og igang
      • Sysadm
        • backup plan and storage of scanned images
        • Developmentserver choosen and running
    • 2. fase
      • Udvikling af ny korrekturgrænseflade, m. masserettelse etc.
      • Forbedret OCR via billed preprocessing
    • (3. fase)
      • Forbedret OCR via specialiseret software
    • 4. fase
      • Publisering, hvervning af korrekturlæsere
      • overflytning til produktionsservere

d. 20/9-07[]

  • Publiceringsplatform
    • Mulighed: distributed proofreader
      • Udgangspunkt i eksisterende løsning kan spare tid, hvis systemet er overskueligt/veldokumenteret
    • Mulighed: zope from scratch
      • Bedre integration med absalon.nu og bibliotek.kk.dk
  • Koordinater for ord fra pdf til korrektur sandsynligvis mulig via tilretning af jpedal
    • Tilføj udtræk af koordinater til org.jpedal.grouping.PdfGroupingAlgorithms

Plan[]

  • Stadsarkivet
    • Scanner - kvalitet, samt special case ved små bøger
  • KDB
    • storage billedmateriale, backup
    • server, oplægning
    • zope integration
    • wiki
    • php-server etc. (distributed proofread)

d. 19/9-07[]

  • Møde med Hamid
    • Finereader XIX
      • Skulle være ligetil, - udfordringen er skanningskvaliteten/preprocessing
    • Skanning
      • Lyssætning, kontrast, dpi
      • BookDrive sandsynligvis ikke tilstrækkelig (NB: note to self, do testscans and sammenligning)
    • Preprocessing
      • Fælles filterkombination baseret på stikprøver/gennemsnit
  • Rådhusbiblioteket
    • Størrelser
      • 9x14cm indtil 1859
      • 10x18cm indtil 1862
      • 14x22cm indtil 1882
      • 18x27cm derefter
    • Fraktur ophørerer 1878
    • Nogle af udgaverne er nedfotograferet, i 1863-1882
      • 18x22cm
      • Findes i stadsarkivet

Plan[]

  • Møde
    • Workflow for skanning
      • Software, finereader XIX?
      • Skanningskvalitet, BookDrive DIY
    • Generelt skanning
      • Gotisk
      • OCR teori og teknik
      • Software, OSS
  • Stadsbibliotek
    • Årgange gotisk/ikke gotisk
    • Bogstørrelse
    • Overblik, husk medbring notesblok

d. 18/9-07[]

  • Afklaring ifbm. ocr, server og skanner
    • Møde med Hamid onsdag kl. 10, hb
    • Møde med Niels torsdag kl. 13, stadsarkivet.
    • Muligvis møde torsdag ?

Noter før møde[]

  • Pre-meeting
    • Set up wiki for projekt
    • Ubuntu-cd for workstation
  • Praktisk - server etc.
  • Praktisk ifbm. ansættelse
  • Plan for projektet
    • Baseline
      • Indskanning af de påkrævede hver femte årgang
        • Se skanner etc.
        • Koordinering af skanning, - via wiki?
        • Ansættelse af studentermedhjælper
        • Workflow for skanning
        • Lagring og backup...
      • OCR...
        • kontakt kong.bib. for at tjekke at det er samme procedure/software som for prototypen.
        • anskaf finereader
        • Initier scanning med batches, start evt ud fra eksisterende skans.
      • Oplægning.
        • Find ud af det praktiske med server etc.
        • Kig nærmere på, og vælg, base for løsning, i første omgang distributed proofreaders...
        • Enkel tilretning, så sider kan vises/søges, samt korrekturlæses.
    • Version 2
      • Evt. flere skannede sider
      • visning med forkortelsesekspansion
      • Open source OCR, evt. m. feedback fra korrektur
      • PR for projekt, netværk mm. - biblioteker, runeberg, oca, ...
      • værgning af korrekturlæsere
  • Tidsplan
    • Internal deadline baseline end october. Scanning start, end september.
Advertisement