Fandom

Scratchpad

Noter - log

216,213pages on
this wiki
Add New Page
Discuss this page0 Share

Ad blocker interference detected!


Wikia is a free-to-use site that makes money from advertising. We have a modified experience for viewers using ad blockers

Wikia is not accessible if you’ve made further modifications. Remove the custom ad blocker rule(s) and the page will load as expected.

Kronologiske noter.

d. 1/10-07

  • Objektiv: ca. 100mm, e.g. sigma105mm.
  • Software -zope -pgdp
  • Udviklingsserver - at home
  • Server - absalon??
  • testscanninger og eksperimenter.
  • sp. fra report

d. 28/9-07

  • Dokumentstruktur
    • Initeringsfasen
      • Præciser projekt...
        • Målbarer successkriterier
      • Faseplan
      • Risikolog
      • Opfyldelse af dokumentationskrav fra bs.
    • 1. fase
      • Software development
        • Eksperimental prototype, baseret på pgdp, kaseres forhåbentligt senere - erfaringsopsamling og risikostyring
        • Simple image preprocessing
      • OCR - Finereader XIX anskaffet and running
      • Skanning, udstyr på plads, studentermedhjælpere ansat og igang
      • Sysadm
        • backup plan and storage of scanned images
        • Developmentserver choosen and running
    • 2. fase
      • Udvikling af ny korrekturgrænseflade, m. masserettelse etc.
      • Forbedret OCR via billed preprocessing
    • (3. fase)
      • Forbedret OCR via specialiseret software
    • 4. fase
      • Publisering, hvervning af korrekturlæsere
      • overflytning til produktionsservere

d. 20/9-07

  • Publiceringsplatform
    • Mulighed: distributed proofreader
      • Udgangspunkt i eksisterende løsning kan spare tid, hvis systemet er overskueligt/veldokumenteret
    • Mulighed: zope from scratch
      • Bedre integration med absalon.nu og bibliotek.kk.dk
  • Koordinater for ord fra pdf til korrektur sandsynligvis mulig via tilretning af jpedal
    • Tilføj udtræk af koordinater til org.jpedal.grouping.PdfGroupingAlgorithms

Plan

  • Stadsarkivet
    • Scanner - kvalitet, samt special case ved små bøger
  • KDB
    • storage billedmateriale, backup
    • server, oplægning
    • zope integration
    • wiki
    • php-server etc. (distributed proofread)

d. 19/9-07

  • Møde med Hamid
    • Finereader XIX
      • Skulle være ligetil, - udfordringen er skanningskvaliteten/preprocessing
    • Skanning
      • Lyssætning, kontrast, dpi
      • BookDrive sandsynligvis ikke tilstrækkelig (NB: note to self, do testscans and sammenligning)
    • Preprocessing
      • Fælles filterkombination baseret på stikprøver/gennemsnit
  • Rådhusbiblioteket
    • Størrelser
      • 9x14cm indtil 1859
      • 10x18cm indtil 1862
      • 14x22cm indtil 1882
      • 18x27cm derefter
    • Fraktur ophørerer 1878
    • Nogle af udgaverne er nedfotograferet, i 1863-1882
      • 18x22cm
      • Findes i stadsarkivet

Plan

  • Møde
    • Workflow for skanning
      • Software, finereader XIX?
      • Skanningskvalitet, BookDrive DIY
    • Generelt skanning
      • Gotisk
      • OCR teori og teknik
      • Software, OSS
  • Stadsbibliotek
    • Årgange gotisk/ikke gotisk
    • Bogstørrelse
    • Overblik, husk medbring notesblok

d. 18/9-07

  • Afklaring ifbm. ocr, server og skanner
    • Møde med Hamid onsdag kl. 10, hb
    • Møde med Niels torsdag kl. 13, stadsarkivet.
    • Muligvis møde torsdag ?

Noter før møde

  • Pre-meeting
    • Set up wiki for projekt
    • Ubuntu-cd for workstation
  • Praktisk - server etc.
  • Praktisk ifbm. ansættelse
  • Plan for projektet
    • Baseline
      • Indskanning af de påkrævede hver femte årgang
        • Se skanner etc.
        • Koordinering af skanning, - via wiki?
        • Ansættelse af studentermedhjælper
        • Workflow for skanning
        • Lagring og backup...
      • OCR...
        • kontakt kong.bib. for at tjekke at det er samme procedure/software som for prototypen.
        • anskaf finereader
        • Initier scanning med batches, start evt ud fra eksisterende skans.
      • Oplægning.
        • Find ud af det praktiske med server etc.
        • Kig nærmere på, og vælg, base for løsning, i første omgang distributed proofreaders...
        • Enkel tilretning, så sider kan vises/søges, samt korrekturlæses.
    • Version 2
      • Evt. flere skannede sider
      • visning med forkortelsesekspansion
      • Open source OCR, evt. m. feedback fra korrektur
      • PR for projekt, netværk mm. - biblioteker, runeberg, oca, ...
      • værgning af korrekturlæsere
  • Tidsplan
    • Internal deadline baseline end october. Scanning start, end september.

Also on Fandom

Random wikia