Introdução

Este documento sintetiza a avaliação e o posterior processo de extração de registos bibliográficos e de leitores do catálogo atual de uma biblioteca municipal e posterior conversão desses registos para o formato normalizado ISO2709, possibilitando a sua importação por qualquer sistema normalizado com capacidade de importação de registos em formato MARC (UNIMARC) usando o formato normalizado de troca de registos ISO2709.

Avaliação inicial

A avaliação inicial resultou da análise da base de dados contendo um total de 274 tabelas e 127 views de dados, da qual não existia qualquer documentação nem modelo de dados disponível.

Resumidamente, da análise realizada pode-se concluir o seguinte:

  1. Os registos não são armazenados em qualquer formato MARC (UNIMARC, MARC21 ou outro), não existindo, por isso, a divisão da informação por campos, subcampos e não existem os 2 indicadores associados aos campos de dados que são obrigatórios no formato UNIMARC adotado em Portugal;
  2. Os dados dos registos são armazenados tal como são visualizados, não havendo separação em subcampos;
  3. É praticamente impossível fazer a recuperação de campos dos registos de uma forma direta. Tal só se consegue através da análise da pontuação existente nos campos e só o seu processamento é que poderá permitir a separação obrigatória desses valores em subcampos. Por exemplo, o título do registo nº 64999 aparece disponível na base de dados da seguinte forma:

    Fala a lenda japonesa : colectânea de histórias e lendas japonesas / Wenceslau de Moraes; sel., introd. e notas Maria João Janeiro

    A informação anterior tem de ser analisada e transformada, de acordo com o contexto do texto, no seguinte campo de dados em formato MARC (UNIMARC):

    200:1 ^aFala a lenda japonesa^ecolectânea de histórias e lendas japonesas^fWenceslau de Moraes^gsel., introd. e notas Maria João Janeiro

  4. O critério usado ao longo do armazenamento de dados não é consistente. Por vezes existem dados em circunstâncias idênticas que são armazenados com e sem pontuação;
  5. A utilização de pontuação para determinar as componentes dos campos não consegue garantir a 100% que o processo de transformação do campo de dados no formato MARC ocorre sem erros pois, por exemplo, a vírgula que pode ocorrer no conteúdo dos títulos, subtítulos, etc., também é usada para fazer a separação de campos/subcampos;
  6. Existe conteúdo de campos que aparece repetido n vezes ao longo de várias tabelas e views nem sempre totalmente com conteúdo coincidente em todas elas;
  7. Existe conteúdo que aparece nos registos bibliográficos apresentados pelo NYRON mas não se encontra em qualquer campo da base de dados. Esse conteudo será, muito provavelmente, adicionado através de programação ou de outro qualquer mecanismo adicional que não conseguimos identificar;
  8. Existe conteúdo de dados que aparece nos registos bibliográficos e que, pelo menos aparentemente, não tem correspondência nos campos do formato UNIMARC. Decidimos ainda assim preservá-lo e adicioná-lo à exportação no campo 999, subcampos ^a e ^b sempre que fossem detetados, para que possam ser, eventualmente, incorporados durante o processo de importação para o novo sistema.

Base de Dados em números

A base de dados continha informação relativa a aproximadamente 55,000 registos bibliográficos e 73,000 exemplares correspondentes.

O processo de reengenharia inversa levado a cabo permitiu identificar a forma como a generalidade da informação estava distribuída pelas 274 tabelas e extrair e converter para o formato UNIMARC a informação aí armazenada.

Assim, aplicando o modelo de conversão de dados por nós desenhado a todos os registos existentes, foram gerados os seguintes campos para cada um dos blocos do UNIMARC:

Bloco Descrição N. campos criados
0XXBloco de Identificação124 452
1XXBloco de Informação Codificada166 470
2XXBloco de Informação Descritiva221 050
3XXBloco de Notas57 832
4XXBloco de Entradas Relacionadas98
5XXBloco de Títulos Relacionados3 768
6XXBloco de Assuntos e História Bibliográfica148 851
7XXBloco de Responsabilidades112 320
8XXBloco de Uso Internacional54 520
9XXBloco de Uso Nacional544 229
Total1 433 590

Análise dos Resultados

Para verificar a viabilidade da conversão foi solicitado às bibliotecárias da instituição que escolhessem um conjunto de registos que serviriam de base à avaliação da viabilidade da conversão e para avaliação da qualidade do resultado.

Os títulos indicados para avaliação foram os seguintes:


Imagem do primeiro registo tal como aparecia no catálogo da Biblioteca da Municipal

Os dados anteriores correspondem ao seguinte conjunto de campos e subcampos no formato UNIMARC após a conversão:

001:16784 010: ^a978-989-682-080-0 021: ^aPT^b324679/11 101:1 ^apor 102: ^aPT 105: ^aa z 000yd 106: ^ar 200:1 ^aDó e Mi descobrem Rossini^fIsabel Zambujal e Maria Pedro^gil. Carla Nazareth 210: ^a[Lisboa]^cLevoir - Marketing e Conteúdos Multimédia^dcop. 2011 215: ^a29 p.^cil.^d26 cm^e1 CD Audio 225:2 ^aGrandes Compositores II^v3 300: ^aO CD com 34:54min ; inclui : La gazza ladra (A pega ladra) Abertura (início) ; Guillerme Tell Abertura (fragmentos) ; La boutique fantasque (A loja fantástica), bailado "Tarantela" ; Dueto cómico dos gatos ; O barbeiro de Sevolha, abertura (fragmentos) ; Tancredi, coro "Plaudite o popoli" (versão para sopros) ; A italiana em Argel, abertura ; La scala di seta (A escada de seda), abertura ; La boutique fantasque (A loja fantástica) Can-can ; O barbeiro de Sevolha "Una voce poco fa" ; O senhor Bruschino, farsa, abertura ; La Cenerentola (A Cinderela), abertura , La boutique fantasque (A loja fantástica), abertura ; La gazza ladra (A pega ladra), abertura (final) 600: 1^aRossini^bGioacchino^f1792-1868^xBiografias 600: 1^aRossini^bGioacchino^f1792-1868^xCompositores 675: ^a78^vBN^zpor 675: ^a929^vBN^zpor 700: 1^aZambujal^bIsabel^f1965- 701: 1^aPedro^bMaria^cco-autor^4070 702: 1^aNazareth^bCarla^f1975-^cil.^4440 801: 0^aPT^bCML^gRPC 920:n 921:a 922:m 931:20120920 932:d 933:2011 935:c 936:y 966: ^a30100000C22796^lBMLOU^s78 ROS^i12242^kSala de Adultos – Biblioteca

Eis o resultado da conversão para o formato normalizado ISO2709 truncado a 80 colunas:

01685000000000373000450000100060000001000220000602100180002810100080004610200070 00541050018000611060006000792000081000852100067001662150034002332250031002673000 67300298600004700971600004901018675001601067675001701083700002801100701003201128 70200370116080100170119792000020121492100020121692200020121893100090122093200020 1229933000501231935000201236936000201238966007101240#16784# ^a978-989-682-080-0 # ^aPT^b324679/11#1 ^apor# ^aPT# ^aa z 000yd# ^ar#1 ^aDó e Mi descobrem Rossini^fIsabel Zambujal e Maria Pedro^gil. Carla Nazareth# ^a[Lisboa]^cLevoir - Marketing e Conteúdos Multimédia^dcop. 2011# ^a29 p.^cil.^d26 cm^e1 CD Audio# 2 ^aGrandes Compositores II^v3# ^aO CD com 34 54min ; inclui : La gazza ladra ( A pega ladra) Abertura (início) ; Guillerme Tell Abertura (fragmentos) ; La bout ique fantasque (A loja fantástica), bailado "Tarantela" ; Dueto cómico dos gatos ; O barbeiro de Sevolha, abertura (fragmentos) ; Tancredi, coro "Plaudite o pop oli" (versão para sopros) ; A italiana em Argel, abertura ; La scala di seta (A escada de seda), abertura ; La boutique fantasque (A loja fant stica) Can-can ; O barbeiro de Sevolha "Una voce poco fa" ; O senhor Bruschino, farsa, abertura ; La Cenerentola (A Cinderela), abertura , La boutique fantasque (A loja fantásti ca), abertura ; La gazza ladra (A pega ladra), abertura (final)# 1^aRossini^bGio acchino^f1792-1868^xBiografias# 1^aRossini^bGioacchino^f1792-1868^xCompositores# ^a78^vBN^zpor# ^a929^vBN^zpor# 1^aZambujal^bIsabel^f1965-# 1^aPedro^bMaria^cc o-autor^4070# 1^aNazareth^bCarla^f1975-^cil.^4440# 0^aPT^bCML^gRPC#n#a#m#2012092 0#d#2011#c#y# ^a30100000C22796^lBMLOU^s78 ROS^i12242^kSala de Adultos - Bibliot eca##


Uma vez convertido para o formato ISO2709 um registo bibliográfico pode ser importado por qualquer sistema normalizado de gestão bibliográfica sem qualquer tipo de intervenção. Depois de importado poderá ser visualizado nos múltiplos formatos disponíveis no sistema de destino

Visualização de registos

Apresenta-se em seguida a visualização do registo anterior usando quatro formatos de visualização disponíveis no BIBLIObase – Módulo de Catalogação e Pesquisa (versão original):

Descrição Completa

Formato de Visualização: Descrição completa

Descrição ISBD

ZAMBUJAL, Isabel 1965- Dó e Mi descobrem Rossini / Isabel Zambujal e Maria Pedro ; il. Carla Nazareth. - [Lisboa] : Levoir - Marketing e Conteúdos Multimédia, cop. 2011. - 29 p. : il. 26 cm + 1 CD Audio. - (Grandes Compositores II ; 3). - O CD com 34 54min ; inclui La gazza ladra (A pega ladra) Abertura (início) ; Guillerme Tell Abertura (fragmentos) ; La boutique fantasque (A loja fantástica), bailado "Tarantela" ; Dueto cómico dos gatos ; O barbeiro de Sevolha, abertura (fragmentos) ; Tancredi, coro "Plaudite o popoli" (versão para sopros) ; A italiana em Argel, abertura ; La scala di seta (A escada de seda), abertura ; La boutique fantasque (A loja fantástica) Can-can ; O barbeiro de Sevolha "Una voce poco fa" ; O senhor Bruschino, farsa, abertura ; La Cenerentola (A Cinderela), abertura , La boutique fantasque (A loja fantástica), abertura ; La gazza ladra (A pega ladra), abertura (final) ISBN 978-989-682-080-0 Rossini Gioacchino 1792-1868--Biografias / Rossini Gioacchino 1792-1868--Compositores CDU 78 CDU 929 78 ROS (BMLOU) - 30100000C22796

Descrição Abreviada

Dó e Mi descobrem Rossini / Isabel Zambujal e Maria Pedro ; il. Carla Nazareth. - [Lisboa] : Levoir - Marketing e Conteúdos Multimédia, cop. 2011. - 29 p. : il. 26 cm + 1 CD Audio. - (Grandes Compositores II ; 3). - O CD com 34 54min ; inclui La gazza ladra (A pega ladra) Abertura (início) ; Guillerme Tell Abertura (fragmentos) ; La boutique fantasque (A loja fantástica), bailado "Tarantela" ; Dueto cómico dos gatos ; O barbeiro de Sevolha, abertura (fragmentos) ; Tancredi, coro "Plaudite o popoli" (versão para sopros) ; A italiana em Argel, abertura ; La scala di seta (A escada de seda), abertura ; La boutique fantasque (A loja fantástica) Can-can ; O barbeiro de Sevolha "Una voce poco fa" ; O senhor Bruschino, farsa, abertura ; La Cenerentola (A Cinderela), abertura , La boutique fantasque (A loja fantástica), abertura ; La gazza ladra (A pega ladra), abertura (final) 78 ROS (BMLOU) - 30100000C22796

Descrição NP405

ZAMBUJAL Isabel ; PEDRO Maria co-autor - Dó e Mi descobrem Rossini. [Lisboa] : Levoir - Marketing e Conteúdos Multimédia, cop. 2011. 29 p.. ISBN 978-989-682-080-0

Capas de livros e outros anexos

Os registos bibliográficos estavam armazenados dentro da base de dados. Contudo os elementos externos que estavam associadas a alguns dos registos (as capas dos livros, imagens, esboços, índices em pdf, etc.), não estavam armazenados na base. Ainda assim foi possível salvaguardar todos esses ficheiros através de uma abordagem complementar à realizada para a conversão.

Foi assim possível salvaguardar um total de ~10,100 ficheiros externos de imagens, texto, etc. e manter a sua associação aos registos bibliográficos.

Foram salvaguardados os seguintes elementos:

Amostra real de capas associadas aos registos bibliográficos

Foi preservado o nome original dos ficheiros existentes no servidor pertencente à biblioteca municiapl e fez-se a sua associação ao registo bibliográfico através dos campos 856 e 859 do formato UNIMARC. Exemplo:

200 1 ^aA psicologia na vida do nosso tempo^fCharlotte Buhler^gtrad. Elsa Meneses de Jesus e Hannelore Eibner Rot 205 ^a5ª ed 215 ^a632, [1] p.^d23 cm ... 606 ^aPsicologia individual 700 1^aBuhler^bCharlotte^f1893-1974 856 ^u6c200375ebc9461b8781d57838fc3b52.pdf^zÍndice 859 ^ud98835a652b1446199c696d2bc59722e.jpg

Base de Leitores

O resultado da conversão dos registos existentes na base de leitores resultou na criação de ~10,500 registos no formato CSV - comma separated values.

As fotos dos leitores estavam armazenadas dentro da base de dados em campos do tipo binário. Foi necessário extrair todas as fotos e atribuir um nome a cada um dos ficheiros e processar a informação de cada foto de maneira a gerar um ficheiro gráfico estruturalmente correto.

Todas as imagens foram extraídas para o formato jpg e foi atribuído o nome ao ficheiro foto-[nº-de-leitor].jpg.

Exemplo: foto-7441.jpg - associada ao leitor nº 7441.

Foram extraídas ~3,500 fotos de leitores.

Resultado da extração das imagens a partir de campos binários na base de dados (desfocada por razões de privacidade)

Conclusão

Dois meses após a entrega do trabalho de conversão...