Please use this identifier to cite or link to this item: http://hdl.handle.net/11328/1373
Title: Para uma biblioteca do conhecimento: Aplicações da Web semântica à organização da informação em catálogos de acesso público.
Authors: Nunes, Manuela Barreto, orientador científico
Andrade, António Manuel, orientador científico
Afonso, Maria Gorete Barroso
Keywords: Web semântica
Web OPAC
Recuperação da informação
Organização do conhecimento
Ontologias
Semantic web
Web OPACs
Information retrieval
Knowledge organization
Ontologies
Issue Date: May-2015
Publisher: Universidade Portucalense
Citation: Afonso, M. G. B. (2015). Para uma biblioteca do conhecimento: Aplicações da Web semântica à organização da informação em catálogos de acesso público. (Tese de Doutoramento), Universidade Portucalense, Porto. Disponível no Repositório UPT: http://hdl.handle.net/11328/1373.
Abstract: A recuperação da informação contida nos Web OPAC (Online public access catalog) das bibliotecas enfrenta sérias limitações provocadas pelas características próprias dos instrumentos de organização e recuperação utilizados. Índices, thesauri e classificações tradicionalmente aplicados aos registos catalográficos apenas permitem recuperar o conteúdo bibliográfico ou documental existente, alheando-se da possibilidade de que essa recuperação possibilite, desde logo, um acesso a conhecimento expandido através das mesmas palavras-chave escolhidas para a pesquisa num dado catálogo. No entanto, a Web semântica permite a transformação destes modelos de acesso ao conhecimento em modelos de ontologias de nível superior. Surge assim a questão que leva ao desenvolvimento da presente tese de doutoramento, e que procura, em primeiro lugar, indagar sobre os mecanismos de representação do conhecimento mais adequados às bibliotecas públicas e, subsequentemente, sobre a possibilidade de desenvolver um produto específico aplicável a uma biblioteca pública em concreto. Apresentando como objetivo final o desenvolvimento de um produto tecnológico com as caraterísticas acima apontadas, a investigação aplicou uma metodologia de design science que levou à concretização de um protótipo aplicado e testado preliminarmente no catálogo do Fundo Local da Biblioteca Municipal de Montalegre. A metodologia adotada, cíclica e interativa, envolveu a cooperação interdisciplinar entre os campos da Ciência da Informação, da Informática e Computação e da Educação. O desenvolvimento do protótipo permitiu, numa primeira fase, transformar a informação encerrada no catálogo em linha da Rede Concelhia de Bibliotecas de Montalegre (RCBM) e cruzar devidamente essa informação com outras fontes, como por exemplo a DBpedia, num formato adequado à Web semântica, representado por triplos RDF (Resource Description Framework) que estabelecem relações definidas em ontologias, entre os recursos oriundos de diferentes fontes. Numa segunda fase, esses dados abertos e ligados, com identificadores únicos e universais (URIs), ficaram disponíveis para exploração a partir de uma plataforma de código aberto CKAN (Comprehensive Knowledge Archive Network) usada para o efeito; esta plataforma permite que um fluxo de Título: Para uma biblioteca do conhecimento: Apl icações da Web semânt ica à organização da informação em catálogos de acesso públ ico transformação em conhecimento fique disponível para ser explorado e apropriado por terceiros. Os resultados demonstraram as potencialidades do protótipo, tendo sido comprovada uma representação adequada através de um pequeno conjunto de pesquisas SPARQL (Protocol and RDF Query Language) que cruzam os dados do catálogo (em RDF) com os dados da DBpedia. Assim, uma pesquisa no OPAC sobre um determinado autor, permite aceder, não só às obras desse mesmo autor detidas ou acessíveis através da biblioteca, mas também a um conjunto de informação biobibliográfica, estudos, representações de imagens, etc., disponível na Internet e que concretiza o objetivo de expandir o conhecimento do utilizador através de uma simples pesquisa num catálogo. Todo o trabalho está documentado e é facilmente replicável por qualquer outra biblioteca que tenha um catálogo num formato da família MARC (Machine Readable Cataloging). Conclui-se pois que, não só a Web semântica permite tornar mais eficazes os serviços de recuperação da informação das bibliotecas, como essa possibilidade é replicável e possibilita uma maior cooperação em rede entre bibliotecas de uma mesma região, ou até nacionais e internacionais.
The retrieval of information contained in web OPACs (Online public access catalog) libraries face serious limitations caused by the characteristics of the organization and retrieval tools used. Indexes, thesauri and classifications traditionally applied to cataloging registers only enable to recover the existing bibliographic or documentary content, alienating the possibility that this recovery enable, firstly, access to expanded knowledge through the same keywords chosen for research in a given catalog. However, the semantic web allows the transformation of these access models to knowledge in models of top-level ontologies. This raises the question that leads to the development of this PhD thesis, and seeking, first, to inquire into the knowledge representation mechanisms best suited to public libraries and, subsequently, on the possibility of developing a specific product applicable to a public library in concrete. Featuring the ultimate goal the development of a technological product with the features outlined above, research applied a design science methodology that led to the realization of a prototype tested preliminarily on Local Fund catalog of Montalegre Municipal Library. The methodology adopted, cyclical and interactive, involved the interdisciplinary cooperation between the fields of Information, Informatics and Computer Science and Education. The development of the prototype allowed, initially, the transformation of the information contained in the OPAC Web of District Council Library Network of Montalegre and properly cross with other sources, such as DBpedia, in an appropriate format to the semantic web, represented by triples RDF (Resource Description Framework) establishing relationships defined in ontologies, between resources from different sources. Therefore, these open and linked data with unique and universal identifiers (Uniform Resource Identifier - URIs), would be available for exploitation from an open-source platform CKAN (Comprehensive Knowledge Archive Network) used for this purpose; this platform enable that a flow of transformation into knowledge became available to be explored and appropriated by others. The results demonstrated the potential of the prototype, with adequate representation been proven through a small set of SPARQL (Protocol and RDF Query Language) research that intersect catalog data (RDF) with data from DBpedia. Thus, a search on OPAC about a particular author, allows access not only to the works of the same author detained or accessible by the library, but also to a set of biobibliographic information, studies, image representations, etc., available on the Internet and concretize the objective of expanding the knowledge of the user through a simple search in a catalog. All work is documented and is easily replicable in any other library that has a catalog in a MARC (Machine Readable Cataloging) family format. It is therefore concluded that, not only the semantic web allows increase the effectiveness of information retrieval services of libraries, as this possibility is replicable and enables greater network cooperation between libraries in the same region, or even national and international.
Description: Tese de Doutoramento em Educação na Área de Especialização em Educação e Bibliotecas.
URI: http://hdl.handle.net/11328/1373
Appears in Collections:INPP - Teses de Doutoramento / PhD Thesis

Files in This Item:
File Description SizeFormat 
TDE 41.pdf5.33 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.