Sistemas de Indexação automática por atribuição: uma análise comparativa

AutorSâmela Rouse de Brito Silva, Renato Fernandes Correa
CargoBiblioteca Central, Universidade Federal de Alagoas, Maceió, Brasil ssamela.brito@hotmail.com https://orcid.org/0000-0002-9694-2187 / Departamento de Ciência da Informação, Universidade Federal de Pernambuco, Recife, Brasil renato.correa@ufpe.br https://orcid.org/0000-0002-9880-8678
Páginas1-25
Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, Florianópolis, v. 25, p. 01-15, 2020.
Universidade Federal de Santa Catarina. ISSN 1518-2924. DOI: https://doi.org/10.5007/1518-2924.2020.e70740
Artigo
Original
SISTEMAS DE INDEXAÇÃO AUTOMÁTICA
POR ATRIBUIÇÃO: uma análise comparativa
Systems for automatic indexing by assignment: a comparative analysis
Sâmela Rouse de Brito SILVA
Biblioteca Central, Universidade Federal de Alagoas, Maceió, Brasil
ssamela.brito@hotmail.com
https://orcid.org/0000-0002-9694-2187
Renato Fernandes CORREA
Departamento de Ciência da Informação,
Universidade Federal de Pernambuco, Recife, Brasil
renato.correa@ufpe.br
https://orcid.org/0000-0002-9880-8678
A lista completa com informações dos autores está no final do artigo
RESUMO
Objetivo: Analisa comparativamente dois sistemas de indexação automática po r atribuição multilíngue: SISA e MAUI. O
SISA (Sistema de Indexação Semiautomático) foi desenvolvido na Espanha, sendo inicialmente proposto para a área de
Biblioteconomia e Documentação. Trata-se de um sistema especialista que indexa de forma automática seguindo um
tesauro e regras predeterminadas de indexação com base na frequência e posição dos termos. O MAUI (Multi-purpose
Automatic Topic Indexing) é um sistema de origem neozelandesa que apresenta a especificidade de utilização de um
tesauro e algoritmo de aprendizagem de máquina para gerar modelo a partir de resultados da indexação intelectual,
sendo os termos representados por características estatísticas.
Método: A pesquisa se classifica como exploratória e bibliográfica, onde o método utilizado para construção deste
trabalho foi o estudo comparativo baseado na análise de conteúdo das publicações científicas contendo rel atos de
experiência na aplicação dos sistemas. As etapas da pesquisa consistiram em descrever e comparar as características
de cada sistema, levantando informações acerca de como são processados os doc umentos, como é feita a extração e
seleção dos termos que resulta nos descritores propostos por cada sistema, e contextos de aplicação.
Resultado: Como resultados aponta-se as abordagens, as principais operações, os recursos utilizados por cada
sistema durante o processamento da indexação automática, bem como os contextos de uso e qualidade alcançada nos
resultados.
Conclusões: O trabalho contribui para os estudos na temática indexação automática no aprofundamento da discussão
sobre características descritivas e comparativas associadas aos métodos e técnicas implementadas nos sistemas
analisados.
PALAVRAS-CHAVE: Indexação Automática. Indexação Automática por Atribuição. Sistema de Indexação Automática.
Processamento de Linguagem Natural. Recuperação da Informação.
ABSTRACT
Objective: This work presents a comparative analysis between two multilingual automatic indexing systems that perform
term assignment: SISA and MAUI. The SISA (Semi-automatic Indexing System ) made in Spain and i nitially proposed for
the area of Librarianship and Documentation, it is a specialist system that automatically indexes following a thesaurus
and predetermined rules of indexation which are based on the frequency and position of the terms. The MAUI (Multi-
purpose Automatic Topic Indexing) is a system of New Zealand origin that presents the specificity of use of a thesaurus
and algorithm of machine learning to generate model through the results of the intellectual indexing, being the terms
represented by statistical features.
Methods: The research is exploratory and bibliographical, where the method used to construct this work was the
comparative study based on conte nt analysis of the scientific publications containing experience repo rts of application of
that software. The stages of the research consisted of describing and comparing the characteristics of each system,
raising information about how the documents are processed, how the systems performs th e extraction and selection of
the descriptors terms, and the application context.
Results: The results sho w the approaches, main operations, the resources used by each system during the automatic
indexing process, as well as the application context and quality of results.
Conclusions: It hopes to contribute to the studies on the topic of automatic indexing in the deepening discussion about
descriptive and comparative categories related to methods and techniques implemented in the systems.
KEYWORDS: Automatic Indexing. Automatic Indexing by Assignment. Automatic Indexing Systems. Natural Language
Processing. Information retrieval.
Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, Florianópolis, v. 25, p. 01-15, 2020.
Universidade Federal de Santa Catarina. ISSN 1518-2924. DOI: https://doi.org/10.5007/1518-2924.2020.e70740
2
1 INTRODUÇÃO
Com o avanço da ciência e da tecnologia, um volume crescente de publicações é
gerado pela comunidade acadêmica em diversos domínios e rapidamente disseminado
através da Web.
Neste contexto, visando que os pesquisadores consigam encontrar publicações
relevantes para fins de pesquisa, o processo de indexação de tais documentos se
constitui como o fator primordial para alcance de qualidade na recuperação da informação
(GIL LEIVA, 2009) e consequente sucesso de qualquer mecanismo de busca ou base de
dados científica.
O uso da tecnologia no processo de indexação tem sido bastante discutido na área
da Ciência da informação. Isto pode ser explicado pela necessidade de se automatizar o
processo de indexação diante da rapidez exigida aos profissionais indexadores na análise
de cada documento.
Em suas pesquisas, Lancaster (2004) e Moreiro González (2004) acreditam que a
indexação automatizada pode contribuir consideravelmente em torno das tarefas do
indexador ao maximizar seu tempo de trabalho nas diversas unidades informacionais
existentes.
Os sistemas de indexação automática realizam a indexação mediante atividade de
análise do texto do documento por um sistema computacional, sem que haja uma
interferência humana, isto é, os termos de indexação são definidos apenas pela análise
realizada pelo software (LEIVA, 1999). Entretanto, para que se alcance uma melhor
qualidade no processo de indexação, acredita-se que seja necessária a intervenção do
indexador na avaliação e posterior validação dos termos propostos por tais sistemas para
os documentos (NARUKAWA; GIL LEIVA; FUJITA, 2009).
A indexação automática pode ser por extração ou por atribuição. A indexação
automática por extração, denominada em (LANCASTER, 2004) como indexação por
extração automática, consiste em extrair do texto do documento termos e depois ponderar
e selecionar os termos mais relevantes. A indexação automática por atribuição é
denominada em (LANCASTER, 2004) como indexação por extração automática, e
consiste em associar a termos autorizados de um vocabulário controlado um perfil
formado por um conjunto de termos alternativos ou expressões equivalentes que ocorrem

Para continuar a ler

PEÇA SUA AVALIAÇÃO

VLEX uses login cookies to provide you with a better browsing experience. If you click on 'Accept' or continue browsing this site we consider that you accept our cookie policy. ACCEPT