OpenAlex como fonte de dados para sistemas nacionais de informação científica: a experiência do projeto Laguna
DOI:
https://doi.org/10.22477/vii.widat.184Palavras-chave:
fontes de informação científica, sistema de informação científica, Dados abertos, Ciência aberta, OpenAlexResumo
Introdução: O OpenAlex é utilizado como uma das principais fontes de dados no Laguna de dados, projeto para a criação de uma Infraestrutura Informacional Aberta para processamento e integração de dados ao sistema de informação científica nacional. Este trabalho apresenta a experiência da equipe do Laguna na extração e no tratamento dos dados do OpenAlex. Metodologia: O processo de extração de dados é realizado mensalmente por meio de download dos dumps públicos disponibilizados pelo OpenAlex. É realizado a carga completa dos dados de cada entidade, que posteriormente são processados e, conforme o caso, cruzados com dados de outras fontes. Para os processamentos mais complexos, são realizados testes com amostras menores, a fim de estimar o tempo de processamento e nível de precisão. Resultados: A integração dos dados do OpenAlex deve observar as particularidades do sistema de informação científica brasileiros, incluindo a diferença de atributos, discrepância entre a cobertura da produção científica e a não equivalência de metadados entre os registros das mesmas entidades em diferentes fontes de dados. Como resultado, este processo requer o estabelecimento de procedimentos sistematizados, como meio de estabelecer uma metodologia para manutenção e atualização do lago de dados, além do desenvolvimento de soluções tecnológicas específicas que auxiliem na resolução das incompatibilidades encontradas. Conclusão: OpenAlex contribui para o mapeamento e relacionamento de entidade, atores e manifestações do sistema de informação científica na web, não substituindo outras ferramentas e/ou fontes sobre a atividades científicas, sendo necessário o cruzamento e compatibilização com dados de outras fontes
Referências
Carvalho Segundo, Washington Luís R. de. Construindo uma Infraestrutura Aberta de Dados de Pesquisa no Brasil. 10 ago. 2022. Disponível em: https://www.arca.fiocruz.br/handle/icict/54762
Carvalho Segundo, Washington Luís R. de. BRCRIS: ecossistema de informação da pesquisa científica brasileira. 2023. Disponível em: https://confap.org.br/news/wp-content/uploads/2023/12/Washington-Segundo-IBICT-F%C3%B3rum-CONFAP-2023.pdf
Codina, Lluís. OpenAlex: ¿una alternativa a Scopus y Web of Science? 2024.
Disponível em: https://www.lluiscodina.com/openalex-scopus/
Culbert, Jack H. et al. Reference Coverage Analysis of OpenAlex compared to Web of Science and Scopus. ArXiv, 2024. Disponível em: https://arxiv.org/pdf/2401.16359.pdf
Equitable Science. About Us. 2024. Disponível em: https://equitablescience.com/
Färber, Michael; et al. SemOpenAlex: The Scientific Landscape in 26 Billion RDF Triples. IN: The Semantic Web – ISWC 2023. DOI: https://link.springer.com/chapter/10.1007/978-3-031-47243-5_6
Lin, Zihang; Yan, Yian; Liu, Lu; Wang, Dashun. SciSciNet: a large-scale open data lake for the science of science research. Scientific Data, 2023. Disponível em: https://doi.org/10.1038/s41597-023-02198-9
OpenAlex. How it works. 2023. Disponível em: https://help.openalex.org/how-it-works
Priem, J., Piwowar, H., & Orr, R. OpenAlex: A fully-open index of scholarly works, authors, venues, institutions, and concepts. ArXiv, 2022. Disponível em: https://arxiv.org/abs/2205.01833.
SemOpenAlex. About. 2024. Disponível em: https://semopenalex.org/resource/semopenalex:UniversalSearch
Vrandečić, D. and Krötzsch, M. Wikidata: a free collaborative knowledgebase. Communications of the ACM, v. 57, n. 10, p. 78-85, 2014. DOI: 10.1145/2629489.
Wikidata. Wikidata Introduction. 30 jan. 2024. Disponível em: https://www.wikidata.org/wiki/Wikidata:Main_Page
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2024 Patricia Neubert, Fábio Canto, Adilson Luiz Pinto, Daniel Lima, Flávio Silva

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.