OpenAlex como fonte de dados para sistemas nacionais de informação científica: a experiência do projeto Laguna

Autores

  • Patricia Neubert UFSC
  • Fábio Canto UFSC
  • Adilson Luiz Pinto UFSC
  • Daniel Lima UnB
  • Flávio Silva IBICT

DOI:

https://doi.org/10.22477/vii.widat.184

Palavras-chave:

fontes de informação científica, sistema de informação científica, Dados abertos, Ciência aberta, OpenAlex

Resumo

Introdução: O OpenAlex é utilizado como uma das principais fontes de dados no Laguna de dados, projeto para a criação de uma Infraestrutura Informacional Aberta para processamento e integração de dados ao sistema de informação científica nacional. Este trabalho apresenta a experiência da equipe do Laguna na extração e no tratamento dos dados do OpenAlex. Metodologia: O processo de extração de dados é realizado mensalmente por meio de download dos dumps públicos disponibilizados pelo OpenAlex. É realizado a carga completa dos dados de cada entidade, que posteriormente são processados e, conforme o caso, cruzados com dados de outras fontes. Para os processamentos mais complexos, são realizados testes com amostras menores, a fim de estimar o tempo de processamento e nível de precisão. Resultados: A integração dos dados do OpenAlex deve observar as particularidades do sistema de informação científica brasileiros, incluindo a diferença de atributos, discrepância entre a cobertura da produção científica e a não equivalência de metadados entre os registros das mesmas entidades em diferentes fontes de dados. Como resultado, este processo requer o estabelecimento de procedimentos sistematizados, como meio de estabelecer uma metodologia para manutenção e atualização do lago de dados, além do desenvolvimento de soluções tecnológicas específicas que auxiliem na resolução das incompatibilidades encontradas. Conclusão: OpenAlex contribui para o mapeamento e relacionamento de entidade, atores e manifestações do sistema de informação científica na web, não substituindo outras ferramentas e/ou fontes sobre a atividades científicas, sendo necessário o cruzamento e compatibilização com dados de outras fontes

Referências

Carvalho Segundo, Washington Luís R. de. Construindo uma Infraestrutura Aberta de Dados de Pesquisa no Brasil. 10 ago. 2022. Disponível em: https://www.arca.fiocruz.br/handle/icict/54762

Carvalho Segundo, Washington Luís R. de. BRCRIS: ecossistema de informação da pesquisa científica brasileira. 2023. Disponível em: https://confap.org.br/news/wp-content/uploads/2023/12/Washington-Segundo-IBICT-F%C3%B3rum-CONFAP-2023.pdf

Codina, Lluís. OpenAlex: ¿una alternativa a Scopus y Web of Science? 2024.

Disponível em: https://www.lluiscodina.com/openalex-scopus/

Culbert, Jack H. et al. Reference Coverage Analysis of OpenAlex compared to Web of Science and Scopus. ArXiv, 2024. Disponível em: https://arxiv.org/pdf/2401.16359.pdf

Equitable Science. About Us. 2024. Disponível em: https://equitablescience.com/

Färber, Michael; et al. SemOpenAlex: The Scientific Landscape in 26 Billion RDF Triples. IN: The Semantic Web – ISWC 2023. DOI: https://link.springer.com/chapter/10.1007/978-3-031-47243-5_6

Lin, Zihang; Yan, Yian; Liu, Lu; Wang, Dashun. SciSciNet: a large-scale open data lake for the science of science research. Scientific Data, 2023. Disponível em: https://doi.org/10.1038/s41597-023-02198-9

OpenAlex. How it works. 2023. Disponível em: https://help.openalex.org/how-it-works

Priem, J., Piwowar, H., & Orr, R. OpenAlex: A fully-open index of scholarly works, authors, venues, institutions, and concepts. ArXiv, 2022. Disponível em: https://arxiv.org/abs/2205.01833.

SemOpenAlex. About. 2024. Disponível em: https://semopenalex.org/resource/semopenalex:UniversalSearch

Vrandečić, D. and Krötzsch, M. Wikidata: a free collaborative knowledgebase. Communications of the ACM, v. 57, n. 10, p. 78-85, 2014. DOI: 10.1145/2629489.

Wikidata. Wikidata Introduction. 30 jan. 2024. Disponível em: https://www.wikidata.org/wiki/Wikidata:Main_Page

Downloads

Publicado

24-06-2024

Como Citar

Neubert, P., Canto, F., Pinto, A. L., Lima, D., & Silva, F. (2024). OpenAlex como fonte de dados para sistemas nacionais de informação científica: a experiência do projeto Laguna. VII Workshop De Informação, Dados E Tecnologia - WIDaT 2024, 7, e184. https://doi.org/10.22477/vii.widat.184