Acervos em Cultura, Memória e Patrimônio publicados na Web: relações com as Humanidades Digitais e Ciência de Dados
Ideias de pesquisa
As tecnologias de Dados Abertos Interligados permitiram às instituições de Cultura, Memória e Patrimônio a publicação na Web de seus acervos em formatos processáveis por máquinas, como o RDF. Publicados na Web, com seus objetos digitais acessíveis e identificados através de “links” persistentes, estes acervos ganhavam uma dimensão global, e podem ser “navegados” e recomninados de forma independente dos limites das instituições que detinham seus correspondentes objetos físicos. Acervos como estes podem ser consultados diretamente, como eno portal de dados abertos da Biblioteca Nacional de España, https://datos.bne.es, e mesmo usando a linguagem de consulta de triplas RDF, a SPARQL. Um exemplo é o SPARQL “endpoint” dos museus da Fundação Paul Getty, https://www.openartdata.org/p/queries.html.
Portais como o da BNE e linguagem SPARQL recuperam subconjuntos de registros específicos, que atendam às restrições especificadas na consulta, por exemplo (no Portal da BNE), “Don Quijote de La Mancha Cervantes”; no “endpoint” da Fundação Paul Getty a consulta recupera “Grupos” ou coleções específicas de objetos. No entanto, coleções digitais em Cultura, Memória e Patrimônio são um dos principais insumos para as disciplinas hoje reunidas como Humanidades Digitais (ZENG 2019). Neste caso, coleções inteiras dentro desses arcervos, ou subconjuntos muito grandes dos mesmos, são o interesse principal dos pesquisadores em Humanidades Digitais, que podem explorar estas coleções usando as tecnologias da Ciência de Dados (PADILLA; HIGGINS 2014), (FENLON 2014), (SHAH 2020), (CANDELA et al. 2022) . Além de serem publicadas usando RDF (2014), estas coleções são publicadas também em formatos como CSV, adequado para ser processado usando pelas tecnologias da Ciência de Dados. Exemplos de coleções publicadas por instituições de Cultura, Memória e Patrimônio podem ser encontrados no portal AI4Culture, da Biblioteca Europeana, https://ai4culture.eu/, no RIJKSDATA, portal de dados do RijksMuseum Amsterdan, ttps://www.rijksmuseum.nl/en/research/conduct-research/data e dados das coleções da Tate Galery publicadas no repositório GitHub, https://github.com/tategallery/collection.
Esta última coleção disponibiliza seus dados em formato CSV, facilmente importado por planilhas Excel. Na figura seguinte uma visão parcial dos dados da Tate Galery, de artistas e suas obras, pode ser vista na figura seguinte.

Também são crescentes as exigências e políticas públicas (SLAM; WEBER; TÓTH-CZIFRA 2022) para que objetos destas coleções e os arquivos que os contém atendam aos Princípios FAIR para objetos digitais, https://www.go-fair.org/fair-principles/. Todo este cenário de publicação, compartilhamento e reuso de objetos digitais e coleções em Cultura, Memória e Patrimônio demanda infraestruturas específicas, como repositórios de objetos digitais, atribuidores e resolvedores de identificadores persistentes, portais e bibliotecas digitais, modelos conceituais, vocabulários e ontologias que padronizem descrições e metadados (MARCONDES 2023). No Brasil temos praticamente nada destas infraestruturas. É difícil que toda esta infraestrutura possa ser construida por instituições de Cultura, Memória e Patrimônio individualmente. Terão que ser infraestruturas compartilhadas, objeto de políticas públicas.
Referências
CANDELA, Gustavo; SAÉZ, Maris-Dolóres; ESCOBAR, Pilar; MARCO-SUCH, Manuel. Reusing digital collections from GLAM institutions. Journal of Information Science, v. 48, n. 2, p. 251-267, 2022. Disponível em: https://rua.ua.es/dspace/bitstream/10045/109460/2/Candela_etal_2020_JInfoSci_preprint.pdf. Acesso em: 28 set. 2024.
FENLON, Katrina. Modeling digital humanities collections as research objects. In: 2019 ACM/IEEE Joint Conference on Digital Libraries (JCDL). IEEE, 2019. p. 138-147.Disponível em: https://hcommons.org/deposits/view/hc:24890/CONTENT/fenlon_jcdl2019_researchobjects_final.pdf/. Acesso em: 30 set. 2024.
ISLAM, Sharif; WEBER, Andreas; TÓTH-CZIFRA, Erzsébet. From green deal to cultural heritage: FAIR digital objects and european common data spaces. Research Ideas and Outcomes, v. 8, p. e93815, 2022. Disponível em: https://riojournal.com/article/93815/. Acesso em: 22 ago. 2024.
MARCONDES, Carlos H. The Role of Vocabularies in the Age of Data: The Question of Research Data. KO KNOWLEDGE ORGANIZATION, v. 49, n. 7, p. 467-482, 2023. doi.org/10.5771/0943-7444-2022-7. Disponível em: http://eprints.rclis.org/44301/. Acesso em: 10 mai. 2023.
PADILLA, Thomas G.; HIGGINS, Devin. Library collections as humanities data: The facet effect. Public Services Quarterly, v. 10, n. 4, p. 324-335, 2014. Disponível em: https://thomaspadilla.org/papers/padillahiggins_humdata_postprint.pdf. Acesso em: 29 set. 2024.
RDF 1.1 Primer. W3C, 2014. Disponível em: https://travesia.mcu.es/bitstream/10421/2501/1/RDF%201.pdf. Acesso em: 21 jun. 2017.
SHAH, C. Hands-on Introduction to Data Science. Cambridge: Cambridge University Press., 2020.
ZENG, Marcia Lei. Semantic enrichment for enhancing LAM data and supporting digital humanities. Review article. El profesional de la información, v. 28, n. 1, e280103, 2019. Disponível em: https://doi.org/10.3145/epi.2019.ene.03. Acesso em: 20 set. 2022.
Recent Comments