Dados

Dados

A iniciativa de Dados Abertos (Open Data) busca permitir o acesso aos conjuntos de dados que relacionados a pesquisas científicas ou tecnológicas.

Dados abertos são dados que podem ser usados livremente, reutilizados e redistribuídos por qualquer um.

Nesta parte do portal são apresentadas ferramentas associadas a esta iniciativa, que permite desde a coleta de dados até a sua visualização e interpretação.

rOpenSci

O rOpenSci é um conjunto de pacotes de software associados ao R Project for Statistical Computing, uma plataforma aberta voltada a computação de estatísticas e gráficos a partir de dados armazenados em repositórios.

Os pacotes de dados permitem o acesso, interação, visualização e compartilhamento de dados.

Maiores informações:

https://ropensci.org/

Sci2

O Sci2 (Science of Science) é um conjunto de ferramentas modular projetado para o estudo da ciência. Ele oferece análises e visualizações temporais, geoespaciais, de tópicos e de rede sobre conjuntos de dados acadêmicos.

As ferramentas podem atuar em níveis micro/individual, meso/local e macro/global.

Maiores informações:

https://sci2.cns.iu.edu/user/index.php

Integrated Publishing Toolkit

O Integrated Publishing Toolkit é uma ferramenta open-source voltada a publicação e compartilhamento de dados sobre biodiversidade. Voltado a interoperabilidade, utiliza a rede Global Biodiversity Information Facility (GBIF) e formatos de matadados baseados no Darwin Core e Ecological Metadata Language.

A ferramenta permite internacionalização, segurança de dados e é compatível com grandes bases de dados e integra-se com a agência DataCite para atribuição automática de DOI. No Brasil é implementado no Sistema de Informação sobre a Biodiversidade Brasileira (http://sibbr.gov.br/).

Maiores informações:

https://www.gbif.org/ipt

Jupyter Notebook

Jupyter Notebooks são uma implementação do conceito de Science Notebooks, que agregam ao artigo científico a possibilidade de incorporar códigos de máquina que manipulam dados, permitindo ao pesquisador ou leitor do documento aplicar novos parâmetros nas análises apresentadas.

Maiores informações:

http://jupyter.org/

Pentaho

O Pentaho “Conjunto de ferramentas de relatório de código aberto que permite a criação de relatórios relacionais e analíticos a partir de uma ampla variedade de fontes de dados.”

Ele atua em conjunto com outros software como:

  • Mondrian: Servidor de processamento analítico online (OLAP). Permite que os usuários de negócios analisem grandes e complexas quantidades de dados em tempo real.
  • Kettle: A Integração de Dados (ou Kettle) oferece poderosos recursos de Extração, Transformação e Carregamento (ETL), usando uma abordagem inovadora orientada a metadados.
  • Weka: Conjunto abrangente de ferramentas para aprendizado de máquina e mineração de dados para aprimorar suas percepções por meio de análise preditiva.

Maiores informações:

https://community.hitachivantara.com/s/pentaho