Open Data: Encontrando Soluções Reais

O termo “Open Data” tem se tornado cada vez mais comum e ganhado popularidade em muitos países. Em crescente adoção de novas possibilidades, as disponibilizações de dados de governos, por exemplo, têm se tornado excelentes fontes de recursos para a realização de análise de dados, que podem encontrar soluções reais, para problemas reais. Essa é a nossa chance de entender o mundo e contribuir para uma sociedade melhor.

Ao trabalhar com dados abertos, os benefícios são gigantescos. Podemos ajudar a resolver problemas regionais, como por exemplo, definir novas políticas de alocação de médicos em Unidades de Pronto Atendimento (UPA); e até mesmo, problemas globais, como descobrir novas formas de melhorar o cultivo de um determinado alimento na área da agricultura, analisando dados abertos sobre plantio em vários países.

Por causa dos resultados alcançados com a abertura dos dados, eventos como o “Internacional Open Data Conference 2016”, realizado em Madrid, Espanha, tem ganhado cada vez mais força. Mas você sabe o que é Open Data?

O que é Open Data?

Segundo a definição da Open Knowledge Internacional, dados abertos são quando qualquer pessoa pode livremente acessá-los, utilizá-los, modificá-los e compartilhá-los para qualquer finalidade, estando sujeito a, no máximo, as exigências que visem preservar sua proveniência e sua abertura.

Além disso, os dados abertos devem ser pautados em 3 leis:

  1. Se o dado não pode ser encontrado e indexado na Web, ele não existe;
  2. Se não estiver aberto e disponível em formato compreensível por máquina, ele não pode ser reaproveitado, e;
  3. Se algum dispositivo legal não permitir sua replicação, ele não é útil.

Quando se trata de dados abertos governamentais, o banco de dados ainda tem que seguir 8 princípios; que ao meu ver fazem todo sentido, já que as decisões de melhorias para a sociedade serão provavelmente, ou pelo menos deveriam ser pautadas na análise de dados do governo.

Conheça agora os 8 princípios de dados abertos governamentais (podem ser aplicados em dados abertos geral):

  1. Completos: Todos os dados públicos são disponibilizados. Dados são informações eletronicamente gravadas, incluindo, mas não se limitando a, documentos, bancos de dados, transcrições e gravações audiovisuais. Dados públicos são dados que não estão sujeitos a limitações válidas de privacidade, segurança ou controle de acesso, reguladas por estatutos.
  1. Primários: Os dados são publicados na forma coletada na fonte, com a mais fina granularidade possível, e não de forma agregada ou transformada.
  1. Atuais: Os dados são disponibilizados o quão rapidamente seja necessário para preservar seu valor.
  1. Acessíveis: Os dados são disponibilizados para o público mais amplo possível e para os propósitos mais variados possíveis.
  1. Processáveis por máquina: Os dados são razoavelmente estruturados para possibilitar o seu processamento automatizado.
  1. Acesso não discriminatório: Os dados estão disponíveis a todos, sem que seja necessária identificação ou registro.
  1. Formatos não proprietários: Os dados estão disponíveis em um formato sobre o qual nenhum ente tenha controle exclusivo.
  1. Livres de licenças: Os dados não estão sujeitos a regulações de direitos autorais, marcas, patentes ou segredo industrial. Restrições razoáveis de privacidade, segurança e controle de acesso podem ser permitidas na forma regulada por estatutos.

Por que Open Data?

O Open Data é poderoso. A análise de dados abertos contribui, e muito, para que governos possam resolver problemas sociais e melhorar a vida dos cidadãos. De que outra forma conseguiríamos reunir tantos dados sobre a sociedade, as cidades, os transportes, os serviços, em uma cidade, estado ou país?

Com as informações contidas nesses dados é possível ter uma boa noção do que acontece na administração de serviços realizados pelo governo. Podemos identificar necessidades de uma sociedade, melhorar a operação de transportes públicos, ou até mesmo, realizar melhores investimentos em turismo.

Quais são os benefícios do Open Data?

Os dados abertos podem ser usados por qualquer profissional que tenha conhecimento em análise de dados. As utilizações desses dados trazem vantagens para o nosso aprendizado e melhoram o nosso trabalho quando relacionamos os nossos resultados no meio privado com os dados públicos.

Eu trabalho na área da saúde e tenho contato direto com base de dados de utilização de serviços dos clientes, como por exemplo, realização de consultas, exames e cirurgias. Pensando em melhorar minhas análises, eu posso comparar meus indicadores com as estatísticas disponibilizadas no DATASUS; ou até mesmo, analisar e interpretar os dados abertos do Portal da Saúde, e chegar a conclusões, para saber se tenho que melhorar o serviço prestado pela empresa.

Você também pode extrair dados do seu interesse e usá-los para validar modelos de análise, calibrar algoritmos de Machine Learning, entender o comportamento de utilização de um serviço em determinada região, usar dados externos com dados internos (empresa). As possibilidades são muitas.

Acredito que podemos aproveitar a junção de dados abertos e fechados para solucionar problemas reais.

Lembro que quando eu estava na faculdade, uma das coisas que mais me incomodava, era resolver exercícios que não retratavam problemas reais, situações do dia a dia, acontecimentos de mercado, e por aí vai. Gostava muito mais (e ainda gosto) dos livros aplicados a problemas situacionais. Eles me fazem pensar que quando eu tiver que resolver um problema real, possivelmente saberei por onde começar.

Mas quando fiz minha faculdade, o Open Data ainda não era tão difundido assim. Então se eu puder dar uma dica, investa um tempo para conhecer plataformas de dados abertos da sua área ou sobre algo que você tem interesse. Veja o que você pode aprender ou descobrir ao “brincar” com os dados.

Para ajudá-lo, vou citar algumas fontes interessantes, separando por área para facilitar a sua escolha.

Aeroespacial

Dados da NASA: https://data.nasa.gov/

Instituto Nacional de Pesquisas Espaciais – INPE: http://www.inpe.br/

Demografia

Instituto Brasileiro de Geografia e Estatística: http://www.ibge.gov.br/home/

Economia

Instituto de Pesquisa Econômica Aplicada – IPEA: http://www.ipeadata.gov.br/

Dados sobre finanças: https://www.quandl.com/

Finanças

Banco Central do Brasil: https://www3.bcb.gov.br

Dados do Banco Mundial: http://data.worldbank.org/

Governo

Dados do Governo do Brasil: http://dados.gov.br/

Dados do Governo dos EUA: https://www.data.gov/

Dados sobre cidades americanas: https://datasf.org/

Dados do Governo do Canadá: http://open.canada.ca/en

Dados do Governo do Reino Unido: https://data.gov.uk/

Dados da União Europeia: http://data.europa.eu/euodp/en/data

Dados do Censo dos EUA: https://www.census.gov/

Saúde

Departamento de Informática do SUS – DATSASUS: http://datasus.saude.gov.br/

Dados sobre saúde: https://www.healthdata.gov/

Tecnologia

Dados abertos se serviços da Amazon:

Transporte Aéreo

Dados sobre transporte aéreo na Europa:

http://ec.europa.eu/eurostat/statistics-explained/index.php/Air_transport_statistics 

Acredito que com essas fontes você já consegue brincar um pouquinho. Se você já faz isso, deixa nos comentários sua experiência para que outros leitores possam aprender com você.

Abraço e até a próxima!

P.S: As leis e os princípios de dados abertos foram transcritos do Portal Brasileiro de Dados Abertos.


Fontes

Portal Brasileiro de Dados Abertos. “O que são dados abertos? ” Dados.gov.br. Consultado em 22/03/2017. Disponível em http://dados.gov.br/paginas/dados-abertos

Amplie seu conhecimento

International Open Data Conference 2016. “Summary Repot and the Second Action Plan for International Collaboration”. Global Goals | Local Impact: http://od4d.com/roadmap/assets/files/report-iodc-2016-web.pdf

* Acesse os sites citados no texto para analisar a estrutura de dados disponíveis

Material usado

Homem escrevendo: http://bit.ly/2mqLLIH