Em um dos meus últimos posts, eu comentei que escreveria uma série de 6 matérias para quem estivesse interessado em se aprofundar mais nos conceitos de Big Data e Ciência de Dados. Resolvi falar sobre os temas por 3 motivos:
- Uma palestra que eu fiz sobre “O Estatístico do Futuro“, para comemorar o dia do estatístico, na UFMG.
- O crescimento exponencial de e-mails, mensagens, tweets e comentários que eu recebo perguntando pelo assunto.
- E a proximidade do início de excelentes cursos para “Formação de Cientista de Dados” oferecidos pela Data Science Academy.
Além desses 3 tópicos, devemos assumir o aumento absurdo de dados que nós analisamos diariamente. Eu posso afirmar, sem medo, que a quantidade de dados que eu analiso hoje, é no mínimo 20 vezes maior do que eu analisava 5 anos atrás. E vem aumentando cada vez mais rápido. Por isso eu acredito, que devemos aprender novas ferramentas e técnicas, que nos auxiliem a encontrar as melhores soluções para os problemas que enfrentamos.
Extrair valor de um imenso volume de dados é o principal desafio enfrentado por empresas. E o volume de dados gerados por pessoas e empresas está cada vez maior. Pensando nessa temática, eu vou comentar ao longo dos próximos 6 posts, cada um dos 6 cursos oferecidos pela Data Science Academy.
Na minha opinião, vou dizer por que acredito ser importante fazer o curso; o que você vai aprender; e onde poderá aplicar esses conhecimentos. E para começar, vamos falar sobre “Big Data Analytics com R e Microsoft Azure Machine Learning”.
Por que fazer?
Se você é apaixonado por analisar dados, esse é o curso certo para você. Com o aumento no volume de dados disponíveis para serem analisados, faz-se necessário a utilização de ferramentas sofisticadas para dar significado a essa quantidade inacreditável de dados – conhecida por todos como Big Data.
A possibilidade de aumentar ainda mais sua empregabilidade, e fazer parte de um grupo pequeno de profissionais, que timidamente vem se informando sobre o assunto, por si só já é um motivo forte. Segundo a McKinsey, empresa americana, e líder mundial no mercado de consultoria empresarial, estima-se que somente nos Estados Unidos até 2018, haverá um déficit de 190 mil pessoas capacitadas para suprir essa demanda.
Não há profissionais suficientes para atender o mercado mundial. E muitas empresas já cogitam treinar seus próprios funcionários.
Além da alta demanda, a Linguagem R é uma das principais ferramentas utilizadas por Cientistas de Dados, e tem ajudado empresas como Oracle, Microsoft e IBM a encontrarem soluções de Data Science.
O Microsoft Azure Machine Learning permite criar modelos de aprendizagem de forma simples e visual, tal como: recomendações, análise de sentimento, detecção de fraudes, e previsões.
Com o conhecimento em Big Data, Linguagem R, Azure Machine Learning e Analytics (habilidade de utilizar dados, análises estatísticas e raciocínio sistemático para tomada de decisão), você terá em suas mãos uma ferramenta poderosa de Big Data Analytics.
O que eu vou aprender?
Você vai adquirir conhecimentos na linguagem R, que vão do básico ao intermediário-avançado. Conceitos de utilização das funções lapply, sapply, tapply, mapply, do.call, e várias outras. Vai aprender a manipular grandes arquivos de diversos formatos (.txt, .csv, .json, .xml, .xls). Mesmo que você já saiba de tudo isso, o curso terá uma visão voltada para o Cientista de Dados, e a perspectiva é diferente, quando você visualiza os conhecimentos pensando exclusivamente como estatístico.
Depois que aprender a importar e manipular dados, você vai realizar análises estatísticas nesse conjunto imenso de dados. Aplicará conhecimentos de Regressão; realizará Testes de Significância; encontrará Distribuições, e executará Bootstrapping, bem como, planejamento de ANOVA; dentre várias outras coisas.
Aprendendo o Microsoft Azure Machine Learning, você assimilará conceitos de Machine Learning ou Aprendizado de Máquina. Conceitos que não são ensinados em um curso de graduação em estatística.
De forma simples, Machine Learning é um conjunto de regras e procedimentos, que permitem que computadores possam tomar decisões baseadas em dados, ao invés de serem programados para realizar tarefas específicas. Para que as regras sejam definidas, as técnicas estatísticas se fazem presente, e são imprescindíveis.
Onde posso aplicar?
Com essa ferramenta poderosa nas mãos, você será capaz de analisar um volume inacreditável de dados, e gerar soluções memoráveis para as empresas que você trabalha, ou até mesmo para você e seu cliente.
Alguns exemplos de aplicações:
- Previsão de ocorrência do câncer;
- Previsão de despesas hospitalares;
- Previsão de faturamento de uma rede de restaurantes;
- Previsão de consumo de energia elétrica nos próximos anos.
Em conjunto, essas ferramentas possuem um poder altíssimo. As aplicações são diversas, e você pode confirmar o que eu disse, adquirindo conhecimento, e aplicando no seu dia a dia.
P.S: Se você se interessou pelo curso, como eu me interessei, não perca tempo, e acesse o site da Data Science Academy para maiores informações. Esse curso específico começa dia 4 de julho.
Material usado
Imagem do Big Data Analytics: http://bit.ly/21t7Xwf
Imagem da tela do Microsoft Azure Machine Learning: http://mnc.ms/23kyMDv
Siga-nos nas redes sociais
Facebook: https://www.facebook.com/oestatistico
Twitter:
Instagram:
Pinterest: