Descrição
A presente formação visa fornecer as ferramentas necessárias para que o público-alvo, consiga com recurso ao software R: proceder à importação/exportação de informação presente em diversas plataformas, proceder à realização de análise estatística (uni e multivariada), realizar inferência estatística com recurso a testes de hipóteses paramétricos e não paramétricos, realizar modelação estatística e explorar a componente gráfica do R quer na vertente descritiva quer como suporte à metodologia estatística implementada.
Sendo o R um software que originalmente foi concebido com linhas de comandos, serão explorados plug-ins que traduzem as escolhas efetuadas em diferentes menus para a linguagem de scripts. Será dada particular atenção para as condições de aplicabilidade das várias metodologias estatísticas propostas sendo veiculado os aspetos quantitativos/matemáticos essenciais, assim como uma rigorosa e detalhada interpretação dos outputs. Todos os conteúdos ministrados serão acompanhados por conjuntos de dados fornecidos durante a formação bem como de material pedagógico desenvolvido e concebido para o efeito.
A quem se destina
Estudantes de mestrado e doutoramento, investigadores, docentes que necessitam de realizar análises estatísticas que visam suportar a sua tomada de decisão.
Objetivos
Pretende-se que os formandos, tornem-se progressivamente autónomos na realização de análise de dados com o software R.
Duração: 18 horas
Formador: Ricardo São João (GADES Solutions)
Licenciado em Matemáticas Aplicadas, ramo Estatística e Investigação Operacional e Mestre em Matemática Aplicada às Ciências Biológicas. O interesse pela área da saúde levou-o a concluir a sua pós-graduação em Epidemiologia e o seu PhD em Ciências da Vida na especialidade de Bioestatística. Ricardo São João tem-se dedicado à modelação estatística com um elevado background computacional.
Professor no Ensino Superior desde 2001 ministra cursos graduados, pós-graduados e de curta duração com especial ênfase na manipulação de software estatístico (SPSS e R).
É membro do CEAUL com interesses de investigação em: Estatística Multivariada e Espacial, Bioestatística e Epidemiologia.
Colabora com a GADES Solutions. No âmbito dessa parceria lecionou diversos cursos de Estatística com R e SPSS, tendo também colaborado em diversos projetos de consultoria.
Programa
1. Introdução ao R:
– Descrição do ambiente R e primeiros passos;
– Conceitos básicos para manipulação da informação;
– importação/exportação da informação;
– Armazenamento (tipo de dados e variáveis) e plug-ins do R.
2. Determinação no software R das principais medidas de localização de tendência central e
não central, medidas de dispersão absolutas e adimensionais. Para as referidas medidas serão
abordados dados simples e agrupados.
3. Testes de hipóteses: Paramétricos e Não Paramétricos
– Formulação de hipóteses, Tipologia de Erros, Regra de Decisão;
– Testes de Ajustamento (Kolmogorov Smirnov e Shapiro Wilk);
– Uma Amostra: teste ao valor médio; teste à proporção e teste à variância;
– Duas Amostras Independentes: Teste t-student; Teste de Mann-Whitney; Teste de Welch;
– Duas Amostras Emparelhadas: Teste t-pares; Teste dos Sinais, Teste de Wilcoxon;
– Mais de duas Amostras: Anova e Kruskal Wallis
4. Análise Bivariada.
– Tabelas de Contingência
– Testes de associação para variáveis em escala nominal e ordinal (Qui-Quadrado, Teste Exato de
Fisher) dispostas em tabelas de contingência;
– Medidas de associação (Phi, V de Cramer, Coeficiente de Contingência de Pearson; Tschuprow)
para tabelas de contingência;
– Testes de correlação para variáveis em escala ordinal e de intervalo (Pearson e Spearman)
– Medidas de correlação (paramétrica- coeficiente de Correlação de Pearson e não paramétrica-
Coeficiente de Correlação de Spearman)
5. Análise de regressão linear
– Análise de Regressão Linear Simples
– Análise de Regressão Linear Múltipla
6. Construção de gráficos no software R (por exemplo: gráfico caixa-de-bigodes, caule e folhas,
histograma, barras, circular, dispersão, mosaico, linhas)
7. Análise de Clusters – Introdução e contextualização
– Medidas de Similaridade (distância, correlação e associação)
– Métodos hierárquicos, não hierárquicos e mistos
– Critérios de (des)agregação
– Determinação do número de clusters
– Validação de clusters
Serão utilizadas bases de dados com exemplos diversificados implementados no software R para ilustrar cada um dos modelos em análise. Os formandos serão “desafiados” tendo como base “Estudo de Casos” a darem resposta a diferentes problemas com recurso à metodologia ministrada.
Certificação: No final do workshop, será entregue um certificado GADES Solutions e DGERT aos participantes.
Preço: 150 euros
Data e Horário: 5, 6, 12, 13, 19 e 20 de abril de 2022 das 18h às 21h
Formato: O workshop irá decorrer em formato ONLINE.
Inscrição: Os candidatos deverão candidatar-se até ao dia 29 de março de 2022, através do preenchimento do FORMULÁRIO DE INSCRIÇÃO.
Número limitado de inscrições.
+ informações: mare@ipleiria.pt