Workshop Estatística e Análise de Dados com R

Workshop Estatística e Análise de Dados com R | 5, 6, 12, 13, 19 e 20 de abril de 2022 das 18h às 21h
SiteDestaque_Escolas-

Descrição

A presente formação visa fornecer as ferramentas necessárias para que o público-alvo, consiga com recurso ao software R: proceder à importação/exportação de informação presente em diversas plataformas, proceder à realização de análise estatística (uni e multivariada), realizar inferência estatística com recurso a testes de hipóteses paramétricos e não paramétricos, realizar modelação estatística e explorar a componente gráfica do R quer na vertente descritiva quer como suporte à metodologia estatística implementada.

Sendo o R um software que originalmente foi concebido com linhas de comandos, serão explorados plug-ins que traduzem as escolhas efetuadas em diferentes menus para a linguagem de scripts. Será dada particular atenção para as condições de aplicabilidade das várias metodologias estatísticas propostas sendo veiculado os aspetos quantitativos/matemáticos essenciais, assim como uma rigorosa e detalhada interpretação dos outputs. Todos os conteúdos ministrados serão acompanhados por conjuntos de dados fornecidos durante a formação bem como de material pedagógico desenvolvido e concebido para o efeito.

A quem se destina

Estudantes de mestrado e doutoramento, investigadores, docentes que necessitam de realizar análises estatísticas que visam suportar a sua tomada de decisão.

Objetivos

Pretende-se que os formandos, tornem-se progressivamente autónomos na realização de análise de dados com o software R.

Duração: 18 horas

Formador: Ricardo São João (GADES Solutions)

Licenciado em Matemáticas Aplicadas, ramo Estatística e Investigação Operacional e Mestre em Matemática Aplicada às Ciências Biológicas. O interesse pela área da saúde levou-o a concluir a sua pós-graduação em Epidemiologia e o seu PhD em Ciências da Vida na especialidade de Bioestatística. Ricardo São João tem-se dedicado à modelação estatística com um elevado background computacional.

Professor no Ensino Superior desde 2001 ministra cursos graduados, pós-graduados e de curta duração com especial ênfase na manipulação de software estatístico (SPSS e R).

É membro do CEAUL com interesses de investigação em: Estatística Multivariada e Espacial, Bioestatística e Epidemiologia.

Colabora com a GADES Solutions. No âmbito dessa parceria lecionou diversos cursos de Estatística com R e SPSS, tendo também colaborado em diversos projetos de consultoria.

Programa

1. Introdução ao R:

– Descrição do ambiente R e primeiros passos;

– Conceitos básicos para manipulação da informação;

– importação/exportação da informação;

– Armazenamento (tipo de dados e variáveis) e plug-ins do R.

2. Determinação no software R das principais medidas de localização de tendência central e

não central, medidas de dispersão absolutas e adimensionais. Para as referidas medidas serão

abordados dados simples e agrupados.

3. Testes de hipóteses: Paramétricos e Não Paramétricos

– Formulação de hipóteses, Tipologia de Erros, Regra de Decisão;

– Testes de Ajustamento (Kolmogorov Smirnov e Shapiro Wilk);

– Uma Amostra: teste ao valor médio; teste à proporção e teste à variância;

– Duas Amostras Independentes: Teste t-student; Teste de Mann-Whitney; Teste de Welch;

– Duas Amostras Emparelhadas: Teste t-pares; Teste dos Sinais, Teste de Wilcoxon;

– Mais de duas Amostras: Anova e Kruskal Wallis

4. Análise Bivariada.

– Tabelas de Contingência

– Testes de associação para variáveis em escala nominal e ordinal (Qui-Quadrado, Teste Exato de

Fisher) dispostas em tabelas de contingência;

– Medidas de associação (Phi, V de Cramer, Coeficiente de Contingência de Pearson; Tschuprow)

para tabelas de contingência;

– Testes de correlação para variáveis em escala ordinal e de intervalo (Pearson e Spearman)

– Medidas de correlação (paramétrica- coeficiente de Correlação de Pearson e não paramétrica-

Coeficiente de Correlação de Spearman)

5. Análise de regressão linear

– Análise de Regressão Linear Simples

– Análise de Regressão Linear Múltipla

6. Construção de gráficos no software R (por exemplo: gráfico caixa-de-bigodes, caule e folhas,

histograma, barras, circular, dispersão, mosaico, linhas)

7. Análise de Clusters – Introdução e contextualização

– Medidas de Similaridade (distância, correlação e associação)

– Métodos hierárquicos, não hierárquicos e mistos

– Critérios de (des)agregação

– Determinação do número de clusters

– Validação de clusters

Serão utilizadas bases de dados com exemplos diversificados implementados no software R para ilustrar cada um dos modelos em análise. Os formandos serão “desafiados” tendo como base “Estudo de Casos” a darem resposta a diferentes problemas com recurso à metodologia ministrada.

Certificação: No final do workshop, será entregue um certificado GADES Solutions e DGERT aos participantes.

Preço: 150 euros

Data e Horário: 5, 6, 12, 13, 19 e 20 de abril de 2022 das 18h às 21h

Formato: O workshop irá decorrer em formato ONLINE.

Inscrição: Os candidatos deverão candidatar-se até ao dia 29 de março de 2022, através do preenchimento do FORMULÁRIO DE INSCRIÇÃO.

Número limitado de inscrições.

+ informações: mare@ipleiria.pt