Ferramentas do usuário

Ferramentas do site


aed

Atividades do Aprendizado

  1. Subdivisão: Dados de treino de testes.
  2. Escolha de algoritmos
  3. Treinamento
  4. Avaliação e teste

Interação do aprendizado cíclico

Realizar nova avaliação → Modificar os dados → Alterar os Parâmetros → Realizar novos testes

Descrição de Padrões

Tendência Central

  1. Média
  2. Mediana
  3. Moda

Dispersão ou disseminação de dados

  1. Faixa
  2. Mínimo
  3. Máximo
  4. Quartis
  5. Variância
  6. Desvio-padrão

Outros

  1. Tabela de distribuição de frequência
  2. Histograma
  3. Gráfico de pizza
  4. Polígonos de frequência
  5. Gráficos de barras

Valores Ausentes

  1. Recorrer ao processo que ela é gerada e tentar recupera-la
  2. Imputation - alterar um valor ausente por um substituto, exitem técnicas:
    1. Educated Guessing - deduz o valor de acordo com o padrão dos dados - Não muito utilizada
    2. Average Imputation - utiliza-se o valor médio da coluna (para dados numéricos) e atribui esse valor para os campos ausentes.
    3. Common point Imputation - Utiliza-se o valor mais comum da coluna e insere aos campos vazios.
    4. Regression Substitution - Cria-se um modelo de regressão múltiplo para estimar valores ausentes.
    5. Multiple Imputation - Estende o conceito de regressão com a identificação de correlações com os dados ausentes.

Normalização de Valores

Deixar todos os conjuntos de dados em uma escala comum, sem distorcer as diferenças no intervalo de valores, ou seja, transformar um conjunto de dados que estão em diferentes grandezas e escalas em um conjunto de dados padronizados.

Outliers

Tratamento de outliers

É um valor atípico, que apresenta um grande afastamento dos valores da série, ou que é inconsistente, ou seja, identificar registros fora do comum e analisá-los de acordo com o interesse.

É um estratégia para melhorar ou adequar o conjunto de dados obtidos.

Os resultados de um pesquisa podem ser fortemente comprometidos devido ao fato de pessoas se sentirem constrangidas e não querem responder determinadas questões.

Técnicas para preencher informações faltantes:

  1. Descartar a pessoa/dado que tenha pelo menos uma variável faltante.
  2. Preencher o dado faltante utilizando técnicas de imputação de dados (como já citadas).

Sites para dados públicos brasileiros

aed.txt · Última modificação: 2024/07/07 12:39 por jdos

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki