Censo

O seguinte exercício faz uso de um conjunto de dados extraído do site UCI Machine Learning Repository, chamado adult. O objetivo principal deste conjunto de dados é predizer, com base em informações como sexo, etnia, profissão, nacionalidade, etc, qual o salário bruto anual das pessoas. Cada linha é um indivíduo, e a última coluna é o atributo “classe” (o atributo que deseja-se adivinhar).

Faça download da tabela adult, que já passou por um pré-processamento. Após, abra-a no Power BI e faça as seguintes tarefas:

  • Substituir valores faltantes usando um média (para colunas numéricas) ou moda (para colunas categóricas)

  • Remover colunas que não serão utilizadas na visualização (e.g. fnlwgt)

  • Substituir nomes de valores por descrição mais legível (e.g. State-gov)