Censo¶
O seguinte exercício faz uso de um conjunto de dados extraído do site UCI Machine Learning Repository, chamado adult. O objetivo principal deste conjunto de dados é predizer, com base em informações como sexo, etnia, profissão, nacionalidade, etc, qual o salário bruto anual das pessoas. Cada linha é um indivíduo, e a última coluna é o atributo “classe” (o atributo que deseja-se adivinhar).
Faça download da tabela adult, que já passou por um pré-processamento. Após, abra-a no Power BI e faça as seguintes tarefas:
Substituir valores faltantes usando um média (para colunas numéricas) ou moda (para colunas categóricas)
Remover colunas que não serão utilizadas na visualização (e.g. fnlwgt)
Substituir nomes de valores por descrição mais legível (e.g. State-gov)