dc.identifier.citation |
Devido ao acúmulo e crescimento constante dos dados que são gerados dentro das empresas, é certo que estes precisam estar corretos, o que nem sempre ocorre devido a vários fatores, gerando informações incorretas, inconsistentes ou até mesmo falsas. Estas anomalias podem ser definidas como dados sujos. Esse trabalho tem como objetivo buscar uma forma de identificá-los e classificá-los para que possam ser higienizados posteriormente. Para atingir este objetivo foi realizado pesquisa na área de mineração de dados e gestão da qualidade de dados, onde foi possível criar uma forma de encontrar e separar os sujos dos corretos. Foi realizado um levantamento dos requisitos que são utilizados para sua inserção. Assim, através destes, criou-se as regras para a análise e classificação. Com isto obteve-se os resultados esperados, sendo possível classificar todos os dados, onde gerou-se uma informação da sua qualidade. Os resultados foram expostos através de planilhas e gráficos, oferecendo aos gestores informações para o acerto ou a implementação de um manual de inserção de dados e assim podendo corrigir os que estiverem incorretos. Palavras-chave: dados sujos, mineração, classificação, Dama Dmbok, qualidade. |
pt_BR |