18° Seminário de Iniciação Científica

De 21/10/2013 à 25/10/2013

Desenvolvimento de uma ferramenta para mineração de dados em bancos de dados relacionais de código aberto e livre.

Universidade da Região de Joinville, UNIVILLE, Joinville

Palavras-chave: Mineração, dados, relacionais

A Mineração de Dados é um dos principais temas de pesquisa dentro da Computação devido não somente a suas diversas aplicações, mas também por envolver diversas áreas do conhecimento como estatística e inteligência artificial. A mineração de dados tem por objetivo descobrir conhecimento analisando grandes volumes de dados históricos. O objetivo deste projeto está relacionado a simplificar o processo de mineração, desenvolvendo uma nova ferramenta, utilizando os conceitos de software livre e aberto, para que de forma simplificada, seja possível analisar os dados. Para o desenvolvimento do projeto foi escolhida a metodologia SCRUM. A primeira Sprint planejada teve como objetivo o desenvolvimento de um protótipo do algoritmo de regra de associação com base na linguagem T-SQL utilizando o banco de dados relacional como ferramenta e ambiente de desenvolvimento. A segunda Sprint foi planejada para a evolução do protótipo desenvolvido na primeira, integrando o algoritmo desenvolvido em T-SQL a uma interface desenvolvida na linguagem C#.net. O resultado da pesquisa realizada na literatura indica que existem ferramentas de código livre e aberto para a mineração de dados, porém, elas não possuem uma grande flexibilidade de comunicação com bancos de dados relacionais. Desta forma justifica a pesquisa que estamos realizando para o desenvolvimento de uma nova ferramenta para mineração de dados. Foi possível concluir também que o primeiro algoritmo de mineração a ser desenvolvido para validar a proposta deste projeto é a tarefa de regra de associação, pois este algoritmo em comparação com os demais, é o de menor complexidade algorítmica e cuja validação dos resultados pode ser facilmente verificada. Após a realização das duas sprints foi possível o desenvolvimento do protótipo da ferramenta de mineração dados com o algoritmo de regra de associação. Esta ferramenta é capaz de conectar-se a qualquer banco relacional que possua um driver de conexão para a plataforma .net e através da execução de instruções em transactional SQL foi possível o cálculo dos valores de confiança e de suporte para as regras encontradas pela ferramenta. A validação foi feita sobre um banco de dados modelo que simula os dados sobre as vendas de um comércio de material esportivo. Foram analisadas as regras de associação sobre os itens vendidos da loja, para definir quais itens tinham maior chance de serem vendidos de forma agrupada. Os resultados mostraram que o algoritmo desenvolvido conseguiu encontrar as principais associações dentro dos parâmetros de suporte e confiança definidos.

ISSN: 1807-5754