Machine Learning Aplicado em Séries Temporais em um Sistema de Integração de Dados

Autores

  • João Emmanuel D’Alkmin Neves Universidade Estadual de Campinas https://orcid.org/0000-0002-9472-9753
  • José C. Conti Universidade Estadual de Campinas
  • Andrea R. Casaré Universidade Estadual de Campinas

Palavras-chave:

integração de dados, séries temporais, agrupamento.

Resumo

O processo de integração de dados é um método para extrair dados de diversas fontes, efetuar as devidas transformações, limpezas, normalizações e inserir os dados em tabelas. Esses dados são usados para processos decisórios pelos usuários em diversas áreas do conhecimento. Com o aumento da demanda por informações nos últimos anos, novas soluções estão sendo oferecidas a fim de tornar esse processo mais eficaz. No entanto, há escassez de processos que avaliem rotinas de processamento e as informações contidas nos logs dos processos de integração de dados. Nesse contexto, esse trabalho visa avaliar os dados contidos nas séries temporais desses processos aplicando a tarefa de agrupamento utilizando os algoritmos EM e K-means, que visa agrupar dados de acordo com seu grau de semelhança. Pretende-se com essa abordagem avaliar a eficácia das classes preexistes do processo de integração de dados, propor a criação de novas classes, além de apoiar especialistas no planejamento e dimensionamento de fluxos de processamento.

Biografia do Autor

João Emmanuel D’Alkmin Neves, Universidade Estadual de Campinas

Cursando Doutorado em Tecnologia e Inovação pela Universidade Estadual de Campinas, possui Mestrado em Tecnologia e Inovação pela Universidade Estadual de Campinas (2018). Ex-bolsista do Programa Ciência sem Fronteiras (2013-2014). Tecnólogo em Análise e Desenvolvimento de Sistemas pela FATEC/Americana com Graduação Sanduíche em Computer Science pela SUNY - State University of New York. Possui Graduação em Design Gráfico pela UNIP. Experiência em programação mobile multiplataforma, computação nas nuvens, internet das coisas e business intelligence. Desenvolve atividades de pesquisa sobre sistemas embarcados, arquivística e preservação digital, algoritmos genéticos, inteligência artificial, data mining e machine learning.
Atua como analista desenvolvedor na IBM Brasil.

Downloads

Publicado

2019-08-29

Como Citar

D’ALKMIN NEVES, J. E. .; C. CONTI, J.; R. CASARÉ, A. Machine Learning Aplicado em Séries Temporais em um Sistema de Integração de Dados. Revista Brasileira em Tecnologia da Informação, [S. l.], v. 1, n. 1, p. 35-47, 2019. Disponível em: https://www.fateccampinas.com.br/rbti/index.php/fatec/article/view/14. Acesso em: 27 set. 2020.

Edição

Seção

Artigos