Portal IFNMG - Professor e egressa do IFNMG têm trabalhos premiados no Simpósio Brasileiro de Bancos de Dados Ir direto para menu de acessibilidade.
Portal do Governo Brasileiro
ptenfrdeites
Início do conteúdo da página

Professor e egressa do IFNMG têm trabalhos premiados no Simpósio Brasileiro de Bancos de Dados

Publicado: Terça, 13 de Outubro de 2020, 09h30 | Última atualização em Terça, 13 de Outubro de 2020, 09h35

LucioO IFNMG está representado em dois dos trabalhos destacados durante o Simpósio Brasileiro de Bancos de Dados (SBBD) 2020, que terminou no início deste mês de outubro. O artigo “Criteria for choosing the number of dimensions in a principal component analysis: An empirical assessment”, que tem o coordenador do curso de Ciência da Computação do Campus Montes Claros, Lúcio Fernandes Dutra Santos, como um dos autores, foi agraciado com o Prêmio Melhor Artigo Curto. O professor Lúcio também é um dos autores do trabalho agraciado com a menção honrosa na categoria Artigo Completo, “Quality metrics for diversified similarity searching: What they stand for?”, que tem como primeira autora Camila Rocha Lopes, egressa do curso de Ciência da Computação.

Lúcio explica, em linhas gerais, do que trata o artigo premiado, cujo título em português é “Critérios para escolha do número de dimensões na análise de componentes principais: Uma avaliação experimental”. Inicialmente, ele esclarece que, na realização de tarefas de análises de dados por meio de técnicas de aprendizado de máquina, é necessário que um problema em questão seja representado por meio de variáveis de análises. Para ficar mais claro, ele exemplifica com a situação de uma pessoa que quer classificar a qualidade de uma safra de vinhos, tendo disponível algumas variáveis coletadas por meio de análise química de acidez, alcalinidade, intensidade da cor, prolina, porcentagem de flavanoídes, teores de fenóis totais, dentre várias outras.

“Quando você tenta realizar a análise de um problema e ele possui muitas variáveis, algumas delas podem ser mais importantes do que outras, e o método PCA (Principal Component Analysis, em português Análise de Componentes Principais) ajuda a encontrar tais variáveis importantes. Contudo, além de saber quais são as mais importantes, ainda é necessário saber quantas são realmente importantes e outras que não são tão fundamentais”, afirma Lúcio. O estudo de que trata o artigo premiado “discute os critérios que podem ser utilizados na escolha do número de variáveis que são importantes num dado problema no mundo real, sendo um guia sobre como realizar a escolha de variáveis em problemas com muitas dimensões”. E ele volta ao exemplo da safra de vinhos: “o nosso estudo indica quais e quantas variáveis devem ser utilizadas para que possamos classificar corretamente a qualidade dos vinhos”.

Os demais autores do artigo são Renata B. Silva, Daniel de Oliveira, Rodrigo E. Wilson e Marcos Bedo, da Universidade Federal Fluminense (UFF); e Davi P. Santos, do Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (ICMC/USP). O trabalho foi desenvolvido no grupo Anoti (Análise Numérica, Otimização e Tecnologia da Informação), do Instituto do Noroeste Fluminense de Educação Superior da UFF (campus do interior), em que o professor Lúcio atua como colaborador nos projetos de pesquisa em desenvolvimento. Em particular, a parceria entre o IFNMG e UFF viabilizou que trabalhos na linha de pesquisa de análise de dados e consultas por similaridade diversificada possam ser realizados em instituições localizadas no interior de Minas Gerais e do Rio de Janeiro, sendo que os projetos de pesquisas foram registrados em ambas as instituições.

Consultas por similaridade com diversidade

CamilaEm português, o artigo da ex-aluna Camila Lopes é “Métricas para avaliar consultas por similaridade com diversidade. O que elas representam?”. O trabalho traz os resultados do projeto de iniciação científica “Avaliando consultas por similaridade com diversidade por meio de índices de validação de agrupamento de dados”, do qual ela participou em 2019. O trabalho de conclusão de curso (TCC) apresentado pela ex-aluna do IFNMG também versou sobre a mesma temática. Tanto na iniciação científica quanto no TCC, Camila foi orientada pelo professor Lúcio.

“Nós identificamos que, apesar de existirem muitos algoritmos para consultas por similaridade com diversidade, as métricas para avaliar a qualidade dos resultados eram ainda incipientes, algumas apresentavam viés ou utilizavam algoritmos custosos para comparação”, relata Camila. Diante disso, foi proposto um novo modelo métrico multidimensional, o Diversity Features Model (DFM), que combina os resultados de diferentes medidas que competem entre si.

Camila explca que “os resultados experimentais do trabalho compararam as métricas atuais da literatura com as métricas propostas, e também apontaram que o DFM permitiu suavizar vieses individuais de métricas diferentes, combinando essas medidas por meio de visualização de dados em mapas de coordenadas paralelas, ou por meio de agregação de rankings que filtram os desempenhos principais de cada algoritmo”.

Mais uma vez, os exemplos do professor Lúcio Santos ajudam a entender melhor a importância do que estudado e proposto pela ex-aluna Camila, e sua aplicação. O professor lembra que, com o avanço tecnológico, tornou-se comum a produção de dados em formatos de imagem e vídeos em diferentes domínios de aplicação, como em centros médicos, redes sociais e, até mesmo, na astronomia. “Assim, se torna necessário, também, armazená-los e realizar buscas com base na representação pictórica de tais dados, utilizando o conceito de similaridade”.

Vamos ao exemplo: imagine um jovem que quer comprar seu primeiro carro. Ele não conhece muito do assunto, mas tem a foto de um modelo de que gostaria. Ele poderia solicitar uma busca dos cinco carros mais similares ao da foto. Um problema, aponta Lúcio, é que quanto mais imagens e vídeos estão armazenados no banco de dados, maiores são as chances dos mecanismos de recuperação de imagem apresentarem resultados de carros muito similares à imagem dada e entre os próprios resultados, sendo necessário considerar um grau de diversidade entre as imagens dos resultados, carros com cores, marcas e modelos diferentes do que já foram apresentados.

“O trabalho da Camila apresenta uma forma de avaliar a qualidade dos resultados de uma busca com similaridade diversificada, criando um modelo multidimensional de características de diversidade que pode ser avaliado de forma visual por meio de gráficos de coordenadas paralelas e consolidada por meio de estratégias agregação de ranqueamento”, afirma o professor. O grande diferencial da pesquisa da ex-aluna, segundo ele, é que não há tantos trabalhos na literatura visando à avaliação de consultas por similaridade diversificada, “sendo os resultados do seu TCC uma grande contribuição para o estado da arte”.

Além de Camila e Lúcio, também são autores do artigo que recebeu menção honrosa os pesquisadores Daniel L. Jasbick e Marcos Bedo, ambos da UFF.

Qualidade no interior

Ter seu trabalho destacado em meio a tantos outros, inclusive de autoria de mestres e doutores, foi um estímulo para Camila. “É uma conquista pra mim e, com certeza, me incentiva ainda mais a continuar com a pesquisa, levar o trabalho adiante!”, conta a ex-aluna do IFNMG que, atualmente, atua em uma empresa de tecnologia como desenvolvedora. Em seus planos para próximo anos está o mestrado, no Brasil ou no exterior.

“A premiação em um evento com abrangência nacional e na América Latina é um reconhecimento dos trabalhos desenvolvidos pelos nossos alunos de graduação em instituições com campus localizados no interior dos estados e que apresentaram qualidade igual e superior àqueles outros desenvolvidos nos grandes centros de pesquisa do país, criando o alicerce para que possamos implementar e fortalecer possíveis programas de pós-graduação no interior”, destaca o professor Lúcio.

Fim do conteúdo da página