Detecção de objetos em imagens usando Faster R-CNN

Autores

  • Edilene Aparecida Veneruchi de Campos Faculdade Insted
  • Odirley Franco de Oliveira

DOI:

https://doi.org/10.62559/recam.v3i2.84

Resumo

Este trabalho de pesquisa explorou a detecção de objetos em imagens por meio da utilização da rede Faster R-CNN. Nesse contexto, foram apresentados os conceitos fundamentais de inteligência artificial e aprendizado de máquina, em especial, o aprendizado profundo, que permite a detecção de padrões complexos em dados brutos. Foi então proposta a implementação de dois modelos de aprendizado baseados na arquitetura da Faster R-CNN, os quais foram treinados e testados com um conjunto de dados criado com imagens de flores, cada uma classificada em duas classes Margarida e Rosa. A escolha da Faster R-CNN foi feita devido à sua eficiência em reduzir o tempo de treinamento e em melhorar a acurácia das respostas obtidas. Com o propósito de verificar a eficiência dos modelos e encontrar respostas satisfatórias, foram estabelecidos dois tipos principais de treinamento: com uma taxa de aprendizagem fixa e com uma taxa de aprendizagem adaptativa. Considerando os resultados, verificou-se que o primeiro modelo apresentou maior valor do aprendizado. Por outro lado, tal sistema também apresentou uma sensibilidade mais limitada e maior incidência de problemas na detecção da borda das caixas e classificação. Em termos de limitações, pode-se citar o pequeno tamanho do dataset utilizado e a pouca variação. Como melhorias para o futuro pretende-se usar dataset maior e mais variado, empregar estratégias para definição do valor inicial dos hiperparâmetros, como otimização bayseana, além de avaliar outras arquiteturas, como Mask R-CNN. Assim, espera-se compor uma estrutura básica mais eficiente para realizar, além da detecção, a segmentação de instâncias dentro de imagens.

Downloads

Publicado

2024-12-27

Edição

Seção

Artigos