Create Your First Project

Start adding your projects to your portfolio. Click on "Manage Projects" to get started

🧠 Classificação com Deep Learning

Posição

Pesquisa — Projeto Acadêmico

Instituição

Worcester Polytechnic Institute

Curso

Machine Learning

Data

Outono 2024

Principais Skills & Ferramentas

• PyTorch
• Projeto de Arquiteturas CNN
• Transferência de Aprendizado (ResNet50, VGG16)
• Otimização de Hiperparâmetros
• Classificação de Imagens | Dataset GTSRB
• Aumento e Normalização de Dados
• Avaliação e Visualização de Modelos
• Análise de Curvas de Acurácia/Perda
• Comparação entre Múltiplos Modelos

Como parte de um projeto acadêmico voltado para deep learning, desenvolvi e avaliei diferentes arquiteturas de redes neurais convolucionais (CNNs) para classificar sinais de trânsito usando o German Traffic Sign Recognition Benchmark (GTSRB) — um conjunto de dados real com mais de 50.000 imagens rotuladas, distribuídas em 43 classes de sinais.

O projeto envolveu a implementação e comparação de três modelos distintos:

1. CNN Personalizada:
Uma rede convolucional leve, projetada do zero em PyTorch, composta por duas camadas convolucionais, duas camadas totalmente conectadas (512 → 43 outputs) e uma camada de dropout para regularização. Mesmo com sua simplicidade, o modelo alcançou mais de 98% de precisão em apenas 10 epochs.

2. ResNet50 (Transfer Learning):
Realizei o fine-tuning do bloco final de um modelo pré-treinado ResNet50, substituindo sua camada de output para classificação das 43 classes. Após 20 epochs, o modelo atingiu 99,76% de precisão, com perda de apenas 0.009, demonstrando excelente generalização.

3. VGG16 (Transfer Learning):
Ajustei todas as camadas da arquitetura VGG16, substituindo novamente a camada final para as 43 classes. Este modelo obteve o melhor desempenho, com 99,86% de precisão e uma perda de validação de apenas 0.0043.

Todos os modelos foram treinados com os seguintes parâmetros:
• Framework: PyTorch
• Tamanho do batch: 32
• Taxa de aprendizado: 0.001
• Weight decay: 1e-5

O pré-processamento dos dados incluiu normalização, redimensionamento, rotação e espelhamento das imagens, garantindo uma boa generalização frente a variações visuais.

Durante o projeto, também trabalhei com otimização de hiperparâmetros, visualização de desempenho por época (curvas de perda e acurácia) e validação qualitativa com previsões amostrais. Todos os modelos classificaram corretamente o mesmo conjunto de imagens de teste, demonstrando consistência e robustez.

Este projeto consolidou meus conhecimentos em projeto de arquiteturas CNN, transferência de aprendizado, avaliação de modelos e implementação prática com PyTorch, além de reforçar boas práticas em reprodutibilidade e eficiência de treinamento.