top of page
Create Your First Project
Start adding your projects to your portfolio. Click on "Manage Projects" to get started
🧠Classificação com Deep Learning
Posição
Pesquisa — Projeto Acadêmico
Instituição
Worcester Polytechnic Institute
Curso
Machine Learning
Data
Outono 2024
Principais Skills & Ferramentas
• PyTorch
• Projeto de Arquiteturas CNN
• Transferência de Aprendizado (ResNet50, VGG16)
• Otimização de Hiperparâmetros
• Classificação de Imagens | Dataset GTSRB
• Aumento e Normalização de Dados
• Avaliação e Visualização de Modelos
• Análise de Curvas de Acurácia/Perda
• Comparação entre Múltiplos Modelos
Como parte de um projeto acadêmico voltado para deep learning, desenvolvi e avaliei diferentes arquiteturas de redes neurais convolucionais (CNNs) para classificar sinais de trânsito usando o German Traffic Sign Recognition Benchmark (GTSRB) — um conjunto de dados real com mais de 50.000 imagens rotuladas, distribuÃdas em 43 classes de sinais.
O projeto envolveu a implementação e comparação de três modelos distintos:
1. CNN Personalizada:
Uma rede convolucional leve, projetada do zero em PyTorch, composta por duas camadas convolucionais, duas camadas totalmente conectadas (512 → 43 outputs) e uma camada de dropout para regularização. Mesmo com sua simplicidade, o modelo alcançou mais de 98% de precisão em apenas 10 epochs.
2. ResNet50 (Transfer Learning):
Realizei o fine-tuning do bloco final de um modelo pré-treinado ResNet50, substituindo sua camada de output para classificação das 43 classes. Após 20 epochs, o modelo atingiu 99,76% de precisão, com perda de apenas 0.009, demonstrando excelente generalização.
3. VGG16 (Transfer Learning):
Ajustei todas as camadas da arquitetura VGG16, substituindo novamente a camada final para as 43 classes. Este modelo obteve o melhor desempenho, com 99,86% de precisão e uma perda de validação de apenas 0.0043.
Todos os modelos foram treinados com os seguintes parâmetros:
• Framework: PyTorch
• Tamanho do batch: 32
• Taxa de aprendizado: 0.001
• Weight decay: 1e-5
O pré-processamento dos dados incluiu normalização, redimensionamento, rotação e espelhamento das imagens, garantindo uma boa generalização frente a variações visuais.
Durante o projeto, também trabalhei com otimização de hiperparâmetros, visualização de desempenho por época (curvas de perda e acurácia) e validação qualitativa com previsões amostrais. Todos os modelos classificaram corretamente o mesmo conjunto de imagens de teste, demonstrando consistência e robustez.
Este projeto consolidou meus conhecimentos em projeto de arquiteturas CNN, transferência de aprendizado, avaliação de modelos e implementação prática com PyTorch, além de reforçar boas práticas em reprodutibilidade e eficiência de treinamento.
bottom of page