🧠 Machine Learning
Bem-vindo(a) à documentação da matéria Machine Learning, desenvolvida durante o 4° semestre do curso de Ciência de Dados e Negócios da ESPM!
Este espaço reúne projetos, exercícios, anotações e estudos práticos realizados ao longo da disciplina — explorando desde o pré-processamento de dados até a implementação de modelos supervisionados e não supervisionados.
O objetivo é consolidar o aprendizado e servir como um repositório de referência para futuras aplicações em ciência de dados, estatística aplicada e modelagem preditiva.
🚀 Conteúdos Principais
- Análise Exploratória de Dados (EDA) — limpeza, tratamento de nulos, detecção de outliers e visualizações.
- Modelos Supervisionados — regressão linear, árvore de decisão e KNN.
- Modelos Não Supervisionados — clustering com K-Means e análise de agrupamentos.
- Métricas de Avaliação — acurácia, matriz de confusão, R², p-valor e interpretação de resultados.
- Documentação e Visualização — gráficos interativos, diagramas com Mermaid e dashboards.
📊 Datasets Utilizados
Os experimentos apresentados nesta documentação foram desenvolvidos com diferentes bases de dados públicas:
- 🏠 Ames Housing Dataset (Kaggle)
— Previsão do preço de imóveis com variáveis categóricas e numéricas.
🧩 Tecnologias e Ferramentas
- Linguagens: Python (pandas, scikit-learn, matplotlib, seaborn)
- Ambiente: Jupyter Notebook / VS Code
- Documentação: MkDocs + Material Theme
- Visualização: Mermaid, Google Charts, Tableau
📚 Referências
Documentação construída com MkDocs Material.