📘 Guia de Estudo em Ciência de Dados

🧭 Visão Geral

Este guia segue o caminho proposto no TechGuide.sh e é ideal para quem deseja se tornar Cientista de Dados.

🟢 Etapa 1: Fundamentos

Lógica de Programação: estruturas condicionais, laços e funções. Linguagem: **Python**.
Git e GitHub: versionamento de código. Use comandos como `git init`, `git push`, `git pull`.
Terminal / Shell: familiarize-se com `cd`, `ls`, `mkdir`, `rm`.

🟡 Etapa 2: Linguagens e Ferramentas

Python: bibliotecas como `pandas`, `numpy`, `matplotlib`, `scikit-learn`.
Jupyter Notebook: ambiente interativo. Alternativa: [Google Colab](https://colab.research.google.com).
SQL: comandos `SELECT`, `JOIN`, `GROUP BY`. Curso: [Mode Analytics](https://mode.com/sql-tutorial/).

🔵 Etapa 3: Matemática e Estatística

Estatística: média, desvio padrão, variância, distribuições.
Probabilidade: eventos, variáveis aleatórias, condicional.
Álgebra Linear: vetores, matrizes, autovalores.
Cálculo: derivadas, máximos e mínimos.

🔴 Etapa 4: Análise e Visualização de Dados

Manipulação: limpeza, filtragem com `pandas`.
Visualização: gráficos com `matplotlib`, `seaborn`, `plotly`.
Projetos: relatórios exploratórios, dashboards simples.

🟣 Etapa 5: Machine Learning

Supervisionado: regressão linear, classificação.
Não-supervisionado: K-means, PCA.
Validação: `accuracy`, `precision`, `recall`.
Ferramentas: `scikit-learn`, `xgboost`, `lightgbm`.

⚫ Etapa 6: Engenharia e Deployment

SQL avançado e bancos NoSQL (`MongoDB`).
Web Scraping: `requests`, `BeautifulSoup`, `Selenium`.
APIs: criação com `Flask`, `FastAPI`.
Deploy: Heroku, Vercel, Streamlit.

🧩 Etapa 7: Portfólio e Projetos

Projetos: previsão de imóveis, análise de sentimentos, detecção de fraudes.
Portfólio: GitHub com README, blog no Medium ou LinkedIn.

📚 Recursos Recomendados

📘 Python para Análise de Dados – Wes McKinney
📘 Hands-On Machine Learning – Aurélien Géron
🎓 Comunidades: Kaggle, Data Hackers, Programaria