📘 Guia de Estudo em Ciência de Dados
🧭 Visão Geral
Este guia segue o caminho proposto no TechGuide.sh e é ideal para quem deseja se tornar Cientista de Dados.
🟢 Etapa 1: Fundamentos
- Lógica de Programação: estruturas condicionais, laços e funções. Linguagem: **Python**.
- Git e GitHub: versionamento de código. Use comandos como `git init`, `git push`, `git pull`.
- Terminal / Shell: familiarize-se com `cd`, `ls`, `mkdir`, `rm`.
🟡 Etapa 2: Linguagens e Ferramentas
- Python: bibliotecas como `pandas`, `numpy`, `matplotlib`, `scikit-learn`.
- Jupyter Notebook: ambiente interativo. Alternativa: [Google Colab](https://colab.research.google.com).
- SQL: comandos `SELECT`, `JOIN`, `GROUP BY`. Curso: [Mode Analytics](https://mode.com/sql-tutorial/).
🔵 Etapa 3: Matemática e Estatística
- Estatística: média, desvio padrão, variância, distribuições.
- Probabilidade: eventos, variáveis aleatórias, condicional.
- Álgebra Linear: vetores, matrizes, autovalores.
- Cálculo: derivadas, máximos e mínimos.
🔴 Etapa 4: Análise e Visualização de Dados
- Manipulação: limpeza, filtragem com `pandas`.
- Visualização: gráficos com `matplotlib`, `seaborn`, `plotly`.
- Projetos: relatórios exploratórios, dashboards simples.
🟣 Etapa 5: Machine Learning
- Supervisionado: regressão linear, classificação.
- Não-supervisionado: K-means, PCA.
- Validação: `accuracy`, `precision`, `recall`.
- Ferramentas: `scikit-learn`, `xgboost`, `lightgbm`.
⚫ Etapa 6: Engenharia e Deployment
- SQL avançado e bancos NoSQL (`MongoDB`).
- Web Scraping: `requests`, `BeautifulSoup`, `Selenium`.
- APIs: criação com `Flask`, `FastAPI`.
- Deploy: Heroku, Vercel, Streamlit.
🧩 Etapa 7: Portfólio e Projetos
- Projetos: previsão de imóveis, análise de sentimentos, detecção de fraudes.
- Portfólio: GitHub com README, blog no Medium ou LinkedIn.