Pular para o conteúdo
O Complemento de Dois
  • Concursos
  • Calculadora
  • Estudos
  • Discord
  • Publicações
Home / Big data / Machine learning

Machine learning

machine learning

A Hierarquia dos Conceitos

Inteligência Artificial (IA): O campo amplo que busca criar sistemas capazes de realizar tarefas que exigiriam inteligência humana.

Machine Learning (ML): Um subcampo da IA que foca em algoritmos que “aprendem” padrões a partir de dados, sem serem explicitamente programados para cada regra.

Deep Learning (DL): Um subcampo do ML que utiliza Redes Neurais Artificiais multicamadas (profundas) para processar dados complexos (como imagens e voz).

Tipos de aprendizados

Supervisionado: Dados com rótulos

Não supervisionado: Dados sem rótulos

Reforço: Resultados geram recompensas ou punições

Aprendizado supervisionado

Regressão

  • Regressão Linear: Relação linear entre variáveis independentes e a variável alvo contínua.
  • Regressão Logística: Classificação binária, mas pode dar probabilidades contínuas.
  • Árvores de Decisão: Particiona o espaço em regiões e atribui um valor constante em cada folha.
  • Random Forest: Conjunto de árvores de decisão que reduz overfitting via bootstrap e agregação.
  • Gradient Boosting (XGBoost, LightGBM, CatBoost): Combina árvores fracas sequencialmente corrigindo erros do modelo anterior.

Classificação

  • K‑Nearest Neighbors (K‑NN): Classifica baseado nos rótulos dos K vizinhos mais próximos no espaço de features.
  • Support Vector Machine (SVM): Encontra o hiperplano que maximiza a margem entre classes; usa kernels para dados não lineares.
  • Árvores de Decisão: Estrutura hierárquica com divisões baseadas em impureza (Gini, entropia).
  • Random Forest: Conjunto de árvores com votação majoritária; robusto e difícil de overfit.
  • Gradient Boosting: Mesma ideia da regressão, mas com função de perda apropriada (log‑loss).
  • Naive Bayes: Baseado no teorema de Bayes com forte premissa de independência entre features; eficiente para textos.
  • Redes Neurais (Perceptron multicamadas): Modelos flexíveis capazes de aprender relações complexas; base do deep learning.

Aprendizado não supervisionado

Clusterização (Agrupamento)

  • K-Means: Particiona os dados em K grupos (clusters) com base na distância aos centróides. É rápido e escalável, mas assume clusters esféricos e de tamanho similar.
  • K-Medoids: Similar ao K-Means, mas usa pontos reais como centróides (medoides), sendo mais robusto a outliers.
  • DBSCAN: Agrupa pontos com base na densidade. Não exige número de clusters pré-definido e consegue identificar outliers (ruído). Bom para formas arbitrárias.
  • Hierarchical Clustering (Aglomerativo/Divisivo): Constrói uma árvore de clusters (dendrograma). Permite cortar em diferentes níveis para obter granularidades variadas.
  • Mean Shift: Desliza janelas em direção às regiões de maior densidade. Não exige K, mas pode ser caro computacionalmente.
  • Gaussian Mixture Models (GMM): Modela os clusters como distribuições normais. Permite clusters elípticos e associa probabilidades de pertencimento (soft clustering).

Redução de Dimensionalidade

  • PCA (Principal Component Analysis): Projeta os dados em componentes principais que maximizam a variância. Usado para visualização, compressão e remoção de ruído.
  • t-SNE: Reduz dimensões preservando similaridades locais. Excelente para visualização de dados de alta dimensão em 2D/3D, mas não é recomendado para pipelines de modelagem.
  • UMAP: Mais rápido que t-SNE e preserva tanto estruturas locais quanto globais. Bom para visualização e como pré-processamento.
  • Autoencoders (deep learning): Redes neurais que aprendem representações comprimidas (latentes) por meio de codificação e decodificação.

Regras de Associação

Apriori: Encontra conjuntos de itens frequentes e gera regras do tipo “se X então Y”. Muito usado em análise de cestas de compras (market basket analysis).

FP-Growth: Versão mais eficiente que o Apriori, pois evita a geração excessiva de candidatos, usando uma estrutura de árvore (FP-tree).

Anomalia/Outlier Detection

Isolation Forest: Isola anomalias em vez de perfilar pontos normais. Eficiente e escalável.

One-Class SVM: Aprende uma fronteira que contém a maioria dos dados normais; detecta pontos fora dela.

Categorias: Big data
Tags: deep, inteligencia, learning, machine
Publicado em: 03/04/2026 19:26 e Atualizado em: 03/04/2026 19:27

Compartilhe este post:

Facebook Twitter LinkedIn WhatsApp

Navegação de Post

Post anterior: Data pipeline
Próximo post: ISO 27001/27002

Posts Recentes

  • GoF
    Padrões de Projeto GoF1 de junho de 2026
  • POO
    Programação Orientada a Objetos (POO)1 de junho de 2026
  • CMMI-20
    CMMI-DEV v2.031 de maio de 2026
  • RUP
    RUP (Rational Unified Process)31 de maio de 2026
  • scrum
    Scrum31 de maio de 2026
  • Política de privacidade

2026. O Complemento de Dois. Todos os direitos reservados.