Módulo 2: Variáveis e Níveis de Mensuração

Classificando os dados que alimentam a Inteligência Artificial.

📊 Entendendo Nossos Dados

Bem-vindo ao Módulo 2! No coração da estatística e da IA está a informação. Essa informação vem na forma de dados, que representam características de interesse. Em estatística, chamamos essas características de variáveis.

Saber classificar corretamente as variáveis é crucial. Por quê? Porque o tipo de variável e seu nível de mensuração determinam quais análises estatísticas podemos realizar, quais gráficos são apropriados e até mesmo quais algoritmos de Machine Learning funcionarão melhor.

Neste módulo, vamos desmistificar a classificação das variáveis, um passo fundamental para qualquer cientista de dados ou engenheiro de IA. Vamos lá!

Qualidade ou Quantidade? Tipos de Variáveis

A primeira grande divisão: descrevem características ou medem valores?

Variáveis Qualitativas (Categóricas)

Descrevem qualidades, atributos ou categorias. Não são naturalmente numéricas, embora possam ser codificadas com números.

Exemplos em IA/Computação:

  • Tipo de Sistema Operacional (Windows, macOS, Linux)
  • Status de um Serviço (Online, Offline, Manutenção)
  • Rótulo de E-mail (Spam, Não Spam)
  • Categoria de Notícia (Esportes, Política, Tecnologia)

Operações matemáticas diretas (soma, média) não fazem sentido aqui.

Variáveis Quantitativas (Numéricas)

Representam quantidades ou contagens mensuráveis. Os números têm significado matemático.

Quantitativas Discretas

Resultam de contagens. Assumem valores inteiros e finitos (ou infinitos contáveis). Não há valores intermediários significativos.

  • Número de Acessos a um Site
  • Quantidade de Cores em uma Imagem (e.g., 256)
  • Número de Linhas de Código em um Script

Quantitativas Contínuas

Resultam de medições. Podem assumir qualquer valor dentro de um intervalo (inclusive decimais).

  • Tempo de Resposta de um Servidor (em milissegundos)
  • Taxa de Transferência de Rede (em Mbps)
  • Probabilidade de um Modelo Acertar (0.0 a 1.0)
  • Uso de CPU (em percentual)

Operações matemáticas são aplicáveis e significativas.

Entender essa diferença inicial é a base para escolher as ferramentas de análise corretas.

🔍 A Profundidade da Medição: Níveis (Escalas)

Além do tipo, o nível de mensuração define quais operações estatísticas são válidas.

Nominal

Categorias sem ordem. Apenas nomes ou rótulos. Números são apenas códigos.

Exemplos:
  • Linguagem de Programação (Python, Java, C++)
  • Tipo de Banco de Dados (SQL, NoSQL)
  • ID de Usuário (números que não indicam ordem ou quantidade)
Operações: Contagem, Moda.

Ordinal

Categorias com ordem definida, mas intervalos entre elas não são uniformes ou mensuráveis.

Exemplos:
  • Nível de Experiência (Júnior, Pleno, Sênior)
  • Prioridade de Tarefa (Baixa, Média, Alta)
  • Classificação de Satisfação (1 a 5 estrelas)
Operações: Contagem, Moda, Mediana, Percentis.

Intervalar

Ordem e intervalos iguais entre valores. Zero é arbitrário, não indica ausência.

Exemplos:
  • Temperatura em Celsius/Fahrenheit
  • Ano do Calendário (e.g., 2024)
  • Scores padronizados (onde zero não é absoluto)
Operações: Moda, Mediana, Média, Variância, Desvio Padrão. (Soma/Subtração OK, Razão não).

Razão

Ordem, intervalos iguais E um zero absoluto significativo (zero = ausência). Razões são significativas.

Exemplos:
  • Tempo de Processamento (em segundos)
  • Memória RAM Utilizada (em GB)
  • Número de Erros em um Log
  • Altura, Peso, Idade
Operações: Todas as operações estatísticas.

Escolher o nível correto nos guia para análises mais precisas e interpretações corretas.

⚙️ Classificando Dados na Prática (IA)

Vamos analisar algumas variáveis comuns em um cenário de análise de desempenho de modelos de IA.

Variável Exemplo de Valor Tipo Nível de Mensuração
Nome do Modelo 'ResNet50', 'BERT' Qualitativa Nominal Apenas identifica o modelo, sem ordem inerente.
Acurácia do Modelo 0.925, 85.3% Quantitativa (Contínua) Razão Zero acurácia é absoluto (nenhum acerto), 90% é o dobro de 45%.
Tempo de Treinamento (horas) 12.5, 48.0 Quantitativa (Contínua) Razão Zero horas significa nenhum treinamento. 10h é o dobro de 5h.
Número de Parâmetros 25,500,000, 110,000,000 Quantitativa (Discreta) Razão Resultado de contagem, zero parâmetros é possível.
Rating de Complexidade 'Baixo', 'Médio', 'Alto' Qualitativa Ordinal Existe uma ordem clara (Alto > Médio > Baixo), mas a diferença não é numérica.
Ano de Implantação 2022, 2023 Quantitativa (Discreta) Intervalar Intervalos (anos) são iguais, mas o ano 0 não significa 'ausência de tempo'.

Aplicar essas classificações nos ajuda a entender as características dos nossos dados e planejar análises futuras.

🧠 Teste Rápido!

Carregando quiz...

Teoria do Módulo 2 Completa!

Excelente trabalho! Você agora sabe como classificar variáveis por tipo (Qualitativa/Quantitativa) e nível de mensuração (Nominal, Ordinal, Intervalar, Razão). Este é um conhecimento essencial para a análise de dados e modelagem em IA.
Pronto para testar suas habilidades? Siga para a Zona de Prática ou Prática Avançada do Módulo 2.