C
|Caroline Oliveira

Stats-studio: como fazer uma regressão linear no-code

Data de publicação

Ilustração digital com o título “Usando o Stat’s Studio para Regressão Linear”

Usando o stats-studio para regressão linear

Recentemente, comecei um MBA em engenharia de software e um dos temas abordados foi o uso de ferramentas web para auxiliar no treinamento supervisionado a partir de uma base de dados.

Conheci o stats-studio, uma ferramenta com algumas funcionalidades gratuitas e de fácil uso que pode auxiliar no treinamento de modelos supervisionados, como é o caso da regressão linear múltipla.

Passo a passo de como fazer um treinamento supervisonado

O stats-studio recebe vários formatos de arquivos, incluindo .csv e .xsls. Neste exemplo

vamos usar o formato .csv, por ser mais comum e aceito por uma gama maior de leitores de texto e linguagens de programação.

Para demonstração, vamos usar o database aberto que está descrito nesse projeto do Github.

Nessa base de dados a variável dependente, ou seja, o valor que queremos fazer a predição é a quantidade de vendas. Já as variáveis explicativas são os canais de vendas, sendo eles TV, RADIO e NEWSPAPER.

Ao fazer o upload do csv temos várias opções de ações para fazer com a nossa base de dados, entre elas uma "Análise descritiva", que mostra dados estatísticos sobre a amostra, como desvio padrão, média, mínimo, máximo entre outros.

Tabela com dados estatísticos gerados pelo stats-studio

Para o treinamento, clique nas opções abaixo:

Supervisionado > Regressão Linear > Sales (variável dependente) > tv, radio, newspaper (variáveis explicativas) > Simular

Painel do stats-studio para treinamento com a base de dados selecionada

Após a simulação, a opção newspaper ficará desmarcada. Isso ocorre pois a opção Stepwise foi selecionada e essa variável é estatisticamente irrelevante, podendo ser descartada.

Com isso temos de maneira simplificada a visualização de um treinamento, incluindo dados importantes como:

  1. R^2
  2. P-value dos parâmetros
  3. Intervalos de confiança
Resultado do treinamento supervisionado

O stats-studio é uma ferramenta intuitiva pode pode descrever datasets de maneira rápida e simplificada, sendo bem util para análises sem a necessidade direta de usar uma linguagem de programação como python. Além disso, a ferramenta conta com outras possibilidades de predição e treinamento, como séries temporais.

Vale a pena dar uma conferida!