Análise da balança comercial do petróleo e derivados

Gostaria de compartilhar uma atualização de um texto sobre a dependência brasileira em importações de petróleo. Escrevi esse texto originalmente em 2018, à luz da greve dos caminhoneiros, e agora atualizei com novas informações, visto que o tema está em voga. Análise da balança comercial do petróleo e derivados Daniel K. Komesu Este texto analisa a evolução das exportações e importações brasileiras entre os anos de 2008 e 2020, com foco no óleo diesel, motivado pela recente paralisação dos caminhoneiros em decorrência da alta dos preços desses produtos....

July 24, 2022 · 11 min · Komesu, D. K.

Underfitting e Overfitting

Underfitting e overfitting são problemas em machine learning supervisionado que podem aparecer nos modelos e está relacionado com o trade-off de viés e variância. ...

February 18, 2022 · 2 min · Komesu, D. K.

SQLite: como remover linhas duplicadas

Quando o DBA (ou seja, nós mesmos) não coloca uma constraint (restrição) de valores únicos numa tabela, pode ser que sejam inseridas linhas com valores duplicados. Não dá para colocar um constraint nessa tabela depois que temos linhas duplicadas. É preciso remover essas linhas. ...

February 16, 2022 · 1 min · Komesu, D. K.

Divisão de dados em Treino, Validação e Teste para Machine Learning

A divisão de datasets em treino, teste e validação é um procedimento em data science, mais especificamente machine learning supervisionado, que divide o conjunto de dados (dataset) em três subconjuntos para permitir a medição da performance de algoritmos de previsão e classificação. ...

February 15, 2022 · 2 min · Komesu, D. K.

Como calcular distâncias geográficas entre duas coordenadas em Python

Em análises geoespaciais, uma das tarefas mais frequentes é medir a distância entre duas coordenadas geográficas. Em Python é possível obter essa distância facilmente usando o pacote geopy e seu módulo distance. ...

February 9, 2022 · 1 min · Komesu, D. K.

Aprendizado supervisionado vs não-supervisionado

Em machine learning (aprendizado de máquina em português) temos dois tipos de aprendizado: o supervisionado e o não-supervisionado. A diferença entre eles está nos rótulos, também conhecidos como targets, dos dados e nos métodos utilizados para cada um. ...

February 2, 2022 · 1 min · Komesu, D. K.

Síndrome de FOMO: fear of missing out

FOMO: esse é o nome de uma síndrome que descobri recentemente. Fear Of Missing Out (FOMO). Essa síndrome nada mais é do que a sensação de estar perdendo algo quando não estamos “por dentro” ou “participando” de algum assunto ou grupo. É um sentimento de ansiedade muito incômodo quando outras pessoas estão falando sobre algum assunto em que não estamos incluídos. ...

February 1, 2022 · 2 min · Komesu, D. K.

Trade-off entre viés e variância (links)

Quanto mais parâmetros colocamos no modelo, menor se torna o viés, porém mais complexo ele se torna e maior é a variância. Em machine learning é importante encontrar o equilíbrio entre viés e variância num modelo. ...

January 30, 2022 · 1 min · Komesu, D. K.

Checklist para configurar um servidor Linux seguro

Este post é checklist a seguir ao configurar um servidor Linux recém instalado. Numa instalação nova do Linux em um servidor é preciso configurar algumas coisas para se certificar que o sistema está seguro e atualizado. ...

January 22, 2022 · 3 min · Komesu, D. K.

PIP: Como instalar o GeoPandas no Windows (sem Conda)

Como instalar o pacote GeoPandas no Windows sem usar o conda? Quando tentamos instalá-lo usando o PIP recebemos um erro. Muitas respostas no StackOverflow dizem para usar o Conda nesse caso. Porém, e quando não queremos usar o Conda, pois não queremos instalar outra versão gerenciador de pacotes no Windows? ...

January 22, 2022 · 1 min · Komesu, D. K.