Título

Subtítulo

Autor/a

Nombre Apellidos

Importando bibliotecas

import pandas as pd
from plotnine import ggplot, aes, geom_boxplot, scale_y_log10, geom_col
from siuba import _, count

Importando datos

creditos = pd.read_csv("../../datos/colocaciones_créditos_agropecuarios_2024.csv")

Información de la base de datos

creditos.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 104017 entries, 0 to 104016
Data columns (total 14 columns):
 #   Column                  Non-Null Count   Dtype  
---  ------                  --------------   -----  
 0   year_es                 104017 non-null  int64  
 1   mes                     104017 non-null  int64  
 2   fuente_colocacion       104017 non-null  object 
 3   tipo_productor          104017 non-null  object 
 4   valor_inversion         104017 non-null  float64
 5   departamento_inversion  104017 non-null  object 
 6   municipio_inversion     104017 non-null  object 
 7   mpio_posconflicto       104017 non-null  object 
 8   plazo                   104017 non-null  int64  
 9   linea_de_produccion     104017 non-null  object 
 10  destino_de_credito      104017 non-null  object 
 11  genero                  104017 non-null  object 
 12  latitud                 104017 non-null  float64
 13  longitud                104017 non-null  float64
dtypes: float64(3), int64(3), object(8)
memory usage: 11.1+ MB

Datos booleanos (bool)

True
False

2 > 3

False

2 < 3

True

Visualización

Boxplot

(
    creditos >>
    ggplot(aes(y = "valor_inversion")) +
    geom_boxplot() +
    scale_y_log10()
)

(
    creditos >>
    ggplot(aes(x = "genero", y = "valor_inversion")) +
    geom_boxplot() +
    scale_y_log10()
)

Conteo de créditos por género

Tabla:

(
    creditos >>
    count(_.genero)
)

	genero	n
0	H	63357
1	M	33295
2	S	7365

Gráfico:

(
    creditos >>
    count(_.genero) >>
    ggplot(aes(x = "genero", y = "n")) +
    geom_col()
)