Sesión sincrónica 01-04-2023

Funciones - Métodos

Funciones

a = [2, 1, 4]

len(a)

type(a)

round(1.345, 1)

help(round)

Métodos

a.sort()
a

a.reverse()
a

texto = "¡hola mundo cruel!"

texto.upper()

texto.lower()

texto.capitalize()

texto.count("a")

texto.count("l")

Arrays con `numpy`

import numpy as np

Arrays 1D (vectores) vs Listas

peso_kg = [65.3, 82.5, 57.5, 82, 77.7]
altura_m = [1.68, 1.75, 1.62, 1.80, 1.72]

Calculemos el índice de masa corporal para estas tres personas:

peso_kg / altura_m ** 2

peso_kg_array = np.array(peso_kg)
altura_m_array = np.array(altura_m)

peso_kg_array / altura_m_array ** 2

¿Cómo extraer sólo personas con alturas mayores a 1.70 m?

altura_m > 1.70

altura_m_array > 1.70

altura_m_array[altura_m_array > 1.70]

Diccionarios

diccionario = {'Nombre': ['Pepito', 'Juanita', 'Pepita', 'Bill', 'Jenny'],
               'Peso': peso_kg,
               'Altura': altura_m}

diccionario

diccionario.keys()

diccionario.values()

diccionario.items()

diccionario["Peso"]

Introducción a pandas

import pandas as pd

Dataframe desde un diccionario

keys: nombres o etiquetas de columnas
values: valores (columna por columna)

pd.DataFrame(diccionario)

tabla = pd.DataFrame(diccionario)
tabla.head(2)

tabla.index = ["P1", "P2", "P3", "P4", "P5"]
tabla

tabla.columns

Dataframe desde un archivo .csv

1000 Empresas más grandes de Colombia (2017-2018)

df_csv = pd.read_csv("1000_Empresas_mas_grandes_del_pa_s.csv")
df_csv.head(5)

Exportemos este archivo a excel:

df_csv.to_excel("empresas_colombia.xlsx")

Dataframe desde un archivo de excel

df_excel = pd.read_excel("empresas_colombia.xlsx")
df_excel.head(5)

Resumen descriptivo rápido

df_csv.describe()

# df_csv.describe(include = [float])
df_csv.describe(include = [np.number])

df_csv.describe(include = [object])

Funciones - Métodos

Funciones

Métodos

Arrays con numpy

Arrays 1D (vectores) vs Listas

Diccionarios

Introducción a pandas

Dataframe desde un diccionario

Dataframe desde un archivo .csv

Dataframe desde un archivo de excel

Resumen descriptivo rápido

Arrays con `numpy`