Sesión sincrónica 01-04-2023

Funciones - Métodos

Funciones

a = [2, 1, 4]
len(a)
type(a)
round(1.345, 1)
help(round)

Métodos

a.sort()
a
a.reverse()
a
texto = "¡hola mundo cruel!"
texto.upper()
texto.lower()
texto.capitalize()
texto.count("a")
texto.count("l")

Arrays con numpy

import numpy as np

Arrays 1D (vectores) vs Listas

peso_kg = [65.3, 82.5, 57.5, 82, 77.7]
altura_m = [1.68, 1.75, 1.62, 1.80, 1.72]

Calculemos el índice de masa corporal para estas tres personas:

peso_kg / altura_m ** 2
peso_kg_array = np.array(peso_kg)
altura_m_array = np.array(altura_m)

peso_kg_array / altura_m_array ** 2
  • ¿Cómo extraer sólo personas con alturas mayores a 1.70 m?
altura_m > 1.70
altura_m_array > 1.70
altura_m_array[altura_m_array > 1.70]

Diccionarios

diccionario = {'Nombre': ['Pepito', 'Juanita', 'Pepita', 'Bill', 'Jenny'],
               'Peso': peso_kg,
               'Altura': altura_m}

diccionario
diccionario.keys()
diccionario.values()
diccionario.items()
diccionario["Peso"]

Introducción a pandas

import pandas as pd

Dataframe desde un diccionario

  • keys: nombres o etiquetas de columnas
  • values: valores (columna por columna)
pd.DataFrame(diccionario)
tabla = pd.DataFrame(diccionario)
tabla.head(2)
tabla.index = ["P1", "P2", "P3", "P4", "P5"]
tabla
tabla.columns

Dataframe desde un archivo .csv

df_csv = pd.read_csv("1000_Empresas_mas_grandes_del_pa_s.csv")
df_csv.head(5)
  • Exportemos este archivo a excel:
df_csv.to_excel("empresas_colombia.xlsx")

Dataframe desde un archivo de excel

df_excel = pd.read_excel("empresas_colombia.xlsx")
df_excel.head(5)

Resumen descriptivo rápido

df_csv.describe()
# df_csv.describe(include = [float])
df_csv.describe(include = [np.number])
df_csv.describe(include = [object])