Notas sobre Pandas

Post image

Pandas

Instalación

Para poder usar pandas es necesario instalarlo:

pip install pandas

Abrir un fichero de Excel con pandas y realizar distintas operaciones

import pandas as pd

ARCHIVO_ORIGEN = "cars.xlsx"

# Se crea un dataframe con el método que ofrece pandas, para leer un fichero de Excel
df = pd.read_excel(ARCHIVO_ORIGEN)

# Mostrar las columnas que contiene
print(df.columns)

# Salida: Index(['model', 'mpg', 'cyl', 'disp', 'hp', 'drat', 'wt', 'qsec', 'vs', 'am', 'gear', 'carb'], dtype='object')

# Modificar el nombre de columnas
df = df.rename(columns={"model": "Modelo"})
df = df.rename(columns={"gear": "Marchas"})
df = df.rename(columns={"cyl": "Cilindros"})
df = df.rename(columns={"wt": "Watios"})

print(df.columns)
# Salida: Index(['Modelo', 'mpg', 'Cilindros', 'disp', 'hp', 'drat', 'Watios', 'qsec', 'vs', 'am', 'Marchas', 'carb'], dtype='object')

# Si solo queremos trabajar con algunas columnas:
df = df[["Modelo", "Marchas", "Cilindros", "hp", "Watios"]]

print(df.columns)
# Salida: Index(['Modelo', 'Marchas', 'Cilindros', 'hp', 'Watios'], dtype='object')

# Recorrer las filas del dataframe y mostrar todos los valores de la fila
for index, row in df.iterrows():
    print(f"Fila {index}: {row.values}")

# Crear una nueva columna, CV, basada en los datos de otra:
df["CV"] = df["hp"] * 0.986

# Se crea una nueva columna, Marca, a partir de otra, Modelo,
# extrayendo el primer elemento del texto
df["Marca"] = df["Modelo"].apply(lambda x: x.split()[0])

# Cambiar el orden de las columnas. En este caso Marca y Modelo ocuparán las
# dos primeras posiciones

df = df[
    ["Marca"]
    + ["Modelo"]
    + [col for col in df.columns if (col != "Marca" and col != "Modelo")]
]

# Filtrar datos:
df_volvo = df[df["Volvo"] == "Volvo"]

# Filtrar marcas que empiezan por 'M'
df_marca_m = df[df["Marca"].str.startswith("M")]

# Filtrar marcas que terminan por 'e'
df_marca_e = df[df["Marca"].str.endswith("e")]

# Guardar en el fichero "VOLVO.xlsx" el dataframe df_volvo
df_volvo.to_excel("VOLVO.xlsx")

También te puede interesar:

Fechas en Python

Fechas en Python

Fechas Python tiene un módulo llamado datetime que permite trabajar con fechas y horas de forma sencilla. Para usarlo, hay que importarlo al principio …