Résolue

Comment splitter les valeurs de chaque colonne

# pandas

Bonjour,

Il y a parfois des cellules où on a plusieurs réalisateurs, donc on a potentiellement des noms de réalisateurs en double dans notre liste globale -> comment peut-on "splitter" cette info? Peut-on le faire via pandas directement?

Merci d'avance!

Bonjour David,


tu peux faire un truc de ce genre.


import pandas as pd

df = pd.DataFrame({"real": ["Luc Besson, James Cameron",
                            "Jean Dupond",
                            "David Lee",
                            "Luc Besson"],
                   "Film": ["Film1", "Film2", "Film3", "Film4"]})

realisateur_list = df["real"].apply(lambda elem: elem.split(","))

realisateurs = []

for sublist in realisateur_list:
    for item in sublist:
        realisateurs.append(item)

# pour rendre unique on utilise un
realisateurs = list(set(realisateurs))


A ta disposition si ce n'est pas clair.

Bonsoir Pierre-André,

Et bien c'est très clair, merci. Il faut que je retienne cette méthode apply avec lambda!


Inscris-toi

(c'est gratuit !)

Inscris-toi

Tu dois créer un compte pour participer aux discussions.

Créer un compte

Rechercher sur le site

Formulaire de contact

Inscris-toi à Docstring

Pour commencer ton apprentissage.

Tu as déjà un compte ? Connecte-toi.