Pandas: Menggabungkan Dua Atau Lebih DataFrame

Contoh koding untuk menggabungkan dua atau lebih DataFrame menggunakan Pandas

import pandas as pd

# asumsi ada DataFrame df1 dan df2

# menggabungkan baris (rows) jadi hasilnya menumpuk ke bawah
df_all = pd.concat([df1, df2], axis=0)

# contoh lebih banyak DataFrame
df_all = pd.concat([df1, df2, df3], axis=0)

# menggabungkan kolom (cols) jadi hasilnya berjejer ke samping
df_all = pd.concat([df1, df2], axis=1)
  • Nilai axis=0 sebagai penanda rows, dan axis=1 untuk cols
  • Jika menggabungkan rows, maka jumlah kolomnya harus sama (tipe datanya juga)
  • Sementara jika menggabungkan cols, maka jumlah barisnya yang harus sama
  • Analogi lainnya misal seperti di Excel, penggabungan rows, maka row akan bertambah ke bawah (artinya jumlah kolomnya harus sama)
  • Penggabungan cols, maka col akan bertambah ke samping (artinya jumlah baris harus sama)
  • Jika tidak, maka nilai antara baris/kolom yang kosong akan diisi dengan NaN