Pandas: Menghitung Jumlah Data Unik Pada Kolom

Cara menghitung jumlah data unik pada sebuah kolom DataFrame dengan python Pandas

# menghitung jumlah data unik pada kolom Jenis Kelamin
value_counts = df['Jenis Kelamin'].value_counts()

print(value_counts)
  • df merupakan DataFrame dari Pandas
  • Hasilnya adalah data unik beserta jumlahnya, contoh: Laki-Laki = 17, Perempuan = 13
# menghitung jumlah data unik pada kolom ketujuh (index 6)
col = df.iloc[:, 6].value_counts()

# menghitung untuk semua kolom DataFrame
col = df.value_counts()

print(col)

Replace text pada kolom

Jika pada hasil hitung jumlah unik ada yang beda tapi sebetulnya sama, misal beda satu huruf besar dan huruf kecil

Contoh nilai Perempuan dan perempuan maka akan dihitung berbeda

# replace kolom Jenis Kelamin
df['Jenis Kelamin'] = df['Jenis Kelamin'].str.replace('perempuan', 'Perempuan')

# replace kolom dengan index 3
df.iloc[:, 3] = df.iloc[:, 3].str.replace('perempuan', 'Perempuan')

Trim text pada kolom

Begitu juga jika ada kata dengan spasi tambahan di awal atau akhir, maka akan dihitung berbeda

# trim kolom Jenis Kelamin
df['Jenis Kelamin'] = df['Jenis Kelamin'].str.strip()

# trim kolom dengan index 3
df.iloc[:, 3] = df.iloc[:, 3].str.strip()