Pandas: Menghitung Jumlah Data Unik Pada Kolom
Cara menghitung jumlah data unik pada sebuah kolom DataFrame dengan python Pandas
# menghitung jumlah data unik pada kolom Jenis Kelamin
value_counts = df['Jenis Kelamin'].value_counts()
print(value_counts)
df
merupakan DataFrame dari Pandas- Hasilnya adalah data unik beserta jumlahnya, contoh: Laki-Laki = 17, Perempuan = 13
# menghitung jumlah data unik pada kolom ketujuh (index 6)
col = df.iloc[:, 6].value_counts()
# menghitung untuk semua kolom DataFrame
col = df.value_counts()
print(col)
Replace text pada kolom
Jika pada hasil hitung jumlah unik ada yang beda tapi sebetulnya sama, misal beda satu huruf besar dan huruf kecil
Contoh nilai Perempuan
dan perempuan
maka akan dihitung berbeda
# replace kolom Jenis Kelamin
df['Jenis Kelamin'] = df['Jenis Kelamin'].str.replace('perempuan', 'Perempuan')
# replace kolom dengan index 3
df.iloc[:, 3] = df.iloc[:, 3].str.replace('perempuan', 'Perempuan')
Trim text pada kolom
Begitu juga jika ada kata dengan spasi tambahan di awal atau akhir, maka akan dihitung berbeda
# trim kolom Jenis Kelamin
df['Jenis Kelamin'] = df['Jenis Kelamin'].str.strip()
# trim kolom dengan index 3
df.iloc[:, 3] = df.iloc[:, 3].str.strip()