DataFrame adalah struktur data tabular, di mana tiap observasi adalah baris (row) dan tiap variabel adalah kolom.

Beberapa fungsi:

.head() akan menampilkan 5 baris teratas suatu DataFrame

nobel_winners.head()
      name           prize      year
0    M. Curie       Physics      1903
1    A. Einstein    Physics      1921
2    M. Curie       Chemistry    1911
3    W. Heisenberg  Physics      1932
4    W. Golding     Literature   1983

.info() menampilkan nama, tipe data, banyaknya

Komponen DataFrame: values yang akan mengekstrak nilai-nilai data. Ini akan menampilkan data dalam bentuk array 2D NumPy.

Atribut .columns akan menampilkan nama-nama kolom

Atribut .index akan menampilkan label untuk baris.

Mengurutkan (sort) DataFrame dalam kolom tunggal

ini bisa dilakukan dengan fungsi .sort_values()

contoh:

nobel_winners.sort_values(’year’) akan mengurutkan data berdasarkan tahun.

Bisa juga mengurutkan DataFrame berdasakrkan multikolom

Lihat juga referensi untuk fungsi .sort_values dari laman web Pandas:

pandas.DataFrame.sort_values - pandas 1.5.3 documentation

Subsetting DataFrame