Cara Mengurutkan Data dengan Sort Values di Pandas

Bagaimana cara mengurutkan data dengan sort values di Pandas? Yuk, pelajari selengkapnya di sini!
RevoU Staff
May 31, 2024
5
min read

Mau Belajar

Data Analytics

?

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!
DAFTAR FULL PROGRAMCOBA COURSE GRATIS

Overview

Fungsi sort_values() dalam Pandas digunakan untuk mengurutkan data dalam DataFrame berdasarkan satu atau lebih kolom, baik dalam urutan menaik maupun menurun. Ini adalah alat yang efektif untuk mengorganisasi data sehingga memudahkan analisis dan pengambilan keputusan berbasis data.

Kemampuan mengurutkan informasi dengan cepat dan tepat adalah kunci utama yang membedakan analisis biasa dengan analisis yang efektif.

Pandas, sebuah toolkit yang tidak terpisahkan dari ekosistem Python, menawarkan metode sort_values(). Metode ini memungkinkan data analyst tidak hanya mengatur ulang data berdasarkan nilai, tetapi juga memudahkan untuk mengekstrak insight penting.

Artikel ini akan mengajak kamu menjelajahi berbagai fungsi sort_values(), membuka berbagai cara dalam mengelola dan memahami dataset-mu. Dari menangani nilai yang hilang sampai melakukan pengurutan berlapis.

Ingin tahu bagaimana semua ini bisa dilakukan dengan beberapa baris kode saja? Yuk, simak!

Cara Menggunakan Metode sort_values() di Pandas dalam Ascending Order

Metode sort_values() di Pandas adalah cara yang efisien untuk mengurutkan data dalam DataFrame berdasarkan satu atau lebih kolom.

Metode ini berguna ketika kamu perlu melihat data dalam urutan tertentu, baik menaik (ascending) maupun menurun (descending). Pengurutan data ini membantu dalam melakukan perbandingan, menyusun laporan, atau bahkan pengambilan keputusan berdasarkan data yang terorganisasi.

Untuk mengurutkan data dalam urutan menaik, langkah-langkahnya adalah sebagai berikut:

  • Impor Pandas: pastikan Pandas telah diimpor ke dalam skrip Python kamu dengan menggunakan perintah import pandas as pd.
  • Buat DataFrame: kamu bisa membuat DataFrame dari data yang sudah ada atau data baru. Sebagai contoh, mari kita buat DataFrame dengan dataset berikut.
  • Panggil sort_values(): gunakan metode sort_values() untuk mengurutkan DataFrame berdasarkan kolom 'Penjualan'. Secara default, sort_values() mengatur data dalam urutan menaik.

Output akan menunjukkan DataFrame yang telah diurutkan dari penjualan terkecil hingga terbesar:

Cara Menggunakan Metode sort_values() di Pandas dalam Descending Order

Mengurutkan data dalam urutan menurun (descending order) menggunakan metode sort_values() di Pandas hampir sama dengan mengurutkan data dalam urutan menaik, namun dengan tambahan parameter yang menentukan arah pengurutan.

Metode ini berguna ketika kamu ingin melihat item dengan performa terbaik di bagian atas list, seperti dalam kasus analisis penjualan teratas, mengevaluasi skor tertinggi, atau situasi serupa lainnya.

Berikut langkah-langkah untuk mengurutkan DataFrame dalam urutan menurun (descending):

  • Impor pandas: Pastikan kamu telah mengimpor library pandas dengan import pandas as pd
  • Buat atau siapkan DataFrame: Gunakan DataFrame yang sudah ada atau buat satu sebagai contoh. Kita akan menggunakan DataFrame yang sama dari contoh sebelumnya.

Gunakan sort_values() dengan parameter 'ascending=False': untuk mengurutkan data dalam urutan menurun, kamu perlu menambahkan parameter ascending dengan nilai False dalam metode sort_values(). Dikarenakan nilai ascending adalah False, kita tidak akan mengurutkan secara ascending.

Output dari kode di atas akan menghasilkan DataFrame yang diurutkan dari penjualan tertinggi ke terendah:

FAQs (Frequently Asked Questions)

Apa yang terjadi jika kolom yang diurutkan mengandung nilai NaN?

Saat kamu menggunakan sort_values() di Pandas untuk mengurutkan DataFrame dan kolom yang diurutkan mengandung nilai NaN (not a number), pengurutan tersebut akan secara default menempatkan nilai NaN di posisi terakhir jika urutan pengurutannya adalah ascending (menaik).

Sebaliknya, jika urutan pengurutannya adalah descending (menurun), nilai NaN akan ditempatkan di posisi terdepan.

Ini terjadi karena NaN dianggap sebagai nilai yang tidak terdefinisi. Oleh karenanya, nilai ini ditempatkan di posisi yang tidak mengganggu urutan nilai numerik yang valid.

Namun, kamu bisa mengatur posisi dari nilai NaN dengan menggunakan parameter na_position dalam sort_values(). Parameter ini menerima dua nilai:

  • 'last': ini adalah nilai default, yang menempatkan NaN di akhir.
  • 'first': menempatkan NaN di awal, terlepas dari apakah urutannya ascending atau descending.

Apa perbedaan antara sort_values() dan sort_index() di pandas?

Dalam Pandas, sort_values() dan sort_index() adalah dua metode yang sering digunakan untuk mengurutkan data, tetapi keduanya beroperasi dalam cara yang berbeda.

sort_values() digunakan untuk mengurutkan DataFrame berdasarkan nilai dalam satu atau lebih kolom.

Misalnya, jika kamu memiliki DataFrame dengan kolom 'Penjualan', kamu dapat mengurutkannya berdasarkan kolom tersebut untuk melihat data dari yang terkecil hingga terbesar atau sebaliknya.

Sementara sort_index() dipakai untuk mengurutkan DataFrame berdasarkan indeksnya, bukan berdasarkan nilai kolom. Ini berguna ketika indeks DataFrame memiliki arti penting atau setelah perubahan yang membuat indeks tidak berurutan.

Pada dasarnya, kedua metode ini sangat penting dalam manipulasi data dan sering digunakan dalam berbagai situasi analisis data. Mereka memungkinkan analis untuk mengatur ulang data dilakukan dengan cepat sesuai kebutuhan analisis tertentu.

Bagaimana cara mengurutkan DataFrame berdasarkan lebih dari satu kolom dengan urutan berbeda di Pandas?

Untuk mengurutkan DataFrame berdasarkan lebih dari satu kolom dan mengatur urutan pengurutan yang berbeda untuk masing-masing kolom, kamu dapat menggunakan metode sort_values() dan menyediakan parameter by.

Metode ini berfungsi untuk menentukan kolom yang ingin diurutkan serta ascending agar menentukan urutan pengurutan.

RevoU Staff
Kickstart your career in tech with RevoU!

Masih ragu? Coba dulu 3 hari, GRATIS
di Full-Stack Trial Class!

Rasakan pengalaman belajar di RevoU Full-Stack Program: Kelas 100% LIVE, Mini portofolio lewat hands-on assignment, Bimbingan Team Lead & small group discussion. Kalau cocok, kamu bisa lanjut daftar Full Program dengan kesempatan Fast-Track (skip semua tes seleksi masuk, langsung ke tahap akhir!)

Masih ragu? Coba dulu 3 hari, GRATIS
di Full-Stack Trial Class!

Rasakan pengalaman belajar di RevoU Full-Stack Program: Kelas 100% LIVE, Mini portofolio lewat hands-on assignment, Bimbingan Team Lead & small group discussion. Kalau cocok, kamu bisa lanjut daftar Full Program dengan kesempatan Fast-Track (skip semua tes seleksi masuk, langsung ke tahap akhir!)

Masih ragu? Coba dulu 3 hari, GRATIS
di Full-Stack Trial Class!

Rasakan pengalaman belajar di RevoU Full-Stack Program: Kelas 100% LIVE, Mini portofolio lewat hands-on assignment, Bimbingan Team Lead & small group discussion. Kalau cocok, kamu bisa lanjut daftar Full Program dengan kesempatan Fast-Track (skip semua tes seleksi masuk, langsung ke tahap akhir!)

Artikel Lainnya

Mau belajar

Data Analytics

?

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!
Daftar Isi

Mulai karirmu dalam

Data Analytics

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!

Mau Belajar

Data Analytics

?

Belajar di RevoU! Dapatkan skill digital paling in-demand langsung dari praktisi terbaik di bidangnya. Kelas online 100% LIVE, 1:1 career coaching, dan akses ke Community Hub dengan 6000+ member selamanya untuk support perkembangan karir kamu!

DAFTAR FULL PROGRAM

Mau Belajar

Data Analytics

?

Cara Mengurutkan Data dengan Sort Values di Pandas

Bagaimana cara mengurutkan data dengan sort values di Pandas? Yuk, pelajari selengkapnya di sini!
RevoU Staff
May 31, 2024
5
min read

Overview

Fungsi sort_values() dalam Pandas digunakan untuk mengurutkan data dalam DataFrame berdasarkan satu atau lebih kolom, baik dalam urutan menaik maupun menurun. Ini adalah alat yang efektif untuk mengorganisasi data sehingga memudahkan analisis dan pengambilan keputusan berbasis data.

Kemampuan mengurutkan informasi dengan cepat dan tepat adalah kunci utama yang membedakan analisis biasa dengan analisis yang efektif.

Pandas, sebuah toolkit yang tidak terpisahkan dari ekosistem Python, menawarkan metode sort_values(). Metode ini memungkinkan data analyst tidak hanya mengatur ulang data berdasarkan nilai, tetapi juga memudahkan untuk mengekstrak insight penting.

Artikel ini akan mengajak kamu menjelajahi berbagai fungsi sort_values(), membuka berbagai cara dalam mengelola dan memahami dataset-mu. Dari menangani nilai yang hilang sampai melakukan pengurutan berlapis.

Ingin tahu bagaimana semua ini bisa dilakukan dengan beberapa baris kode saja? Yuk, simak!

Cara Menggunakan Metode sort_values() di Pandas dalam Ascending Order

Metode sort_values() di Pandas adalah cara yang efisien untuk mengurutkan data dalam DataFrame berdasarkan satu atau lebih kolom.

Metode ini berguna ketika kamu perlu melihat data dalam urutan tertentu, baik menaik (ascending) maupun menurun (descending). Pengurutan data ini membantu dalam melakukan perbandingan, menyusun laporan, atau bahkan pengambilan keputusan berdasarkan data yang terorganisasi.

Untuk mengurutkan data dalam urutan menaik, langkah-langkahnya adalah sebagai berikut:

  • Impor Pandas: pastikan Pandas telah diimpor ke dalam skrip Python kamu dengan menggunakan perintah import pandas as pd.
  • Buat DataFrame: kamu bisa membuat DataFrame dari data yang sudah ada atau data baru. Sebagai contoh, mari kita buat DataFrame dengan dataset berikut.
  • Panggil sort_values(): gunakan metode sort_values() untuk mengurutkan DataFrame berdasarkan kolom 'Penjualan'. Secara default, sort_values() mengatur data dalam urutan menaik.

Output akan menunjukkan DataFrame yang telah diurutkan dari penjualan terkecil hingga terbesar:

Cara Menggunakan Metode sort_values() di Pandas dalam Descending Order

Mengurutkan data dalam urutan menurun (descending order) menggunakan metode sort_values() di Pandas hampir sama dengan mengurutkan data dalam urutan menaik, namun dengan tambahan parameter yang menentukan arah pengurutan.

Metode ini berguna ketika kamu ingin melihat item dengan performa terbaik di bagian atas list, seperti dalam kasus analisis penjualan teratas, mengevaluasi skor tertinggi, atau situasi serupa lainnya.

Berikut langkah-langkah untuk mengurutkan DataFrame dalam urutan menurun (descending):

  • Impor pandas: Pastikan kamu telah mengimpor library pandas dengan import pandas as pd
  • Buat atau siapkan DataFrame: Gunakan DataFrame yang sudah ada atau buat satu sebagai contoh. Kita akan menggunakan DataFrame yang sama dari contoh sebelumnya.

Gunakan sort_values() dengan parameter 'ascending=False': untuk mengurutkan data dalam urutan menurun, kamu perlu menambahkan parameter ascending dengan nilai False dalam metode sort_values(). Dikarenakan nilai ascending adalah False, kita tidak akan mengurutkan secara ascending.

Output dari kode di atas akan menghasilkan DataFrame yang diurutkan dari penjualan tertinggi ke terendah:

FAQs (Frequently Asked Questions)

Apa yang terjadi jika kolom yang diurutkan mengandung nilai NaN?

Saat kamu menggunakan sort_values() di Pandas untuk mengurutkan DataFrame dan kolom yang diurutkan mengandung nilai NaN (not a number), pengurutan tersebut akan secara default menempatkan nilai NaN di posisi terakhir jika urutan pengurutannya adalah ascending (menaik).

Sebaliknya, jika urutan pengurutannya adalah descending (menurun), nilai NaN akan ditempatkan di posisi terdepan.

Ini terjadi karena NaN dianggap sebagai nilai yang tidak terdefinisi. Oleh karenanya, nilai ini ditempatkan di posisi yang tidak mengganggu urutan nilai numerik yang valid.

Namun, kamu bisa mengatur posisi dari nilai NaN dengan menggunakan parameter na_position dalam sort_values(). Parameter ini menerima dua nilai:

  • 'last': ini adalah nilai default, yang menempatkan NaN di akhir.
  • 'first': menempatkan NaN di awal, terlepas dari apakah urutannya ascending atau descending.

Apa perbedaan antara sort_values() dan sort_index() di pandas?

Dalam Pandas, sort_values() dan sort_index() adalah dua metode yang sering digunakan untuk mengurutkan data, tetapi keduanya beroperasi dalam cara yang berbeda.

sort_values() digunakan untuk mengurutkan DataFrame berdasarkan nilai dalam satu atau lebih kolom.

Misalnya, jika kamu memiliki DataFrame dengan kolom 'Penjualan', kamu dapat mengurutkannya berdasarkan kolom tersebut untuk melihat data dari yang terkecil hingga terbesar atau sebaliknya.

Sementara sort_index() dipakai untuk mengurutkan DataFrame berdasarkan indeksnya, bukan berdasarkan nilai kolom. Ini berguna ketika indeks DataFrame memiliki arti penting atau setelah perubahan yang membuat indeks tidak berurutan.

Pada dasarnya, kedua metode ini sangat penting dalam manipulasi data dan sering digunakan dalam berbagai situasi analisis data. Mereka memungkinkan analis untuk mengatur ulang data dilakukan dengan cepat sesuai kebutuhan analisis tertentu.

Bagaimana cara mengurutkan DataFrame berdasarkan lebih dari satu kolom dengan urutan berbeda di Pandas?

Untuk mengurutkan DataFrame berdasarkan lebih dari satu kolom dan mengatur urutan pengurutan yang berbeda untuk masing-masing kolom, kamu dapat menggunakan metode sort_values() dan menyediakan parameter by.

Metode ini berfungsi untuk menentukan kolom yang ingin diurutkan serta ascending agar menentukan urutan pengurutan.

RevoU Staff
Kickstart your career in tech with RevoU!
Menu