Data Dunia Nyata:
- Jangan: Bergantung sepenuhnya pada data sintetik atau rawak untuk menguji fungsi pandas.
- Lakukan: Gunakan contoh data dunia nyata untuk memahami dan mengaplikasikan fungsi pandas dengan lebih baik.
Penanda aras:
- Jangan: Anggap satu kaedah adalah lebih cepat secara universal.
- Lakukan: Sentiasa menanda aras pelbagai kaedah untuk menentukan yang mana paling cekap untuk set data anda.
Rantaian:
- Jangan: Menulis rantaian yang panjang dan rumit yang sukar untuk didebug.
- Lakukan: Gunakan rantaian sebagai resipi langkah demi langkah untuk manipulasi data, memastikan setiap langkah jelas.
Pelbagai Kaedah:
- Jangan: Melekat pada satu kaedah tanpa meneroka alternatif.
- Lakukan: Fahami bahawa pandas sering menyediakan pelbagai cara untuk mencapai hasil yang sama. Terokai dan pilih yang terbaik untuk tugas anda.
Mengendalikan Data Hilang:
- Jangan: Abaikan data yang hilang.
- Lakukan: Gunakan kaedah seperti
.fillna()
,.dropna()
, dan.interpolate()
untuk mengendalikan data yang hilang dengan sewajarnya.
Data Jenis Konsisten:
- Jangan: Campurkan jenis data dalam satu lajur.
- Lakukan: Pastikan lajur mempunyai jenis data yang konsisten untuk prestasi yang lebih baik dan kurang ralat.
Gunakan Operasi Vektor:
- Jangan: Bergantung berat pada gelung Python untuk operasi.
- Lakukan: Manfaatkan operasi vektor bawaan pandas untuk prestasi yang lebih baik.
Elakkan .apply()
pada Data Besar:
- Jangan: Gunakan
.apply()
tanpa pilih kasih, terutamanya pada set data besar. - Lakukan: Cari alternatif vektor atau fungsi bawaan yang dapat mencapai hasil yang sama dengan lebih cepat.
Penggunaan Memori:
- Jangan: Membebankan memori dengan DataFrame besar tanpa pertimbangan.
- Lakukan: Pantau penggunaan memori dan pertimbangkan menggunakan jenis data seperti ‘category’ untuk lajur string dengan beberapa nilai unik.
Pengeindeksan:
- Jangan: Abaikan kuasa pengeindeksan pandas.
- Lakukan: Gunakan
.loc
dan.iloc
untuk pemilihan dan manipulasi data yang cekap.