Pada tahap terakhir, LT tersebut dipangkas sesuai dengan fungsi biaya kompleksitas minimal, yang bergantung pada ukuran pohon dan kesalahan kesalahan klasifikasi. Kesalahan kesalahan klasifikasi diperkirakan oleh sepuluh kali lipat dalam cross-validasi CART. Dataset secara acak dibagi menjadi sepuluh subset. Salah satu subset digunakan sebagai dataset pengujian independen, sementara sembilan lainnya subset digunakan sebagai dataset pelatihan. Prosedur pohon tumbuh dan pemangkasan diulang sepuluh kali, setiap kali dengan satu dari sepuluh himpunan bagian yang berbeda yang digunakan sebagai set pengujian. Kesalahan kesalahan klasifikasi dihitung sebagai persentase kasus kesalahan klasifikasi rata-rata atas semua sepuluh subset.
Sedang diterjemahkan, harap tunggu..
