3.4 Pemrograman The iLearning dan Reward Algoritma
Untuk menguji sistem, disadari perangkat lunak dengan Visual Studio 6.0 dan Microsoft Agent Teknologi.
Algoritma yang digunakan untuk mempelajari agen sistem iLearning adalah algoritma reward berdasarkan Qlearning
algoritma. Teknik ini dimulai dengan estimasi Q awal (s, a) untuk setiap pasangan negara-aksi.
Ketika dipilih tindakan dalam s negara, sistem menerima hadiah R (s, a) dan teramati pada
negara berikutnya s
0
. Q-algoritma pembelajaran (Watkins, 1989) [11] menghargai nilai fungsi negara-tindakan
sebagai berikut:
Q (s, a) = Q (s, a) + × α (R (s, a) + γ × mina
0Q (s
0
, a
0
) -Q (s, a))
di mana α ∈ (0,1) adalah tingkat pembelajaran, γ ∈ (0,1) adalah discount factor dan s
0
adalah negara mencapai dari negara
s mengeksekusi aksi a. [1] [5] peta konseptual tentu saja mendefinisikan ruang negara sistem.
Seorang siswa dengan gaya belajar tertentu dengan studinya di node dari peta konseptual dan ia
diperiksa dan menerima catatan selama proses instruksi. Tujuan dari sistem ini adalah untuk memaksimalkan
hasil siswa pada evaluasi yang berbeda. Kontribusi penulis adalah adaptasi ini
algoritma untuk agen pedagogis.
Reward yang didirikan melalui evaluasi siswa dalam node dari peta konseptual dan
didefinisikan menurut persamaan:
R (s, a) = catatan
atau
R ( s, a) = catatan × pnote + apriorknowledge × pbase
waktu
di mana: catatan adalah skor yang diterima oleh mahasiswa di / nya evaluasi di sebuah simpul dari peta konseptual,
apriorknowledge adalah skor yang diterima oleh siswa di evaluasi awal (sebelum mulai mengajar
saja jika siswa mulai kursus atau rata-rata skor yang diterima oleh siswa di evaluasi
di node sebelum node saat ini di peta konseptual), pnote dan pbase adalah parameter.
algoritma yang digunakan adalah:
Sistem Software untuk Belajar online Diterapkan di Bidang Ilmu Komputer 89
1. mulai dengan array Q untuk semua kemungkinan pasangan negara-tindakan. Setiap item dari array diinisialisasi dengan
nol atau nilai kecil.
2. kebijakan optimal diinisialisasi dengan kebijakan diawasi. Qoptim diinisialisasi dengan Q.
3. untuk setiap siswa peta konseptual dilalui dan Q array yang dihitung.
4. Q dianalisis
Sedang diterjemahkan, harap tunggu..