Episodic dan Continuing Task

Episodic dan Continuing Task adalah jenis task yang mungkin terjadi dalam Reinforcement Learning.

Episodic Task
Episodic task adalah interaksi antara agent dan environment yang memiliki ending point.

Contoh: Agent yang dilatih untuk memainkan game Atari Breakout. Interaksi berakhir ketika agent menang atau kalah.

Urutan interaksi dari awal hingga akhir disebut episode. Pada akhir episode, Agent dapat mengetahui reward yang diperoleh. Interaksi ini akan dimulai lagi dari awal dan baru, namun dengan tambahan, Agent sudah memiliki pengetahuan dari episode sebelumnya.

Proses ini akan berulang, hingga Agent akan lebih baik mengambil keputusan, untuk mendapatkan cumulative reward yang tinggi.

Pada konteks agent yang memainkan game, maka score tertinggi adalah targetnya.

Continuing Tasks
Continuing task adalah interaksi yang terus menerus tanpa akhir antara agent dan environment.

Contoh: algoritma untuk membeli atau menjual saham. Agent akan terus belajar mengambil keputusan, sambil terus berinteraksi dengan environment. Algoritma untuk tipe continuing task lebih rumit dibanding episodic.
Episodic dan Continuing Task Episodic dan Continuing Task Reviewed by noname needed on July 16, 2019 Rating: 5

No comments:

Powered by Blogger.