Episodic dan Continuing Task adalah jenis task yang mungkin terjadi dalam Reinforcement Learning.
Episodic Task
Episodic task adalah interaksi antara agent dan environment yang memiliki ending point.
Contoh: Agent yang dilatih untuk memainkan game Atari Breakout. Interaksi berakhir ketika agent menang atau kalah.
Urutan interaksi dari awal hingga akhir disebut episode. Pada akhir episode, Agent dapat mengetahui reward yang diperoleh. Interaksi ini akan dimulai lagi dari awal dan baru, namun dengan tambahan, Agent sudah memiliki pengetahuan dari episode sebelumnya.
Proses ini akan berulang, hingga Agent akan lebih baik mengambil keputusan, untuk mendapatkan cumulative reward yang tinggi.
Pada konteks agent yang memainkan game, maka score tertinggi adalah targetnya.
Continuing Tasks
Continuing task adalah interaksi yang terus menerus tanpa akhir antara agent dan environment.
Contoh: algoritma untuk membeli atau menjual saham. Agent akan terus belajar mengambil keputusan, sambil terus berinteraksi dengan environment. Algoritma untuk tipe continuing task lebih rumit dibanding episodic.
Episodic Task
Episodic task adalah interaksi antara agent dan environment yang memiliki ending point.
Contoh: Agent yang dilatih untuk memainkan game Atari Breakout. Interaksi berakhir ketika agent menang atau kalah.
Urutan interaksi dari awal hingga akhir disebut episode. Pada akhir episode, Agent dapat mengetahui reward yang diperoleh. Interaksi ini akan dimulai lagi dari awal dan baru, namun dengan tambahan, Agent sudah memiliki pengetahuan dari episode sebelumnya.
Proses ini akan berulang, hingga Agent akan lebih baik mengambil keputusan, untuk mendapatkan cumulative reward yang tinggi.
Pada konteks agent yang memainkan game, maka score tertinggi adalah targetnya.
Continuing Tasks
Continuing task adalah interaksi yang terus menerus tanpa akhir antara agent dan environment.
Contoh: algoritma untuk membeli atau menjual saham. Agent akan terus belajar mengambil keputusan, sambil terus berinteraksi dengan environment. Algoritma untuk tipe continuing task lebih rumit dibanding episodic.
Episodic dan Continuing Task
Reviewed by noname needed
on
July 16, 2019
Rating:
No comments: