1. add moving weighted penalization of share count

where is the base weight

where is the risky asset at timestep

where

  1. strip out the price and only try to learn liquidation
    1. reszveny az elejen test env: arfolyam , kezdoreszveny , kulonben sima FBM stepes reward
    2. arfolyam: where , kulonben sima FBM step es reward
  • elso sorban probaljuk nagyobb -re a tanitast, mert lehet hogy kicsi -re nem tudja megismerni az FBM-et

  • rovid T-rol inkeremtalisan tanitjuk hossza T-re, pl

  • lehet-e burn-int vegezni az LSTM-en, tehat pl az elso lepesen keresztul nem kap rewardot csak ismerje fel az FBM-et

  • probaljunk ki -vel dropout-ot az LSTM modulban

  • legyen a batch size egesz szamszorosa az idohorizontnak

  • legyen vegre kiszamolva a market bound