Y. M

Last seen: 5 years ago | Active since 2020

Followers: 0 Following: 0

Statistics

View badges

Feeds

Question

強化学習の行動選択について
強化学習より得られた行動がどういうものだったのか、状態sと照らし合わせて分析したいのですが、学習が終了した後に確認することは可能でしょうか。また、どういう行動が選ばれたのか出力することは可能でしょうか。

5 years ago | 0 answers | 0

0

answers

Question

強化学習の報酬等をファイルに出力
強化学習を行う中、 1エピソード毎に報酬やステップ数といったデータをファイルに出力したいのですが可能でしょうか。 trainingOptions = rlTrainingOptions(... 'MaxEpisodes',500,... ...

5 years ago | 0 answers | 0

0

answers

Question

強化学習におけるrlTrainingOptionsについての質問
現在DQNを構築し、他のソフトを環境として強化学習を実行しています。環境側で1エピソード分の作業が終了した後、次のエピソードが始まるまでに15秒ほど時間がかかるのですが、その間にmatlab側では100エピソードほど進んでしまいます。そ...

5 years ago | 0 answers | 0

0

answers

Question

ファイル名の一部を変更
現在実行中のコードにてループ毎に、 file1,file2...とファイルの生成が行われています。（ループカウント1：file1.txt、ループカウント２：file2.txt...という感じです）ここで、ループカウント２のときはfile1を、...

5 years ago | 1 answer | 0

1

answer

Question

強化学習で環境を別ソフトに置き換えた場合にエピソード数がずれる問題
現在環境を別ソフトとしてMATLABと連成させて学習をさせようとしているのですが、環境側が1エピソード進んだ後、MATLABのエージェント側を起動させようとすると、 MATLABが全エピソード分勧めようとしてしまい、エラーが発生してしまいます。理...

5 years ago | 1 answer | 0

1

answer

Question

強化学習におけるエピソード数の変数としての取得方法
強化学習用のコードを書いている途中で、 ε-greedy法の設定を以下のようにしたいと考えています。 if episode<400 agentOptions.EpsilonGreedyExploration=(episode*(-0.0012...

6 years ago | 1 answer | 0

1

answer

Question

離散行動を複数持つQ関数の作成
rlFiniteSetSpec を使い、複数の離散行動を持つQ関数を作成したいのですが、 InputとDimensionの数が合わずエラーが返されてしまいます。現在コードは下記のようにしているのですが、 DimensionをInputの数に合わせる...

6 years ago | 1 answer | 0

1

answer

Question

エラー　関数または変数'featureInputLayer'が認識されません。
Rainforcement Learning ToolboxとDeep Learnig Toolboxを先日インストールし、 DQNエージェントを作成しようとしたところ、 ”関数または変数'featureInputLayer'が認識されません。” と...

6 years ago | 1 answer | 0

1

answer

Question

テキストファイルから特定の行、列の読み込み
テキストファイルから特定のデータ（x行,y列目）のデータの取り出しを行いたいときはどのようにすればよろしいでしょうか。

6 years ago | 1 answer | 0

1

answer