どうやらこのCPU占有率低下は他の方も直面してたりする事象っぽいです。ただ、これって自分の場合は長時間学習時のみなんですよね。AutoMLがLightGBMに渡すパラメーターが長時間になると何かが変わって色々な問題が出るのかも。なので長時間学習するのは止める方向で検討します。なので一旦1週間学習も中断しました。
ちょっと色々とGitHubの掲示板なんかで情報あさりながらアイビー先生に質問ぶつけてチャットする中で長時間学習による過学習とかで予測が悪くなるとかもあるとの事でした。それと、ここに機械学習について書き始めた最初の頃にMLContextのインスタンス生成時に指定するシード値の意味が分からないから指定しないって書きましたが、ちょっとだけ理解しました。シード値指定しないとランダムに学習始めるけど、指定すると毎回同じ学習するって事の様です。シード値はInt32らしいので、適切な値を人的に見つけたりってのはかなり現実的ではないと思いますが、ある程度適切な学習時間でシード値指定せずに何度も学習させる事でより良い学習モデルに出会ったらそれを採用するのが適切な感じらしい。
もう随分前に何度か1時間学習をさせて結果を並べた事がありましたが、感覚的にはそういう事の様です。Model Builderの時にデータファイルのサイズから平均的な学習時間の表がありましたが、今のデータ量では30分なのもしかしたら1日やるよりは48回30分学習した方が良いのかも。まあ、実際にはノンストップでは出来ませんってか、まあ、その為のプログラム書けば不可能ではないけど、まあ、それは止めて人力で回数やって行こうかと思います。
0 件のコメント:
コメントを投稿