ここまでの新馬戦と通常用は14項目と60項目でしたが、前にもそろそろネタ切れ的な感じで書いたとは思いますが、今回が最終になると思います。特に新馬戦用は、まあ、絶対に無いかと言われたら無くもないんですよね。例えば、今父、母、父母、は項目として入れてますが、これ以上の血統情報は可能です。しかし、それがどこまで学習に反映されるかは疑問がある。単に複雑にしてって事では手を出す意味は無い。血統で予想する方達はそれこそ3代どころかそれ以上で、インブリードとかも加味してるんだろうとは思いますが...機械学習だから試すのはそれ程の事ではないのですが、期待出来るのかなぁ😔
TensorFlowもまだ続けてますし、今回のファクター追加以外にも学習データの正規化なんかも試そうとしたんですが、簡単な話では無いですね。いや、既に正規化なんかも実装されているので、それ利用して学習前にデータに正規化とかするのはメソッド呼ぶ程度と簡単なんです。しかし、それして学習させた後にそのモデルに予測させるのが若干項目の与え方が理解出来なかったです。例えば、勝率という項目を正規化なのか標準化なんかを施した場合、項目は勝率ではなく別の項目名、例えば標準化勝率とする訳です。そうすると、当たり前といえばまあそうなんですが、予測する際の与える項目も勝率ではなく標準化勝率としなければならない感じなんですが、これ、面倒だから標準化施した項目名もそのまま勝率にしてみるとどうかとか、試すのがコード修正してテストして、検証して結果がどうかとか確認後にダメだったら元に戻す。ああ、こんな状況の為にバージョン管理ソフトも導入すれば楽になるんだとは思うけど、面倒が面倒を呼ぶんですよね。
まあ、ファクター追加も決してそんな余分な作業もしながらでしたので、エラーになった時に何やらかしちゃったかとかもう大変なんです。でも、新馬戦用14→16項目、通常用60→62項目として、CSVの準備をし学習させてます。明日以降の今週末に間に合えば良いかなぁとは思ってますが、先週末も散々な成績で...あっ、今回新たにCSV作成だったので丁度先月終わりまでに延ばしてみました。
0 件のコメント:
コメントを投稿