2024/08/29

外部プロセスへのファクター引渡し

Copilotに質問ぶつけたら3つの方法があると言われました。

  1. JSONを使用する方法
  2. ファイルを使用する方法
  3. 名前付きパイプを使用する方法

それぞれに特徴はあるものの基本はJSONを使う感じかな。JSONはテキスト形式だからシンプルに行える利点があるって事の様です。

string jsonString = JsonSerializer.Serialize(myClassInstance);

としてシリアライズして

var myClassInstance = JsonSerializer.Deserialize<MyClass>(jsonString);

としてディシリアライズかな。名前付きパイプは外部プロセスを常時稼働させて頻繁に使う場合には良いのかもですが、今回はパスかな。

2024/08/27

ポップコーン

先月amazonで見付けて定期便に追加してたKIRKLAND(カークランド) カークランド バター MICROWAVE ポップコーン 8袋はもう10年以上前に国内でも発売されてた類似品で確か森永かどこかが発売してたんですが、少し後に消えてました。レンジで簡単にチンして出来立てのポップコーンが出来るものなんですが、気に入ったので最初は2カ月毎に指定してたんですが毎月に変更。しかし、今月の定期便には欠品との事で届かずorz 再入荷予定は不明な為、

  • 【国内正規品】maruhiro ポップコーンメーカー 【電子レンジでチンするだけ/簡単折りたたみ収納/家庭用電子レンジ調理器/簡単丸洗い/シリコン製】国内メーカー(ビビットレッド) 2,990円-500円(クーポン)-1,437円(amazonポイント)=1,053円
  • クローバー ポップコーン原料豆業務用 1kg 747円
  • マコーミック MC ポテトシーズニング バター醤油 350g(シャカシャカポテト) 785円
の3点を購入。合計2,585円のお買い物です。容器は今回購入してしばらくは利用可能かと思います。原料豆はこの容器で20回分だったかと思います。シーズニングはどの程度使うのか不明でしたが、これらは3カ月毎の定期便に追加。12~13週(?)って事で1~2回/週で使い切る感じですね。もし、シーズニングも20回で使い切るとして747+785=1,532/20=76.6円/回です。カークランドの1袋も100円未満でしたのでまあ量が違うとは思うけど、まずまずかなぁ。

実際に作ってみるとってか容器の裏にも書かれてますが1回40gか80gらしい。シーズニングは味はまあ悪くは無い感じではあるものの、適量も不明だし、粉なんですが、当然食べる時にパラパラ落ちる感じがする。あっ、好みでそもそもポップコーン作る際に油を入れるとなってましたが、健康志向(?)で油無にしました。原料豆のレビューでそのままでも甘みが的なのがあった気もしますが、自分は感じませんでした。油使えばもう少しシーズニングも付着しやすいかもですが油無にします。で、シーズニングは定期便からは外します。ちと別フレーバーも試したい気もするし、そもそもなかなか減らないかも。

新たな順位フルCKの学習

相変わらず先週末の実馬券は不調です。ただ、先週末は土日共日勤で仕事でしたので、前夜に予想して早朝投票して出勤だったりしましたので、土曜日は全く投票せず、日曜日は少々って程度にしてました。日曜日に帰宅してから新たな学習モデルを使っての順位フルCK用CSV出力指示して就寝。3時間半程度で出力された様ですが、月曜日の朝に終わっている事を確認後に一旦PCを休ませて今回の3日間学習をスタートさせました。そろそろ最初の24時間が終わりますが、前回とは違いここまで既に20トライアルこなしてます。長い物は4時間程度のトライアルはあった様ですが、それ以外は30分~1時間程度な感じです。ここまでの最適RMSEは既に前回を超えて3.6386となってますが、木曜日朝までの学習でどこまで行くのか、またはこれ以上は出ないのかは全く予測出来ません。今週末には少しは良い物が仕上がっていると助かります。

7月1日~先週末までの比較すると

  • ShinbaTimeCK
    60R リリース 個人用
    単勝 28.33%(105.83%) 21.67%(115.83%)
    複勝 50.00%(75.33%) 46.67%(76.17%)
    枠連 12.82%(62.82%) 15.38%(83.85%)
    馬連 6.67%(59.50%) 8.33%(77.50%)
    ワイド 16.67%(66.00%) 20.00%(58.50%)
    馬単 1.67%(37.67%) 1.67%(11.00%)
    三連複 3.33%(67.17%) 3.33%(20.50%)
    三連単 0.00%(0.00%) 0.00%(0.00%)
    総合 50.00%(59.13%) 48.33%(54.12%)
  • SouhaTimeCK
    60R リリース 個人用
    単勝 18.42%(79.34%) 22.91%(74.71%)
    複勝 47.11%(83.81%) 54.39%(84.88%)
    枠連 8.80%(71.52%) 11.98%(89.34%)
    馬連 6.21%(55.22%) 8.99%(63.10%)
    ワイド 17.13%(67.11%) 21.84%(77.64%)
    馬単 3.43%(62.59%) 4.93%(53.04%)
    三連複 4.07%(45.31%) 5.57%(72.33%)
    三連単 0.43%(7.75%) 1.71%(70.09%)
    総合 48.61%(58.89%) 56.10%(72.89%)

まあ、リリースに添付してる学習モデルは取り急ぎ学習させたものでもあるので個人で使用しているモデルの方が成績良いのは当然の事なんですが新馬戦用に関していうと選択は微妙な感じですね。個人用は現在Model Builderで学習させてますので拡張子が違うので次回リリース時に両方同胞してユーザー様に選択してもらうのも有かもですね。

追記 2024.8.28 9:05
もう少しで48時間って感じですが、ここまで35トライアルなのでこの24時間は若干ペースダウンしてる。ここまでの最適RMSE 3.5412なので少しは進んだので無駄ではなさそう?今晩夜勤なので明日帰宅後に終わる。週末は台風も気になるので長時間学習中じゃなくて済みそうです。まっ、そもそも競馬が行われるか疑問がありますけどね。

追記 2024.8.29 9:42
72時間学習が終わり最終的には最適RMSEは3.4491でした。52トライアルが行われました。検証試みたのですがいつもの学習モデルが大きいとでる奴が出て検証出来ずorz 学習ファイルは59.7MBしかないのに😭

追記 2024.8.29 14:35
|--------------------------------------------------------------------|
|                          Experiment Results                        |
|--------------------------------------------------------------------|
|                               Summary                              |
|--------------------------------------------------------------------|
|ML Task: regression                                                 |
|Dataset: E:\My Project\MBJuniFullCK\RaceJuniFullCK2004_202406.csv   |
|Label : Juni                                                        |
|Total experiment time : 259223.0000 Secs                            |
|Total number of models explored: 53                                 |
|--------------------------------------------------------------------|
|                        Top 5 models explored                       |
|--------------------------------------------------------------------|
|      Trainer                             RMSE       Duration       |
|--------------------------------------------------------------------|
|51    LightGbmRegression                  3.4991     3400.6180      |
|44    LightGbmRegression                  3.5012     3131.3600      |
|40    LightGbmRegression                  3.5110     3092.9730      |
|37    LightGbmRegression                  3.5163     2517.1670      |
|46    LightGbmRegression                  3.5168     3089.5580      |
|--------------------------------------------------------------------|
72時間学習をModel Builderで行った時のトップ5なんですが、最終的な最適RMSEの学習モデル以外は保存されない為、この長時間学習が全てパーになりました。せめて次点以降も保存されていれば利用が出来てそれなりの検証結果だったかもなのですが、それすら分かりません。自分が作ったAutoMLではそんな思いをしないで済む様に途中の学習モデルも保存してます。例えば上の様な場合にはRaceJuniFullCK259200_51.zip、RaceJuniFullCK259200_44.zip、RaceJuniFullCK259200_40.zip、etc.
それと、この学習モデルのロード時のエラーなんですが、メモリ不足ってエラーが出てるんですが、64GBもメモリを積んであるのに高々100MB程度の学習モデルのロードでって少し考え辛く、まあ、ML.NETの有志にバグ認定して頂いて修正される方向ではあるんですが、もしかすると、アプリがJV-Linkが64bit対応してない為に32bitアプリとしてリリースしてるんですが、これ、JV-Linkが64bit対応してアプリも64bitアプリとしてリリースすれば動く可能性もあるんですよね。なのでもしかすると現在は学習時は外部アプリを64bit化してあり、そこで学習させてるんですが、予測時にも予測用の64bit版の外部アプリを作って予測させて結果を元のアプリで表示する様にすれば行けるのかも思ってみたり...ただ、その為には予測に必要なファクターをどうやって渡して、予測結果をどうやって受けるかとかも考える必要があり、単純には実現出来ないです。今の外部での学習は単純に学習用CSVファイルのパスを渡すだけで済んでますので、受け渡しに必要な全てのファクターを一時的にファイルにして渡し、結果もファイルとして受ける様にするとかかな。不可能ではないので検討してみるかも。

2024/08/25

iPad 10.9インチ 第10世代 Wi-Fi 64GB 2022年秋モデル

少し前に娘が何やらタブレットを持っているので「それ何?」って聞くと「買った」と言われ、いやいや、別にどこかで盗んで来たとは思ってないんだけどと思いながら「それは分かってるけど、何?」と確認すると「iPad」とまあそっけない返事でした。

その昔、ああっ、このPC購入時の6年前に購入したショップの店頭にiPadが売ってたので購入して娘に「使う?」って渡したが、結局使わないって事で自分が少しの間使ってました。当時してたMMOで2垢作ってiPhoneとiPadでパーティ組んでとかしたり、入院時に病院のTVとか有料だし、普通にどこでもDIGAとかでテレビ見たり重宝しました。

現時点でiPhone XS Maxの自分とiPhone XSの妻なので、来月発表・発売になるiPhone 16に乗換える予定なんですが、妻がたびたび居間のテレビ見ながら寝落ちするのをあまりよく思ってない自分だったりして、その回避策として妻の部屋にテレビをとも考えてたんですが、配置位置なんかもイメージ出来ずな部屋なので少し躊躇してたんです。で、テレビに固執しなくてもiPadなら妻が大好きな孫の動画なんかもiPhoneよりは大画面なiPadで見れるし、テレビだってどこでもディーガでリアルタイムを含め録画だって見れますので...ああっ、ちょいちょいYouTubeなんかも見たりするし、アマプラも見るから全く問題無いんじゃないかと思い、急遽一昨日の金曜日にアップルで発注して本日到着しました。

所謂ホームボタンが無いiPadなので生体認証が何なのか今一理解してませんでしたが、電源ボタンで指紋認証って事で、この認証に苦労ましました。基本妻が使うものなので妻に指で指紋認証登録させたんですが、やり始めは普通にiPadの正面から電源ボタンに指乗せて認証させようとしてましたが、それだとボタン全体を覆う感じにならないので、結局側面側からボタン全体を覆う感じに指を乗せる様にしてどうにか行きました。

諸々の設定はiPadの初期設定中に近くに抱き合わせるiPhoneを置いておくと認識してその設定を引き継ぐ感じで特に何もしなくても良い感じ。逆にあまり引き継いで欲しくない場合とかだと若干苦労しそうですね。

追記 2024.8.26 10:55
購入金額書いてなかったけど、普通にアップルストアで購入したので定価58,800円です。前のiPadは3万円ちょいでしたので、これが単純に円安の影響かなぁ。まあ、アップルストアの定価と違ってショップのしかもセールで安かったってのもありますけどね。

追記 2024.8.26 15:52
当初は液晶にフィルムを貼らない予定でしたが、落としたりした時の少しでも役に立てばとの思いで急遽楽天で当日発送って事で昨日職場で昼休みに発注。確かに当日発送にはなってますが、まあ、自分が悪いんだとは思うけど、仮に当日発送だとしてもそもそも山口県からこちらに翌日配送になる保証は当然無い!関東からならまだしもねぇ。九州からだと宅急便でも中1日程度だった記憶はありますので、本日は無理ですね😖 まっ、明日も仕事休みなので...
1,580円から10%クーポン利用で1,422円だそうで、上手く貼れればいいんでけどね。

2024/08/22

納得いくまで...

そもそも順位はベースとして新馬用と通常用から学習データ作成して学習になるので、そこが良い物である必要は当然です。って事で新馬CK用学習10時間スタートさせたんですが、15分程度でここまでの最適RMSEを少しだけ超える1.9845が出てます。まっ、それで終わりってのもここまで何度も経験はしてますが、明日朝出勤前に終わる筈なので結果を楽しみに今晩はゆっくりさせて頂きます。

まだまだ数が少ない「さらだ」ユーザーさん達は各自で学習までさせたりしているのかは疑問です。報われるか否かはその時の運だったりもしますし、別に当然強制ではありません。ただ、その土俵は準備させて頂き、こちらも自分なりの自分の為の学習作業はこれからもします。現状よりももっと精度の高い学習モデルの添付もしたいとは思ってます。ただ、自分が出来る範囲に留まりますので、各自が納得いくものをご自身の手で導くのも有りなのを試して頂き、自分だけが美味しい思いしてみてもって気でもいます。

追記 2024.8.23 20:06
今朝終わった新馬CK用学習ですが、最適RMSE 1.9587でした。

52R 1点 芝(46R) ダート(6R) 多点
単勝 25.00%(133.65%) 28.26%(151.09%) 0.00%(0.00%) 57.69%(99.81%)
複勝 50.00%(82.50%) 54.35%(87.83%) 16.67%(41.67%) 96.15%(106.86%)
枠連 15.62%(85.00%) 14.81%(55.19%) 20.00%(246.00%) 15.62%(32.64%)
馬連 7.69%(79.04%) 6.52%(26.74%) 16.67%(480.00%) 21.15%(72.56%)
ワイド 19.23%(59.23%) 19.57%(52.17%) 16.67%(113.33%) 48.08%(81.47%)
馬単 1.92%(12.69%) 2.17%(14.35%) 0.00%(0.00%) 21.15%(79.52%)
三連複 3.85%(23.65%) 4.35%(26.74%) 0.00%(0.00%) 17.31%(71.44%)
三連単 0.00%(0.00%) 0.00%(0.00%) 0.00%(0.00%) 17.31%(77.18%)
総合 51.92%(58.18%) 56.52%(51.58%) 16.67%(107.23%) 96.15%(78.63%)

これまでよりは良い? これが実力なら新馬戦複勝3点買いしてると勝てます😉 まあ、それ言ったら単勝1点買いでも勝てるって事なんですが、的中率96.15%だと多分波が非常に穏やかな筈です。25%だと当然山あり谷ありとなり、その谷に耐えられるかって話ですよね。

追記 2024.8.24 21:54
昨夜新馬の次に通常CK用学習24時間スタートさせてあり少し前に終わりました。これまでで一番な最適RMSE 1.3379が出ました。

404R 1点 芝(213R) ダート(175R) 障害(16R) 多点
単勝 23.02%(71.06%) 26.29%(83.66%) 17.14%(50.91%) 43.75%(123.75%) 51.73%(79.17%)
複勝 54.95%(85.30%) 53.99%(82.96%) 54.29%(86.17%) 75.00%(106.88%) 86.88%(79.48%)
枠連 12.18%(87.22%) 12.29%(91.79%) 11.98%(82.63%) 14.29%(80.00%) 27.48%(88.04%)
馬連 8.91%(65.40%) 9.39%(74.46%) 7.43%(54.11%) 18.75%(68.13%) 20.05%(73.18%)
ワイド 22.03%(79.90%) 23.00%(82.82%) 18.86%(74.97%) 43.75%(95.00%) 40.35%(79.13%)
馬単 4.70%(51.26%) 7.04%(83.52%) 1.14%(10.00%) 12.50%(73.12%) 20.05%(76.35%)
三連複 5.94%(79.01%) 5.63%(71.17%) 5.14%(88.69%) 18.75%(77.50%) 16.34%(84.50%)
三連単 1.73%(68.42%) 1.88%(111.27%) 0.57%(6.46%) 12.50%(175.63%) 16.34%(85.25%)
総合 56.44%(73.23%) 54.93%(85.07%) 56.00%(56.59%) 81.25%(101.51%) 87.62%(82.37%)

これなら少し期待出来そうかなぁ😉

2024/08/21

長時間トライアル

別に慣れっこではあるんですが、24時間学習終わったんです。そして無駄な時間だったかなぁ。24時間で9トライアル行われ、終了直前のトライアルは時間切れでカウントされてません。で、その1つ前のトライアルが問題のトライアルで、結局16時間弱を要してRMSE 5.6219とかです。今晩は試しませんが、今後機会見て長いの試す必要はあるかもです。

以前AutoMLでは最長1週間とかの学習を試みたりした時に1つのトライアルで3日間程度のもあったと記憶してますので、特にそれ自体に違和感はないのですが、時間と電気代の無駄を考えたくないですね😖

順位フルCKはAIにも難解?

以前から薄々は感じてました。昨日スタートした順位フルCKの24時間学習ですが、既に20時間以上過ぎてますが、ここまでこなしたトライアル8つですorz 最長3時間18分とかです。いや、難解だから時間が掛かるのかは別として、新馬戦用はテンポ良くトライアルが進みます。しかし、通常用CKも言っちゃうとファクター数では上なんですよ。しかし、ここまで時間は掛かったりしなかったと思う...ってのもまあ、その時々で若干違うとは思うのでね。今やってるトライアルは自分の記憶的には既に3時間では済まないと思う...今日の午前中の早い時間に見た時にもやってる最中だったと思うのでね。

また自分のペースで書いてるので説明が不十分だとは思いますが、先日からModel Builberで新馬戦用CKと通常用CKを行い、めぼしいモデルを使って順位フルCK用の学習用CSVを3時間ちょい掛けて出力してそれをModel Builerで24時間学習させている最中です。これまでは2.9041とかのRMSEも出たりしてますが、今回ここまで3.8638で、この後残り3時間少々でそもそも次が終わるのかも分からないけど、期待して待ちます。

2024/08/18

やれる事は試す

昨夜ってかまあ、日付変わった深夜に通常版の長い学習が終わった。結果からすると20回もやったけど1回目の最適RMSEを超えるものが出ないという無駄な2日超えな学習となりました。その1回目の学習モデルも納得の行くものではないので現在はModel Builderに戻って取敢えず新馬戦用の学習させてます。朝から1,800秒2回程行いましたがRMSE的にはAutoMLを超えるんですが、検証結果は...って事で今はまず3,600秒で試してます。これまでModel Builerでは新馬戦用の学習モデルの最適RMSEは1.9579だったりしますので、その辺りまで期待したいし、その検証が良い物だと助かります。まっ、期待外れだったら学習時間延ばして再度...

追記 2024.8.18 11:37
3,600秒では残念ながら良い物は得られませんでしたので10,800秒にして学習中です。ここまで1時間程度過ぎた所で最適RMSEは1.9600まで来てます。もう一息でこれまでを超えそうなので期待して待ちますが、今日のレースには間に合わない^^; まっ、来週末に備えて通常版もModel Builderで学習させて良いモデルが揃う事を願いたい😉

追記 2024.8.18 17:27
本日も実馬券的には最悪でした。まっ、中途半端な学習モデルで挑んだのが無謀と言えば無謀だとは思います。新馬戦用はRMSE 1.9846が出ました。

44R 1点 芝(40R) ダート(4R) 多点
単勝 15.91%(66.36%) 15.00%(66.00%) 25.00%(70.00%) 63.64%(114.55%)
複勝 43.18%(69.32%) 40.00%(65.50%) 75.00%(107.50%) 84.09%(83.03%)
枠連 7.69%(26.92%) 8.70%(30.43%) 0.00%(0.00%) 7.69%(48.55%)
馬連 2.27%(7.50%) 2.50%(8.25%) 0.00%(0.00%) 20.45%(74.62%)
ワイド 15.91%(45.68%) 15.00%(44.25%) 25.00%(60.00%) 45.45%(99.02%)
馬単 0.00%(0.00%) 0.00%(0.00%) 0.00%(0.00%) 20.45%(87.61%)
三連複 6.82%(32.95%) 7.50%(36.25%) 0.00%(0.00%) 15.91%(70.63%)
三連単 0.00%(0.00%) 0.00%(0.00%) 0.00%(0.00%) 15.91%(67.78%)
総合 43.18%(31.32%) 40.00%(31.39%) 75.00%(30.65%) 84.09%(76.11%)

まあ、これじゃ決して褒められたものではないかなぁ。次点はRMSE 1.9878で

44R 1点 芝(40R) ダート(4R) 多点
単勝 25.00%(113.41%) 25.00%(117.75%) 25.00%(70.00%) 61.36%(92.12%)
複勝 50.00%(79.77%) 47.50%(77.00%) 75.00%(107.50%) 90.91%(76.67%)
枠連 7.69%(26.92%) 8.70%(30.43%) 0.00%(0.00%) 7.69%(9.33%)
馬連 4.55%(18.86%) 5.00%(20.75%) 0.00%(0.00%) 13.64%(26.52%)
ワイド 15.91%(31.36%) 15.00%(28.50%) 25.00%(60.00%) 36.36%(74.32%)
馬単 4.55%(45.45%) 5.00%(50.00%) 0.00%(0.00%) 13.64%(36.25%)
三連複 6.82%(35.68%) 7.50%(39.25%) 0.00%(0.00%) 13.64%(70.63%)
三連単 2.27%(65.68%) 2.50%(72.25%) 0.00%(0.00%) 13.64%(70.59%)
総合 50.00%(53.50%) 47.50%(55.84%) 75.00%(30.65%) 90.91%(63.28%)

さて、どちらが良いかは...若干判断に困りますね。この後、通常用を7,200秒で学習させた時は1.3438が出ました。

340R 1点 芝(182R) ダート(145R) 障害(13R) 多点
単勝 23.82%(75.03%) 21.98%(75.88%) 23.45%(68.90%) 53.85%(131.54%) 52.06%(74.57%)
複勝 53.53%(83.53%) 50.00%(75.66%) 55.17%(89.86%) 84.62%(123.08%) 85.00%(81.23%)
枠連 11.19%(72.41%) 10.53%(73.29%) 10.87%(53.91%) 40.00%(556.00%) 26.10%(76.69%)
馬連 6.76%(44.47%) 7.14%(54.18%) 4.83%(29.31%) 23.08%(77.69%) 19.71%(64.36%)
ワイド 21.18%(88.21%) 21.43%(100.55%) 18.62%(72.97%) 46.15%(85.38%) 42.65%(83.34%)
馬単 4.12%(39.18%) 3.85%(39.07%) 3.45%(33.66%) 15.38%(102.31%) 19.71%(64.05%)
三連複 6.76%(103.79%) 5.49%(83.24%) 7.59%(134.69%) 15.38%(46.92%) 16.18%(77.96%)
三連単 2.06%(59.65%) 2.20%(59.34%) 1.38%(56.00%) 7.69%(104.62%) 16.18%(74.44%)
総合 55.00%(70.76%) 51.10%(70.08%) 57.24%(67.49%) 84.62%(119.90%) 85.00%(73.91%)

悪くは無いRMSEだけど、ほんの少しだけ改善して欲しい気はするのでもう少し長い学習もしてみます。相変わらずここまではModel Builder頑張ってくれてるのかなぁ。

追記 2024.8.19 18:30
本日から盆休み明けの仕事が始まります。この後夜勤なので、実は昨日21時間程度の学習時間に設定して開始させて出勤前には終わる様にしてました。最適RMSE 1.3417は

404R 1点 芝(213R) ダート(175R) 障害(16R) 多点
単勝 21.04%(61.46%) 20.19%(57.89%) 19.43%(58.11%) 50.00%(145.63%) 49.75%(78.28%)
複勝 50.50%(83.02%) 47.42%(80.28%) 52.00%(83.83%) 75.00%(110.62%) 86.63%(81.39%)
枠連 11.05%(73.26%) 10.61%(77.32%) 11.98%(71.98%) 0.00%(0.00%) 25.78%(80.07%)
馬連 8.91%(71.39%) 7.98%(66.43%) 9.71%(80.63%) 12.50%(36.25%) 20.30%(63.87%)
ワイド 21.53%(77.95%) 20.19%(70.47%) 21.71%(86.17%) 37.50%(87.50%) 39.85%(76.64%)
馬単 4.70%(52.10%) 4.69%(68.83%) 4.57%(33.43%) 6.25%(33.75%) 20.30%(66.98%)
三連複 5.45%(57.87%) 4.69%(37.70%) 5.71%(82.34%) 12.50%(58.75%) 14.11%(90.03%)
三連単 1.73%(46.78%) 1.88%(48.36%) 1.71%(49.14%) 0.00%(0.00%) 14.11%(103.35%)
総合 51.98%(65.35%) 49.77%(63.13%) 52.57%(68.18%) 75.00%(63.53%) 87.62%(89.56%)

ちょっとまた判断に苦しむ感じの検証結果なんですが、若干学習モデルファイルが149MBと大きいのもロード時のエラーが起きやすいので悩む所です。これはレース数増えてるのは昨日までを検証対象にしたからです。

2024/08/15

リリースとは別に

ユーザー様には申し訳ないけど、自分も儲けるつもりでアプリ作ったり学習させたりしてます。で、リリース用の準備は一段落して限られた時間で自分用にまずは新馬戦用として出た最適RMSE 2.0071ですが

44R 1点 芝(40R) ダート(4R) 多点
単勝 27.27%(96.36%) 22.50%(84.75%) 75.00%(212.50%) 56.82%(79.92%)
複勝 50.00%(78.18%) 45.00%(72.25%) 100.00%(137.50%) 95.45%(78.56%)
枠連 7.69%(65.38%) 4.35%(20.43%) 33.33%(410.00%) 7.69%(82.50%)
馬連 4.55%(78.18%) 2.50%(14.00%) 25.00%(720.00%) 22.73%(80.61%)
ワイド 18.18%(89.32%) 17.50%(81.25%) 25.00%(170.00%) 43.18%(75.91%)
馬単 2.27%(108.41%) 0.00%(0.00%) 25.00%(1,192.50%) 22.73%(83.94%)
三連複 6.82%(97.05%) 7.50%(106.75%) 0.00%(0.00%) 20.45%(63.47%)
三連単 0.00%(0.00%) 0.00%(0.00%) 0.00%(0.00%) 20.45%(67.68%)
総合 50.00%(77.22%) 45.00%(48.94%) 100.00%(353.55%) 95.45%(72.69%)

となりました。これが良いのか悪いのかは何ともですが、自分用はこちらで行きます。これ、1,200秒×20回で開始した学習の半分以下で出たものです。時間削減でここで新馬は打ち切ろうかなぁ。でもね、この後更に良い物が出ない保証は当然無い(笑) 時間的な制約から打ち切りますが、余裕があるなら継続が吉!

追記 2024.8.16 8:02
新馬戦用打ち切りから通常用10,000秒×20回を昨夜スタートしてここまでの最適RMSE 1.4259を検証すると

340R 1点 芝(182R) ダート(145R) 障害(13R) 多点
単勝 17.06%(69.38%) 17.03%(69.73%) 15.86%(69.86%) 30.77%(59.23%) 44.41%(76.04%)
複勝 45.59%(83.38%) 43.96%(86.43%) 46.21%(79.38%) 61.54%(85.38%) 80.00%(84.28%)
枠連 9.83%(76.31%) 7.89%(59.74%) 11.59%(93.26%) 20.00%(112.00%) 23.39%(86.97%)
馬連 5.59%(69.21%) 4.40%(80.66%) 6.21%(56.07%) 15.38%(55.38%) 18.24%(89.42%)
ワイド 15.29%(73.06%) 13.19%(60.60%) 17.24%(91.45%) 23.08%(42.31%) 39.12%(93.11%)
馬単 4.12%(64.94%) 3.30%(41.15%) 4.83%(96.28%) 7.69%(48.46%) 18.24%(90.66%)
三連複 6.18%(114.68%) 6.04%(61.43%) 5.52%(187.59%) 15.38%(46.92%) 15.00%(98.36%)
三連単 2.06%(112.74%) 2.20%(112.36%) 1.38%(113.31%) 7.69%(111.54%) 15.00%(93.76%)
総合 46.47%(83.07%) 44.51%(71.76%) 47.59%(98.43%) 61.54%(66.67%) 80.00%(91.42%)

これじゃまだまだですね。まだ5回終わっただけで残り15回ありますが、時間的には24時間後には明日のレースの準備する必要がある。日曜日のレースには全て終わっているとして、明日のこの時間にどの程度の物が出てるか...Model Builderと違って適度にセーブしてるし、各回の終わりにもセーブしてるので中断せずとも利用可能なのは自作AutoMLの良い所でもあります😉
この検証的には三連単1点買い続ければ勝てると。ただ、多点買いしてはダメだと(笑) ワイド3点でプラスになる様だとちょっと気楽に行けるんですが、的中率2%程度で収支がプラスって50レースに1回当たる程度って1日36Rで空振り有って辛いから。的中率4割弱なら半分ではないにしても3Rに1回は当たってるのは気分的に大分楽なので、そんな感じにプラス収支なるレベルを目指したいですね。

追記 2024.8.16 8:13
説明ちと不十分なので...自分用の学習モデルは学習データを2004.1.1~2024.6.30で作成してます。なので、検証は2024.7.1~で、今だと先週末8.11までをしてます。学習データを増やすのはプラスになるのですが、その分検証期間が限られます。検証期間が短いと実力が計り辛い。リリース用はより実力が正確に表される様に昨年末までの学習データで検証期間半年以上を確保してます。

2024/08/14

System.Data.SQLite Version 1.0.119.0リリース時期延期

流石に5月リリース予定が一向にリリースされず、先日ベースとなるSQLiteが3.46.0に3.46.1になっている事に気付き8月13日にパッチリリースとなった関係からだと思うけど、正式(?)にSeptember XX, 2024に変更されてました。まっ、バグ関連なんかが既に発覚してるものを含んだリリースはしない姿勢は好感が持てますが3カ月も経った時点でやっと公表って感じも微妙ではあります。

リリースされれば即取り込んでこちらもアプリをリリースします。ML.NETのpreviewもたまに更新されたりしてますが、正式リリースは.NET 9がリリースされるタイミングなのかもって何処かで見た気がするので、もしかすると11月辺りが濃厚なのかなぁと予測してみたり。

2024/08/13

Microsoft Rewards 14回目

前回から54日での獲得です。前回48日でと書いてるので少し伸びた。もう少し掛かりそうだったが、今日は少しだけ多くポイントが稼げたので1日早まった気がする。今回も5,250ポイントを楽天ポイント660に。何時からなのか不明だけど、自動でポイント申請してくれる機能が追加されてるので、設定してみた。次は10月初旬になるのかな。

まだ半分来てないけど

昨夜の結果よりほんの少しだけ良い感じの最適RMSE 2.5674が出ましたが、

2,064R 1点 芝(976R) ダート(1011R) 障害(77R) 多点
単勝 21.03%(86.29%) 22.85%(99.08%) 18.89%(76.14%) 25.97%(57.40%) 49.13%(79.26%)
複勝 48.93%(86.41%) 48.46%(90.53%) 48.27%(82.11%) 63.64%(90.65%) 85.27%(83.26%)
枠連 12.26%(88.36%) 12.09%(100.23%) 12.41%(79.95%) 12.31%(62.46%) 25.50%(73.20%)
馬連 8.28%(82.32%) 8.40%(101.06%) 7.91%(65.81%) 11.69%(61.69%) 18.75%(69.76%)
ワイド 19.48%(81.01%) 19.16%(87.03%) 18.69%(73.16%) 33.77%(107.92%) 39.24%(78.20%)
馬単 4.89%(95.68%) 5.53%(127.03%) 4.25%(69.95%) 5.19%(36.23%) 18.75%(65.90%)
三連複 4.41%(62.01%) 4.10%(57.70%) 4.35%(61.66%) 9.09%(121.04%) 12.16%(70.38%)
三連単 1.21%(103.77%) 1.23%(70.67%) 1.19%(142.29%) 1.30%(17.66%) 12.16%(65.74%)
総合 50.58%(85.70%) 50.10%(91.50%) 49.95%(81.39%) 64.94%(69.52%) 85.47%(69.47%)

実戦ではもう一段上に行ってくれないとな気がしますが、もともと順位では走破タイム程のRMSEは出ないですね。2.5切れるものが出てくれると良いのかも? 今夜には一応の学習モデルは揃いそうなのでリリースします。

2024/08/12

現ファクターでの各学習モデル

ちょっとあれこれやって整理ついてないのでメモです。

  • Model Builder
    [ベースモデル]
    新馬戦用 1.6657
    通常用 1.3800
    順位フル NG
    [CKモデル]
    新馬戦用 1.9814
    通常用 1.3591
    順位フル NG
  • AutoML
    [ベースモデル]
    新馬戦用 1.6971
    通常用 1.4493
    順位フル NA
    [CKモデル]
    新馬戦用 2.0140
    通常用 1.3989
    順位フル 2.5692

これ途中だったりもしますが、今後に期待しながらリリースに持っていきます😁

順位フルCK最初のモデル

少し前に1回目が終わった順位フルCKの最適RMSEは2.8694で

2,064R 1点 芝(976R) ダート(1011R) 障害(77R) 多点
単勝 18.12%(85.65%) 19.67%(72.15%) 16.62%(101.71%) 18.18%(45.97%) 47.34%(80.09%)
複勝 45.78%(81.25%) 45.39%(79.17%) 45.99%(83.92%) 48.05%(72.47%) 83.77%(80.72%)
枠連 10.38%(70.99%) 9.67%(62.13%) 11.38%(82.47%) 4.62%(12.92%) 24.31%(74.86%)
馬連 7.07%(68.30%) 6.05%(59.40%) 8.11%(79.96%) 6.49%(28.05%) 17.15%(70.77%)
ワイド 17.10%(79.76%) 16.29%(69.07%) 17.31%(88.71%) 24.68%(97.79%) 36.72%(76.94%)
馬単 3.54%(68.69%) 2.97%(47.78%) 4.06%(92.49%) 3.90%(21.17%) 17.15%(70.06%)
三連複 3.63%(61.19%) 3.38%(54.45%) 3.56%(66.04%) 7.79%(82.86%) 11.14%(67.46%)
三連単 0.53%(52.74%) 0.20%(42.46%) 0.79%(65.33%) 1.30%(17.66%) 11.14%(64.62%)
総合 47.29%(71.07%) 46.82%(60.80%) 47.68%(82.58%) 48.05%(48.05%) 84.16%(69.15%)

で、検証してる間に2回目が終わって最適RMSE 2.5692で

2,064R 1点 芝(976R) ダート(1011R) 障害(77R) 多点
単勝 20.78%(82.03%) 21.93%(91.38%) 19.29%(74.94%) 25.97%(56.62%) 48.74%(78.57%)
複勝 50.00%(88.27%) 48.26%(88.75%) 50.64%(87.66%) 63.64%(90.13%) 85.37%(82.72%)
枠連 12.00%(81.08%) 11.85%(82.29%) 12.00%(78.78%) 13.85%(100.00%) 26.04%(75.97%)
馬連 8.24%(74.82%) 8.71%(82.92%) 7.62%(68.96%) 10.39%(48.96%) 18.27%(71.96%)
ワイド 19.19%(78.50%) 18.85%(80.38%) 18.30%(72.83%) 35.06%(129.09%) 38.57%(75.76%)
馬単 4.41%(72.48%) 4.92%(79.47%) 3.86%(68.50%) 5.19%(36.23%) 18.27%(69.66%)
三連複 3.88%(58.73%) 3.59%(57.76%) 4.06%(59.62%) 5.19%(59.35%) 11.92%(72.04%)
三連単 1.02%(106.73%) 1.13%(78.92%) 0.89%(140.36%) 1.30%(17.66%) 11.92%(66.77%)
総合 51.41%(80.32%) 49.80%(80.19%) 52.03%(81.47%) 63.64%(66.61%) 85.66%(70.63%)

ここからどこまで改善出来るかは明日のお楽しみで寝ます😉

CPU負荷大

昨今AIが色々と話題になり米アップルが発表したAIなんかもちょっとAIではない...Aが何かが違ったりしてるけど、まあ、その辺りは洒落(?)なのかとは思うけど、あまりに重いので、現行機種では15Proのみが対象とか言われてますね。

実はML.NETの色々なってか、まあ、機械学習を取り入れてますが、この中の特にAutoML使って学習させてます。で、うちの6年前に組んだPCのCore i7 8700程度だと1つ動かしてもかなりなんですが、2つ稼働させるともうね、ブラウザーですらかカクカクしだす程の負荷なんです。でまあ、先日も書いた様に2日半弱な学習させてる最中に、ここまでの新馬戦用と通常用の使えそうなモデルを使って順位フルCK用のCSV出力始めたんですが、なんと所要時間予想は10時間です。普段だと3時間程度で出力出来たと思うんですが、AutoML稼働中に更にまあちょいと重めな処理、あっ、順位関連のCSV出力には機械学習したモデルを使って予想させながらのデータ出力なのでこれも若干重いんです。

どちらも本日夕方程度には終わるのでもう丸3日間程度稼働させっぱなPCを一旦休ませた後に順位フルCKの学習をさせようと思ってます。この学習データは確か1GB未満だと思うので、3,600秒×24回程度の24時間にする予定です。これが完了したら、まあ、あまりにもモデルの出来が悪ければもう少しやり直してからですが、程々の物が出ればさらだVersion1.6.0の変更申請を行う予定です。

追記 2024.8.12 17:58
結局11時間4分も掛かってCSV出力完了ですorz
そして学習は改善は見られませんでしたorz

通常用がなんとか

今朝方15回目にやっと最適RMSE 1.3989が出ました。

1,951R 1点 芝(899R) ダート(975R) 障害(77R) 多点
単勝 20.71%(76.70%) 20.80%(80.38%) 19.79%(74.06%) 31.17%(67.27%) 48.74%(78.15%)
複勝 50.33%(84.64%) 48.72%(85.28%) 50.67%(83.71%) 64.94%(88.96%) 84.98%(82.28%)
枠連 12.13%(81.82%) 11.25%(79.15%) 12.94%(85.58%) 10.77%(59.54%) 25.78%(73.40%)
馬連 8.30%(68.08%) 8.01%(68.88%) 8.31%(67.83%) 11.69%(61.95%) 18.45%(70.25%)
ワイド 20.14%(78.91%) 18.69%(75.83%) 20.31%(79.37%) 35.06%(109.09%) 39.52%(80.55%)
馬単 4.56%(63.37%) 5.01%(69.01%) 4.21%(60.91%) 3.90%(28.57%) 18.45%(68.26%)
三連複 4.25%(63.34%) 3.78%(66.16%) 4.31%(58.82%) 9.09%(87.66%) 12.25%(73.29%)
三連単 1.03%(52.42%) 1.00%(67.78%) 1.03%(41.02%) 1.30%(17.66%) 12.25%(67.28%)
総合 51.87%(71.04%) 50.06%(73.97%) 52.51%(68.83%) 64.94%(65.20%) 85.24%(70.82%)

まだまだな気がしますが、それでもギリギリ使えるかなぁって感じです。本来は1.35辺りまで出たモデルが出れば合格な感じなんですが残り5回でどこまで出るかは今晩には終わるので結果待ちですね。

2024/08/10

学習時間が長い

今やっている学習は通常用CK版なんですが、学習データが1GB超えてますので学習時間は10,000秒として20回でやってます。終わるまで2日半弱なんですよね。これで良い学習モデルが出てくれれば良いですが、出なければ更に学習する必要があります。ある程度の物が出れは順位フルCK版の学習データ出力してそこからまた学習と盆休みは延々と学習に明け暮れる事になりそうです。今週末は当然使えないですが、来週末には良い物を揃えてアプリの変更申請もしたいと思ってますが...

2024/08/09

ML.NET Model Builder 2022 Version 17.18.2.2415501

まあ、適度にチェックはしてるんですが、Visual Studio起動して[拡張機能(X)]-[拡張機能の管理(M)...]として「更新プログラム」タグを見るとModel Builderの新しいバージョンがありました。早速インストールしてダメだった順位フルを試してみます。

追記 2024.8.10 8:07
昨夜24時間学習スタートさせて就寝。起きて確認するとやはりエラーで止まってました。

今回は一応Microsoftに報告してみたけど、どんな反応してくれるかは...

2024/08/08

何が良いのか?

結果的に最善の予想してくれる学習モデルに辿り着きたいって事です。ちょっと試しにCK版の新馬の学習モデルを1,200秒×20回でやってます。現時点の最適RMSEは2.0140で

113R 1点 芝(77R) ダート(36R) 多点
単勝 23.01%(97.61%) 24.68%(91.56%) 19.44%(110.56%) 53.10%(82.89%)
複勝 42.48%(73.89%) 42.86%(67.66%) 41.67%(87.22%) 81.42%(75.19%)
枠連 11.63%(109.53%) 12.96%(135.56%) 9.38%(65.62%) 11.63%(123.86%)
馬連 7.96%(159.47%) 9.09%(203.51%) 5.56%(65.28%) 20.35%(130.77%)
ワイド 19.47%(94.51%) 22.08%(109.35%) 13.89%(62.78%) 33.63%(72.01%)
馬単 4.42%(178.50%) 6.49%(261.95%) 0.00%(0.00%) 20.35%(115.24%)
三連複 4.42%(51.06%) 6.49%(74.94%) 0.00%(0.00%) 11.50%(47.99%)
三連単 0.00%(0.00%) 0.00%(0.00%) 0.00%(0.00%) 11.50%(45.16%)
総合 45.13%(95.14%) 45.45%(117.39%) 44.44%(48.70%) 82.30%(68.85%)

これって良いのかな? 決して悪くはない? 現時点でのさらだでの最適を確認する上でCK版の学習モデルを試してます。

4,000秒×20回では

以前だと通常用は1.4未満までRMSEは出てたんですが、結局

SouhaTime4000_14493.zip 131330097
SouhaTime4000_14637.zip  56347393
SouhaTime4000_14646.zip  81070935
SouhaTime4000_14716.zip  51095577
SouhaTime4000_14770.zip   5351742
SouhaTime4000_14808.zip  87534305
SouhaTime4000_14935.zip   1778036
SouhaTime4000_14997.zip    979124
SouhaTime4000_15224.zip    254482
SouhaTime4000_15229.zip    258028
SouhaTime4000_15371.zip    285337
SouhaTime4000_15392.zip   9001344
SouhaTime4000_15529.zip  81477380
SouhaTime4000_15682.zip    150385
SouhaTime4000_16026.zip  36407025
SouhaTime4000_16089.zip    138913
SouhaTime4000_16294.zip  19714249
SouhaTime4000_16567.zip    714508
SouhaTime4000_16724.zip    346594
SouhaTime4000_17257.zip   1290168

3,600秒よりは少しだけ良いのかな?

1,951R 1点 芝(899R) ダート(975R) 障害(77R) 多点
単勝 19.43%(79.77%) 20.69%(97.89%) 17.54%(62.51%) 28.57%(86.88%) 46.39%(80.71%)
複勝 46.85%(84.06%) 46.50%(83.53%) 46.46%(84.58%) 55.84%(83.77%) 83.24%(84.50%)
枠連 10.89%(77.52%) 9.83%(62.82%) 11.44%(88.81%) 15.38%(90.00%) 23.86%(80.91%)
馬連 7.07%(66.31%) 6.01%(68.34%) 7.69%(62.73%) 11.69%(87.92%) 18.35%(90.79%)
ワイド 17.99%(86.07%) 16.24%(85.97%) 18.87%(84.43%) 27.27%(108.05%) 38.39%(87.91%)
馬単 4.05%(70.72%) 4.00%(96.12%) 3.79%(47.53%) 7.79%(67.79%) 18.35%(89.47%)
三連複 4.56%(97.48%) 3.89%(94.15%) 4.92%(104.61%) 7.79%(46.23%) 11.12%(78.45%)
三連単 1.03%(58.57%) 1.11%(69.04%) 0.82%(46.83%) 2.60%(84.94%) 11.12%(76.54%)
総合 48.28%(77.57%) 47.83%(82.58%) 48.00%(72.67%) 57.14%(81.79%) 83.50%(80.86%)

どこかで妥協なんだけど、Model Builderの学習モデルに届かないのが非常に標準添付に向かないと思うんですよ。盆休みになったのでじっくりと考えながら...LightGBM単体をC#から直接使うのはどうやら微妙らしくスムーズではないです。ラッパーかましてとかあまり気が進まないです。

2024/08/07

3,600秒×24回では良い学習モデル出ず

昨日終わってたんですが、結果があまりにも使えなくて

SouhaTime3600_14657.zip  87856465
SouhaTime3600_14834.zip  32059748
SouhaTime3600_14863.zip   7764371
SouhaTime3600_15003.zip    513500
SouhaTime3600_15075.zip  57158241
SouhaTime3600_15123.zip    531689
SouhaTime3600_15146.zip    543648
SouhaTime3600_15347.zip   1029146
SouhaTime3600_15398.zip    432900
SouhaTime3600_15487.zip    361226
SouhaTime3600_15524.zip  90573269
SouhaTime3600_15936.zip    144413
SouhaTime3600_15952.zip    394820
SouhaTime3600_16219.zip   1277124
SouhaTime3600_16237.zip    448000
SouhaTime3600_16350.zip    425814
SouhaTime3600_16402.zip    528639
SouhaTime3600_16623.zip    207097
SouhaTime3600_16651.zip    693662
SouhaTime3600_16888.zip    565121
SouhaTime3600_16895.zip    716130
SouhaTime3600_17062.zip 287203518
SouhaTime3600_17253.zip    284569
SouhaTime3600_17769.zip 124455979

ファイル名の後ろの数字はファイルサイズです。今晩盆休み前最後の夜勤出勤なので一応4,000秒×20回を先程スタートさせて様子を見る事にしました。まあ、盆休みにはLightGBM 4.5.0を単独使用し学習モデルを得る外部プロセスを作ってみようかと思ってます。

2024/08/05

Model Builder→AutoMLに方向転換

次期バージョンのリリース準備で同胞する学習モデルの準備をModel Builder使って新馬戦用、通常用としてそれらを使った順位フル用CSVファイルを出力してModel Builderで24時間学習に2回程挑みましたが数時間後に不明なエラーで止まってしまって学習が出来ない。Microsoftに報告して修正とか待っていては何時になるか分からなくなるので、最新preview組み込んでるAutoMLで準備始めました。新馬戦は最適RMSE 1.6962が出たりしたのですが、この学習モデルは280MBとかなり大きなものとなり、予想通りにロード時にエラーになります。で、次点のRMSE 1.6971はファイルサイズ223MBと少しだけ小さいので試しました。

2024.1.1~2024.7.31の検証で

113R 1点 芝(77R) ダート(36R) 多点
単勝 20.35%(112.04%) 20.78%(111.17%) 19.44%(113.89%) 40.71%(75.58%)
複勝 45.13%(79.03%) 51.95%(88.31%) 30.56%(59.17%) 78.76%(72.21%)
枠連 6.98%(49.88%) 5.56%(25.37%) 9.38%(91.25%) 6.98%(46.21%)
馬連 6.19%(58.32%) 6.49%(28.83%) 5.56%(121.39%) 14.16%(74.25%)
ワイド 14.16%(49.20%) 16.88%(49.09%) 8.33%(49.44%) 30.97%(57.52%)
馬単 3.54%(87.79%) 3.90%(33.77%) 2.78%(203.33%) 14.16%(61.93%)
三連複 3.54%(48.58%) 5.19%(71.30%) 0.00%(0.00%) 12.39%(86.46%)
三連単 0.88%(84.42%) 1.30%(123.90%) 0.00%(0.00%) 12.39%(98.51%)
総合 46.02%(71.81%) 53.25%(68.06%) 30.56%(79.65%) 79.65%(83.54%)

となりまずまずな感じです。この後、通常用の学習1時間×24回をスタートしてお盆休み前残り3日の夜勤に出て、明日のこの時間に結果出る様にします。

追記 2024.8.5 18:50
以前は学習モデルのファイルサイズが100MB超えるとロード時にエラーになる事が多かったんですが、4.0.0-previewのおかげなのかは定かではないですが、200MB超えてもロード出来たりしてるのは改善されているからなのかもですね。これとLightGBMのバージョンが3.3.5から新しい物に更新されれば更に学習モデルも改善されると思ったりします^^;

CKシリーズの学習モデル

自分用ではありますが、こちらも当然重要なので少しずつ進めてますが

  • ShinbaTimeCK(RMSE 1.9814)
    113R 1点 芝(77R) ダート(36R) 多点
    単勝 15.93%(54.78%) 15.58%(50.52%) 16.67%(63.89%) 38.94%(56.40%)
    複勝 38.05%(93.54%) 37.66%(92.99%) 38.89%(94.72%) 75.22%(74.66%)
    枠連 9.30%(89.42%) 12.96%(119.63%) 3.12%(38.44%) 9.30%(75.33%)
    馬連 7.08%(57.35%) 7.79%(37.01%) 5.56%(100.83%) 15.04%(60.18%)
    ワイド 11.50%(74.69%) 12.99%(94.68%) 8.33%(31.94%) 29.20%(66.19%)
    馬単 5.31%(51.95%) 6.49%(60.13%) 2.78%(34.44%) 15.04%(52.17%)
    三連複 2.65%(45.93%) 2.60%(17.40%) 2.78%(106.94%) 7.08%(42.21%)
    三連単 0.88%(13.01%) 1.30%(19.09%) 0.00%(0.00%) 7.08%(49.39%)
    総合 39.82%(59.18%) 40.26%(59.17%) 38.89%(59.19%) 75.22%(54.02%)
  • SouhaTimeCK(RMSE 1.4260)
    1,951R 1点 芝(899R) ダート(975R) 障害(77R) 多点
    単勝 25.94%(80.91%) 25.36%(85.08%) 25.64%(75.50%) 36.36%(100.65%) 54.38%(80.45%)
    複勝 55.87%(85.15%) 53.62%(83.59%) 56.92%(85.69%) 68.83%(96.36%) 87.80%(82.64%)
    枠連 14.27%(89.73%) 13.45%(79.95%) 14.55%(83.87%) 20.00%(290.31%) 31.13%(87.79%)
    馬連 9.79%(75.14%) 8.90%(63.23%) 10.26%(73.24%) 14.29%(238.18%) 23.37%(76.62%)
    ワイド 23.32%(81.35%) 21.58%(72.54%) 23.79%(83.02%) 37.66%(163.25%) 44.90%(81.85%)
    馬単 5.64%(82.84%) 5.56%(71.87%) 5.54%(72.78%) 7.79%(338.31%) 23.37%(77.17%)
    三連複 6.61%(101.46%) 6.67%(94.62%) 5.95%(91.25%) 14.29%(310.65%) 16.04%(82.02%)
    三連単 1.44%(120.62%) 1.78%(74.16%) 1.03%(67.05%) 2.60%(1,341.30%) 16.04%(77.94%)
    総合 57.36%(89.65%) 54.95%(78.10%) 58.56%(79.02%) 70.13%(361.26%) 88.16%(79.31%)

どちらももう少し詰めたいけど、リリース用の準備がちとトラブってます。順位フルをModel Builderで24時間やろうと2度もトライしてますが訳わからないエラーで止まってしまいます😖 ちと違う方向で学習モデル準備してリリースにこぎ着けようか悩む所です。

2024/08/04

次期バージョン同胞候補

2024.1.1~2024.7.31で検証すると

  • ShinbaTime.mlnet(RMSE 1.6657)
    113R 1点 芝(77R) ダート(36R) 多点
    単勝 7.96%(16.28%) 7.79%(15.84%) 8.33%(17.22%) 33.63%(63.19%)
    複勝 29.20%(50.44%) 27.27%(48.05%) 33.33%(55.56%) 75.22%(72.33%)
    枠連 5.81%(29.42%) 7.41%(37.96%) 3.12%(15.00%) 5.81%(53.05%)
    馬連 3.54%(31.59%) 3.90%(9.22%) 2.78%(79.44%) 9.73%(51.33%)
    ワイド 8.85%(42.39%) 10.39%(45.58%) 5.56%(35.56%) 28.32%(63.95%)
    馬単 0.88%(2.39%) 1.30%(3.51%) 0.00%(0.00%) 9.73%(48.36%)
    三連複 0.88%(69.47%) 1.30%(101.95%) 0.00%(0.00%) 6.19%(56.95%)
    三連単 0.00%(0.00%) 0.00%(0.00%) 0.00%(0.00%) 6.19%(46.67%)
    総合 31.86%(30.27%) 31.17%(32.56%) 33.33%(25.49%) 75.22%(52.01%)
  • SouhaTime.mlnet(RMSE 1.3800)
    1,951R 1点 芝(899R) ダート(975R) 障害(77R) 多点
    単勝 24.86%(83.08%) 23.69%(77.19%) 25.13%(88.30%) 35.06%(85.71%) 50.44%(74.05%)
    複勝 55.20%(85.86%) 52.84%(80.95%) 56.21%(88.44%) 70.13%(110.52%) 86.62%(82.83%)
    枠連 13.59%(71.00%) 14.75%(84.28%) 12.73%(61.38%) 12.31%(51.38%) 26.90%(68.23%)
    馬連 9.28%(59.01%) 10.01%(72.60%) 8.51%(46.90%) 10.39%(53.64%) 20.71%(65.35%)
    ワイド 23.63%(79.06%) 22.58%(77.68%) 24.00%(79.09%) 31.17%(94.81%) 43.52%(81.11%)
    馬単 5.33%(56.50%) 5.78%(67.16%) 4.82%(47.56%) 6.49%(45.19%) 20.71%(63.49%)
    三連複 6.87%(105.53%) 6.45%(127.29%) 7.08%(89.17%) 9.09%(58.70%) 16.20%(83.89%)
    三連単 1.44%(125.32%) 1.56%(169.05%) 1.23%(89.36%) 2.60%(70.00%) 16.20%(81.42%)
    総合 56.48%(83.31%) 53.73%(94.71%) 57.85%(73.84%) 71.43%(71.64%) 86.78%(77.33%)

順位フルを現在学習中です。

2024/08/03

まさかの根本的なファクターのもれ

学習させる上でベースとなる分類に漏れがありました。これ、コースの説明なんかみてると「Aコースでは...」的なのを前々から見てたのに何故取り入れなかったと今更不思議に思ってしまう程の痛恨のポカ! 全ての学習モデルに影響するファクター漏れです。なので腹くくって改修作業してただいま必死に学習させてます。

今週末のリアル馬券は最小限に控えてひたすら学習作業です。最適RMSEがどの程度なら妥協かの判断が難しいですが、時間との闘いでもあり、ある程度の物が揃った時点で標準添付用としてリリースに踏み切る予定です。

新バージョン 1.6.0の通常用学習モデル

初回のSouhaTimeCKのModel Builderでの24時間学習が終わりました。

233R 1点 芝(126R) ダート(97R) 障害(10R) 多点
単勝 24.89%(89.87%) 24.60%(84.13%) 23.71%(97.11%) 40.00%(92.00%) 49.79%(78.45%)
複勝 51.50%(84.21%) 46.03%(79.21%) 56.70%(89.48%) 70.00%(96.00%) 88.41%(84.75%)
枠連 10.00%(67.95%) 7.48%(67.76%) 13.33%(70.44%) 0.00%(0.00%) 22.00%(62.14%)
馬連 6.44%(57.47%) 4.76%(55.40%) 7.22%(61.34%) 20.00%(46.00%) 16.31%(52.30%)
ワイド 20.17%(76.27%) 18.25%(74.13%) 20.62%(75.77%) 40.00%(108.00%) 39.48%(66.44%)
馬単 2.15%(34.81%) 1.59%(32.54%) 2.06%(35.77%) 10.00%(54.00%) 16.31%(52.87%)
三連複 3.00%(30.60%) 2.38%(10.00%) 4.12%(60.52%) 0.00%(0.00%) 12.88%(77.46%)
三連単 0.43%(16.52%) 0.00%(0.00%) 1.03%(39.69%) 0.00%(0.00%) 12.88%(83.84%)
総合 52.36%(57.02%) 47.62%(50.06%) 56.70%(66.23%) 70.00%(54.25%) 89.27%(75.08%)

ちょっと実戦に使える気がしないorz

2024/08/02

ML.NET Version 4.0.0-preview.24378.1

先月30日リリースされてた様です。NuGetも適度に確認してるんですが...System.Data.SQLite.Coreは5月更新予定が未だ更新されず😓 何か問題があるからなんだとは思うけど、3カ月遅れはなかなかな感じです。

で、少しだけどML.NETが更新されたので淡い期待からLightGBM Version 4.5.0がと試しましたが相変わらずのエラーが出るのでNGでした。これ、previewが終わって正式リリースされても対応されない気がするのが本当に残念なんですよね。LightGBMチーム的には現在のML.NETが採用しているLightGBM Version 3.3.5から随分と変わっているのがVersion 4.0.0以降のLightGBMらしいのでなんとかして欲しい所です。

まっ、何にしてもAutoMLとAutoMLJuniを新しいML.NETでリビルドしてリリースに同胞する事にします。

2024/08/01

何気にCopilotに質問ぶつけた

ざっくりな話、「競馬予想に有効なファクターは何ですか?」に対していくつかの項目を挙げてくれるCopilotなんですが、その中に「着差」とありました。ああっ、確かに使えるかなぁって事で確認すると、馬毎レース情報に「着差コード」が存在します。実際にはちょっと単純ではないのですが採用する事にしました。今週頭にサラッと書き上げて学習もした後に、ふと、「着差」入れるなら「タイム差」は入れないの?って疑問から面倒なので入れる事にしました。

まっ、これもサラッと書き上げて今学習中です。テスト学習中なので3時間のModel Builderでのお試しです。この後、24時間も実施する予定です。

若干悩みました。これって馬毎レース情報からなので別にCKに拘る必要は全くありません。が、ファクター追加は前後での互換が全くなくなるので学習モデルが使えなくなるので、影響を最小限にする為に今回はSouhaTimeCKにのみ追加してみました。結果が良い方向であれば、SouhaTimeへの追加も検討しようかと思います。