2026/01/05

焦りたくはない

ちょっと昨年を振り返ってみた所、8月初旬にML.NETのプレビューが更新された際に内部的に使うLightGBMのバージョンが最新になった事を受け、その対処をし、更にその為にモデルの再学習に取り組みました。つまり、もう5か月もひたすら学習させてます。

今回の途中でこれまで大体2004年以降からちょっと前に区切って学習データを用意し(これ、検証する期間を残す為に直前ではなく「ちょっと前」にしてます)、学習時間を調整して学習させてきました。せっかくAutoMLで利用するML.NETが更新されたのでAutoMLで試し、でも、納得いかずにModel Builderでもとかね。で、ふと、学習データの期間を狭める事を決断。まあ、これは特に確信があった訳ではないけど、本来機械学習にはある程度の学習するサンプルが必要でAutoMLでもModel Builderでも基本8割で学習して残り2割で検証されてる筈。なので2004年から(以前この理由は書いたかもですが、JV-Dataの出走別着度数データがこの年以降提供されてます)にする事で与えられる最大の学習データが良いのではとの判断からなんですが、通常用の学習データは2004.1.1~2025.7.31だと1.3GBとなり、これはModel Builder的にいうと学習データ1GB以上は3時間以上となってます。1GB未満なら1時間以上という事で、この一線超えるだけで3倍の時間を要するって事に。1GB未満でも24時間学習してた訳で、それ考えると72時間学習って事になり、まあ、色々試しはしましたがダメでした。まあ、それ以外でもAutoMLにしてもModel Builderにしても、AutoMLはどんなエラーなのか表示しますがModel Builderはもしかして詳細なログがどこかに出ているかもですが、Visual Studioに表示されるログは単に0から始まるトレーニングのカウントが飛んでいる事でエラーで飛んだんだなとわかる程度。まあでも、AutoMLではメモリ不足とか計算エラーとかなんです。そう、1GB超えた学習データでは特にメモリ不足にもなるんではないかと。あと、学習させる上で古いデータが必ずしも良い影響を与えるとは限らないのでは?って疑問もあり、現在使っているのは2015.1.1~2025.7.31です。これだと通常用でも678MBとまあ半分程度。色々な事があるとは思うけど、例えば競馬場改修工事による変化とか、調教技術、騎乗技術等の変化。古い過去データを使わない事で余分な雑念ではないけど傾向がより集中される可能性とかね。競馬予想もプロじゃないし、機械学習もプロじゃないけど自分の勝手な判断です。まあ、だからユーザーさんが勝手に自分が思う期間の学習データで好きに学習させる事も可能なのでトライして頂ければとは思います。

にしても、既に5か月挑んでるのに...そろそろ一旦めどをつけて新バージョンリリースにたどり着きたいと思ってます。

追記 2026.1.5 9:37

年末年始に続けて得られたモデルです。年越してから全く良いものが得られない😭

2026/01/03

ちょっと思った変な設定

いつからかは把握してませんが、今のWindowsにはクリップボードの履歴とかがあるんだけど、これってデフォではないです。Windows+Vとかで有効にするとかなんとかね。これ、なんでデフォじゃなくこんなのとか、まあね、設定的に出来たりするけど[システム]に

クリップボードがあって、
一番上の「クリップボードの履歴」をオンにすれば良いんだけど、これ、デフォにするとメモリとかに負荷がかかるのを懸念して外してるのかな? まあ確かに、勤務先のPCとか8GBしか積んでないのでマジでストレスですorz

ここ最近の経済状況的には更にメモリ価格が高騰してるのでお先真っ暗ですね。約40年程前には8MBメモリ増設に、まあ、当時はNECのPC98でしたが、純正断念してサードパーティー製でも、あれ?、歳を取って記憶が曖昧ですが確か数十万払ったかな^^; 当時のマシンってメイン64KB程度だったのかな? 16bit マシンだし。このメモリ増設も単にキャッシュディスクとか諸々に使う事が多い時代ではありましたが、Windows Ver2.1とかを最速で使い始めたりしてたし、なんだろ? 新しいものに興味があったとかいうより、技術的に早く触れたいって感じだったかなぁ(笑)

少し前に次に組むPCは64GBx2でと予想してたが、自分の記憶違いか今は価格.comにそんな製品無いorz amazonに行くとそんな製品の情報はあるので、間違いではないと思うけど。いつまでこの半導体不足とかが続くのか知らないけど、どうにかして欲しいね。

末吉

本日初詣でおみくじ引いたけど、末吉でした。つまり、慌てるな! ん? 慌ててますけど? 年末年始も関係なく学習は継続中です。ちょっとそれほどではないけど、もしかしてクリスマス・プレゼントも有りか?って事で、昨年12/25 18:25辺りに出来たRMSE 1.4193を検証してみると

1,500R 1点 芝(752R) ダート(689R) 障害(59R) 8頭以下(124R) 9~12頭(367R) 13頭以上(1009R) 多点
単勝 20.87%
(75.61%)
18.22%
(62.67%)
22.79%
(88.30%)
32.20%
(92.37%)
34.68%
(82.90%)
24.25%
(78.01%)
17.94%
(73.85%)
49.80%
(80.16%)
複勝 49.53%
(81.91%)
47.07%
(80.49%)
51.52%
(83.66%)
57.63%
(79.66%)
61.29%
(81.05%)
58.86%
(88.58%)
44.70%
(79.59%)
84.33%
(84.43%)
枠連 12.07%
(79.90%)
10.11%
(74.34%)
12.60%
(80.49%)
31.11%
(147.11%)
--
(--)
14.17%
(56.21%)
10.51%
(83.21%)
25.90%
(85.86%)
馬連 9.60%
(72.94%)
7.98%
(54.34%)
10.30%
(88.06%)
22.03%
(133.56%)
21.77%
(79.84%)
10.90%
(53.05%)
7.63%
(79.33%)
21.20%
(90.86%)
ワイド 19.53%
(83.88%)
17.15%
(65.66%)
20.75%
(101.35%)
35.59%
(112.03%)
40.32%
(80.65%)
23.98%
(74.55%)
15.36%
(87.67%)
40.00%
(96.00%)
馬単 5.20%
(70.53%)
4.26%
(47.31%)
5.37%
(89.16%)
15.25%
(148.98%)
13.71%
(95.81%)
6.27%
(55.72%)
3.77%
(72.81%)
21.20%
(87.64%)
三連複 6.07%
(173.62%)
5.85%
(123.20%)
5.95%
(229.67%)
10.17%
(161.69%)
13.71%
(98.95%)
8.99%
(100.82%)
4.06%
(209.28%)
13.93%
(106.79%)
三連単 1.87%
(143.37%)
1.86%
(186.16%)
1.89%
(108.00%)
1.69%
(11.19%)
3.23%
(137.42%)
2.72%
(76.21%)
1.39%
(168.53%)
13.93%
(107.48%)
総合 50.80%
(98.01%)
48.94%
(87.07%)
52.25%
(108.78%)
57.63%
(109.72%)
63.71%
(93.80%)
59.95%
(72.90%)
45.89%
(106.78%)
84.80%
(99.01%)

どうなのかな? 回収率はかなり良いんだけど、回収率頼みはダメなのは承知してる。自分が求める単複の的中率も足りないし、ワイドもね。でも、はたして本当にそれを望むのが正解? まあね、半年程度の検証なんで真相は分からない。

今年も簡単にはすまなそうなスタートだし、占い信じる信じないは別として、これまでのままでは進展は難しそうなんで、ちょっとしたひらめき(?)なのか決断なのかは必須になる気がして来た。もうすぐ63歳だしね(笑)