2023/08/22

次のステップ

前々から検討はしてたんですが、今回の学習済みモデルの吐き出す予測を元に今度はどの馬が勝つかを学習させる。で、まあ、ここの所滅茶苦茶コーディングしてるんですが、取敢えず、学習に使うCSV出力機能を書き上げてみました。しかし、ここでちょっとした問題があるのは、まあ、そもそも今回の機械学習で使うデータは出走別着度数も使ってる関係で、JRA-VANの提供している2004年以降で行ってます。2004年~2022年が19年なので228ヶ月で、今年が大体8か月終わりそうなので計236ヶ月分出力する事になるんですが、デバッグも兼ねて1ヶ月ぶん出力してみるとだいたい50分掛かります。だとすると、ザックリ丸8日ちょいです。でまあ今回考えているのは、一気にやるのは無理だしって事で1年分で10時間。この辺りで区切って出力し、最終的に結合すれば良い訳で、出力途中でコーディング終わればってか実際にはModel Builder使えばコーディング無しで学習にも挑めるので適度にしていくかも。

いや、実は前回までの機械学習部分もザックリ作ってたんですが、色々な部分でその機械学習機能を使う必要はあるのでクラス作ってみた。まあ、これがまた遅いんだよねぇ😔 どうしても全頭数分データ準備して予測するので仕方が無いのかなぁっと諦めてるんですが、だったら一度予測したらデータベースなんかにって事も当然可能なんですが、これ、学習済みモデルが変わればまたなんですよ。で、保存しておくって事はどのモデルでいつ予測したかとか持ってないと管理出来ないし、そんなの管理するのも嫌だなっとなる訳です。まあ、今回の様に数十年分一気に予測する事は今後は考えたくはないのですが、このデータで使うモデルにしても確定的な物があるなら良いんですが...まあ、先日の5時間では流石になので今また24時間やってます。良いのか出来ればその後にコツコツと2週間程度は掛かるつもりで挑んでみますorz

余談ですが、自分はEdgeをメインのブラウザーとしてもう随分使ってますが、ブラウザーで表示しているページを読んでくれるんですよね。英語では本当に違和感なく発声してるんですが、まあね、漢字混じりの日本語をしっかりと発音して読むのは大変な事だとは思うけど、日本語文章内に例えばVirtual Machineとあると、「バーチュアル・マチネ」とか言うんです。最初何を言ってるのかと思えばって話です。がんばれ、AI!

0 件のコメント:

コメントを投稿