2025/04/13

ディープラーニングを諦めた訳ではない

ここにも何度となく色々な事にチャレンジしている事は書いてます。まあ、その主軸はディープラーニングであるTensorFlowなんですが、これ自体は本来ってかPythonで使うものなので自分自身がPythonをあまり好きになれず、ってかねぇ、60歳過ぎて手を出した訳だし自分の脳が馴染めないだけなんだけど...いや、そもそもテキストベースなのがねぇって言い訳してた。

先日何だったかやってた時にOSが開発者モード(?)じゃないとか言われて

設定にあるこれをオンにしたんですが、以前Visual StudioでPython環境整備している時にシェルスクリプトだったか許可されないからって感じで使えなかった理由がこれなんじゃと思い確認してみるとVisual Studioで無事(実際には無事にとは行かないが、毎回指定すれば)にAnacondaの仮想Python環境で行ける様になり単純なTensorFlowでの多変量多出力回帰をしてみた。CopilotとGeminiに相談しながらなんとか行けました。

CSVファイルはpandas使って

import pandas as pd

# CSVファイルの読み込み
data = pd.read_csv("MRaceJuni.csv")  # ファイル名を適宜変更

入出力の指定して

# 入力データ(特徴量)
X = data[[
    "JouCD", "KaisaiTuki", "KaisaiKai", "KaisaiNichi",
    "TrackCD", "Course", "Kyori", "Tousu", "Tenko", "Baba",
    "KyosouShubetu", "KyosouJouken", "JuuryoShubetu",
    "Uma1Souha", "Uma2Souha", "Uma3Souha", "Uma4Souha",
    "Uma5Souha", "Uma6Souha", "Uma7Souha", "Uma8Souha",
    "Uma9Souha", "Uma10Souha", "Uma11Souha", "Uma12Souha",
    "Uma13Souha", "Uma14Souha", "Uma15Souha", "Uma16Souha",
    "Uma17Souha", "Uma18Souha"
]]

# 出力データ(ターゲット)
Y = data[[
    "Umaban1", "Umaban2", "Umaban3", "Umaban4", "Umaban5",
    "Umaban6", "Umaban7", "Umaban8", "Umaban9", "Umaban10",
    "Umaban11", "Umaban12", "Umaban13", "Umaban14", "Umaban15",
    "Umaban16", "Umaban17", "Umaban18"
]]

後は今までと同じ感じでデータ準備とTensorFlow特有の層を指定して学習が

from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# データ分割
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.2, random_state=42)

# 標準化
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

import tensorflow as tf
from tensorflow.keras import Model, Input
from tensorflow.keras.layers import Dense

# 入力層を定義
input_layer = Input(shape=(X_train.shape[1],))

# 隠れ層と出力層
x = Dense(64, activation='relu')(input_layer)
x = Dense(32, activation='relu')(x)
output_layer = Dense(Y_train.shape[1])(x)

# モデルを構築
model = Model(inputs=input_layer, outputs=output_layer)

# モデルのコンパイル
model.compile(optimizer='adam', loss='mse')

# モデルの訓練
history = model.fit(X_train, Y_train, epochs=50, batch_size=32, validation_split=0.2)

出来たモデルの結果を

# 予測
predictions = model.predict(X_test)

# 結果表示
print(predictions)

まあ、これまでのRMSEに馴染みがあるので

from sklearn.metrics import mean_squared_error
import numpy as np

# 平均二乗誤差(MSE)を計算
mse = mean_squared_error(Y_test, predictions)

# 平方根を取ってRMSEを計算
rmse = np.sqrt(mse)
print(f"Root Mean Squared Error: {rmse}")

って感じにすれば感覚つかみ易いですね。で、出来上がったモデルをどうやって利用するかが問題なんです。H5とかで保存やonnxもあり、まあ、この辺りも以前から苦労してた記憶がありますが

# SavedModel形式で保存
model.export('my_saved_model')

としてTensorFlowのSavedModel形式で保存してTensorFlow.NETでVisual Studioのc#で利用しようかと思ってますが、また躓くかもです😓

0 件のコメント:

コメントを投稿