|
すみません。分かりにくいと思うのでもう少し例を挙げます。
たとえば、レース前日夜(8/16とします)に、翌日(8/17)出走する騎手ごとに着順を分析するとします。
週替わり処理、翌日8/17のJRDBデータをダウンロードし、
翌日のレースに出る騎手に限定するため、T競走馬データとD成績データを騎手コードでつなげ、
T競走馬データの騎手コードでグループ化、D成績データの「着順」の平均を取り
翌日のレース分析に使い、馬券を決めるとします。
同じやり方で購入すればどうなるかを過去にさかのぼってシミュレーションするには、
各レースの前日の段階で手に入るデータのみで分析する必要があります。
過去のある日に出走した騎手でグループ化するにはT競走馬データ対応するD競走馬データは不要ですよね。
もし今日9/27に8/17の購入シミュレーションをするには、8/16に手に入るデータに限定するため、
「D番組データ」=「D競走馬データ」on レースキー
「D競走馬データ」=「D成績データ」on 騎手コードとし、
「D番組データ」where条件 ="20190817" (8/17の出走データに絞る)
「年月日」where条件 <"20190817" (前日夜までのデータに絞る)
「騎手コード」グループ化
「着順」平均
とすれば、当時8/16と同じ状態のデータになりますでしょうか。
これまで抽出してきたデータも保存しているのですが、
同じ日のデータを今取り出してみても、微妙に違っているので困っています。
ご教示いただけると助かります。よろしくお願いいたします。
|
|