|
加藤さんへ
JRDBご利用ありがとうございます。
>各種新聞バックナンバーのテキスト版成績速報(ファイルネームの末尾がST.txt)についての質問とお願いです。
>
>04年9月18日以前のバックナンバーは、パドック新聞など他はpdfファイルとしてありますが、成績速報のバックナンバーは現存しないのでしょうか。
>
残念ながら、4年9月18日以前は、バックナンバーはありません
>SRAファイル上の「コーナー位置取り」のデータを加工して、隊列の長さと隊列を前中後に分けたブロックそれぞれの馬の密集度を数値化し、コーナー毎のその形状の変化をパターンとして、パターン分析しています。
>このパターン分析で各コースの形状の違いによるレース形態の違いや、コース間の相関関係等が具体的に見えるようになってきました。
>
>今までは最終コーナーまでの隊列の変化の分析しかしていなかったのですが、これを進めて4コーナーからゴールまでの変化も分析したいと考えています。その為にはゴール地点での馬身差としての着差のデータが必要なのです。
>同じ着差でもSECファイルにはタイム差としての着差のデータは有りますが、馬身差としての着差のデータはテキスト版の成績速報にしか有りません。
>
>で、初めの質問です。04年9月18日以前のテキスト版成績速報は現存していないのでしょうか。
>テキストをデータベースに取り込むプログラムは既に出来ているので、あるのなら利用したいのですが。
>
おもしろそうな分析ですね。コースにより、縦長、ダンゴ状態、先頭が並ぶ とか、ありそうですね。
私も、コーナー順位から、内外、先頭差を出したいと考えています。
さて、着差データですが、テキストは無いのですが、データとして保存しています。
CSV、固定長等、データベースに取り込める形式で出力する事はできますがどうでしょうか?
>また、現在アップされている分の中にリンクが切れているものが有ります。
>該当ファイルは次の日付けのものです。
>
> 040918〜041002、060916、071008
>
>分析する際になるべく欠損値を作りたくはないので、こちらもファイルが現存するのならリンクの修復をお願いします。
>
>
以下の日付のリンク、成績ファイルを修復しました。
20040918
20040919
20040920
20040925
20040926
20041002
20060916
20071008
>話は全く変わるのですが、BABファイルやKAAファイルにで「データ区分」の項目が有りますが、ここのコードに「4」があるのですが、これは何を意味してるのですか?仕様書の方には該当するコードが無いのですが。
>
>データベースの方は「データ」「計算」「ブラウズ」を分けた分離システムにしているので運営には何も影響は出てないのですが、「前日」なら「3」があるし?、なんかなぞなぞ出されているようで気になって眠れません。答えを教えてください。
仕様書のミスです。
誤 3:前日
誤 3:枠確定,4:前日
です。
ご報告ありがとうございました。
|
|