1.概要  Txt2CsvはISUが公開するフィギュアスケートのプロトコルであるPDFファイルをCSV形式に変換して 加工を容易にするためのjavaで作成されたツールです。  変換にあたっては事前にPDFファイルを http://www.convertpdftotext.net/ を利用して、txt形式に変換しておく必要があります。 上記サイトの変換後のテキストをさらにTxt2Csvで変換することにより ISU World Championships 2014,LADIES,FREE SKATING 1,Mao ASADA,JPN,21,13803,6527,7276,0,5945 1,3A<,600,600,0,,,,-1,0,1,-1,1,0,0,0,0 2,3F<+3Lo,880,880,0,,,,-1,-1,1,0,1,-1,1,0,0 3,3Lz,570,600,-30,,e,,-1,-1,1,-1,0,-2,1,0,-1 4,CCoSp4,436,350,86,,,,1,2,2,1,2,1,2,2,2 5,FCSp4,413,320,93,,,,1,2,2,2,2,2,2,1,2 6,2A,263,363,-100,x,,,-2,-1,-2,-2,-2,-2,-2,-2,-2 7,3S,562,462,100,x,,,1,2,1,1,1,1,2,2,2 8,3F+2Lo<+2Lo<,799,869,-70,x,,,-1,-2,0,-1,0,-2,-1,-1,-1 9,3Lo,641,561,80,x,,,1,2,1,1,0,0,2,1,2 10,FCCoSp4,443,350,93,,,,1,2,1,2,2,2,2,2,2 11,StSq4,570,390,180,,,,2,3,2,2,2,3,3,3,3 12,ChSq1,350,200,150,,,,2,3,2,2,2,2,2,2,3 SS,911,900,925,925,850,1000,875,925,900,925 TR,886,850,900,900,850,975,875,875,850,950 PE,918,900,900,950,850,975,925,925,875,950 CH,914,900,925,950,875,975,875,925,875,950 IN,918,925,925,925,875,1000,925,900,900,925 上記形式のデータを得ることができます。  ISUが公開するPDFの内部形式は様々であり、この方法で必ず上記形式への変換が可能とも限りませんが 2012〜現在(2014.4)のデータはおおむね変換可能であるとおもわれます。 ※動作確認は2014世界選手権のデータでおこなっています。 また対象としているデータは  オリンピック、世界選手権、四大陸選手権、ヨーロッパ選手権、GPシリーズ です。 五輪はテキストの修正などが必要かもしれません。  以前のデータや他の大会のデータも、入力のtxtを若干修正したり、Txt2Csvのソースを修正したりすれば 対応可能となります。 カテゴリー、セグメントめんは全カテゴリ、セグメント可能とおもっていますが、作者自身がペア、アイスダンスの プロトコルを理解しておらず対応できてない部分があるかもしれません。 このツールは作者が運営する フィギュアプロトコル検索サイト http://figure2.me/slfs/ のDBにデータをエントリーする処理をCSV出力用に書き換えたものです。 2.使用法  説明はWindowsを基本にしておこないますが、javaが実行できれば他の環境でも実行できます。 実行はjavaが必要です。 0)事前準備 javaインストール http://java.com/ja/download/ などよりダウンロードしてパソコンにインストールしておいてください。 jdkは1.6以降を対象にしています。 ツール取得 本サイトよりTxt2Csv.jarを取得しておいてください。 http://figure2.me/txt2csv/txt2csv.jar 1)ISUのサイトより、変換したいプロトコルのPDFをダウンロードしてください。 例 http://www.isuresults.com/results/wc2014/wc2014_Ladies_FS_Scores.pdf 2)ダウンロードしたpdfを次に http://www.convertpdftotext.net/ にてテキスト形式に変換してください。 2-1)対象の機能は画面の下のほうに「Convert PDF File To Text」というタイトルがあり「ファイルを選択」をクリック するとファイル選択ウィザードになる。 2-2)そこで1)でダウンロードしたPDFファイルを指定 2-3)下にある「Convrt and Download」をクリック 2-4)すると「Download」というボタンが現れるのでクリック 2-5)別タブにテキスト形式のプロトコルが表示される。 2-6)次に2-5)で表示されたタブを右クリック「名前をつけて保存」を選択し、保存します。 保存場所はTxt2Csv.jarを置いたフォルダと同じにしてください。 webブラウザchromeを使用した説明となっています。他のブラウザだと若干、違うとこがあるかもしれません。 とにかく、http://www.convertpdftotext.net/で変換してローカルにtxt形式で保存してください。 このテキストの状態でも利用法は多いとおもいますが、エレメントのデータが一部、1エレメント、複数行になっていたり して、再利用する上で支障をきたします。3)の処理でそれらの清書を含めて処理します。 3)次に2)で変換したテキストファイルをcsv形式に変換します。 WindosでDOS窓開いて、Txt2Csv.jarやダウンロードしたテキストファイルがあるフォルダに移動してください。 java -jar txt2csv.jar 変換したファイル名 でコマンド実行します。 標準出力にCSV形式で出力されます。 例)http://www.convertpdftotext.net/で変換後のファイル名がLF.txt C:\tmp\txt2csv>java -jar txt2csv.jar LF.txt ### LF.txt ### ISU World Championships 2014,LADIES,FREE SKATING 1,Mao ASADA,JPN,21,13803,6527,7276,0,5945 1,3A<,600,600,0,,,,-1,0,1,-1,1,0,0,0,0 2,3F<+3Lo,880,880,0,,,,-1,-1,1,0,1,-1,1,0,0 3,3Lz,570,600,-30,,e,,-1,-1,1,-1,0,-2,1,0,-1 4,CCoSp4,436,350,86,,,,1,2,2,1,2,1,2,2,2 5,FCSp4,413,320,93,,,,1,2,2,2,2,2,2,1,2 6,2A,263,363,-100,x,,,-2,-1,-2,-2,-2,-2,-2,-2,-2 7,3S,562,462,100,x,,,1,2,1,1,1,1,2,2,2 8,3F+2Lo<+2Lo<,799,869,-70,x,,,-1,-2,0,-1,0,-2,-1,-1,-1 9,3Lo,641,561,80,x,,,1,2,1,1,0,0,2,1,2 10,FCCoSp4,443,350,93,,,,1,2,1,2,2,2,2,2,2 11,StSq4,570,390,180,,,,2,3,2,2,2,3,3,3,3 12,ChSq1,350,200,150,,,,2,3,2,2,2,2,2,2,3 SS,911,900,925,925,850,1000,875,925,900,925 TR,886,850,900,900,850,975,875,875,850,950 PE,918,900,900,950,850,975,925,925,875,950 CH,914,900,925,950,875,975,875,925,875,950 IN,918,925,925,925,875,1000,925,900,900,925 2,Julia LIPNITSKAIA,RUS,22,13296,6557,6839,-100,5891 1,3Lz+3T,970,1010,-40,,e,,0,-1,0,-1,-1,1,-2,0,-1 2,2A+2T+2T,597,590,7,,,,0,2,0,1,0,0,0,0,0 3,FCSp4,427,320,107,,,,2,3,1,2,2,2,3,2,2 ,,,, 必要に応じてリダイレクトしてファイル出力してください。 例) C:\tmp\txt2csv>java -jar txt2csv.jar LF.txt > LF.csv 3.出力形式 以下の形式となっています。 全体)  ### 処理ファイル名 ###  大会名,カテゴリー,セグメント  1演技分のプロトコル   改行   プロトコルと改行の繰り返し 1演技のプロトコル詳細)  順位,選手名,国(3レター),滑走順,TSS,TES,PCS,DEDUCATION,エレメンツの基礎点計  1エレメンツの記述   繰り返し  1PCS種の記述   繰り返し 1エレメントの記述詳細) 順番,名前,得点,基礎店,GOE値,X,e,!,各ジャッジのGOE,各ジャッジのGOE繰り返し X,e,!は該当しない場合出力されません。",,"となる。 小数点を含む値は100倍して整数化しています。 1PCSの記述詳細) PCS種(2レター),PCS値,各ジャッジのPCS値,各ジャッジのPCS値繰り返し アイスダンスのPCS種は異なります適宜読み替えてください。 小数点を含む値は100倍して整数化しています。 4.サンプル  フォルダsample下に2014ワールドの例があります。 元のPDFはISUサイトより取得してください。 http://www.isuresults.com/results/wc2014/ .txtは http://www.convertpdftotext.net/ でPDFを変換したサンプル .csv はその.txtを本ツールで変換した、提供しようとしている形式のサンプルです。 5.サポートなど 「はてな」のブログ http://d.hatena.ne.jp/figure2me/ に書き込みするか、 figure2me@tasamu.com にメールください。 返事が遅れたり、お答えできない場合もあるかもしれません。 6.その他  1にも書いたとおり、PDF内容は様々でこのツールはすべてに対応できるものではありません。 ソースも添付していますので、改造してもっと広く利用されればとおもいます。 ソースは作者がDB登録するプログラムを改造してCSV用に改版したものであり、本ツール用でない コードも含まれています。