ご依頼内容
- 大学の先生からのご依頼で、データの評価をする際に、昔の論文に記載のある統計処理を行い、比較検証を行いたいのだが、昔の統計処理のプログラムが、IBMのSystem 360等のコンピュータ用の、BMDPのプログラムを用いており、そのままでは動作しないので、同等機能の統計処理プログラムを作成して欲しいとのこと。
- プログラムの言語等は何でも良いが、ユーザーに分かりやすい使い勝手であること。
- 昔のプログラムと、同等の処理を行えることを再現できること。
- 論文の締め切りが迫っているので、早急に仕上げて欲しいとのこと。
課題
今回のプロジェクトを進めるにあたり、調査をした結果、下記のような課題が見つかった。
- BMDPのサポートは終了しており、同等機能を実現するには、何か別のツールやライブラリを利用する必要があること。
- お客様の統計処理は、昔の論文に掲載されている特殊な処理であり、統計処理部分のコーディングが必要であること。したがって、Rなどの統計処理ツールの関数を、そのまま利用するのではなく、カスタマイズが必要なこと。
- 昔の論文のプログラムやデータが無いので、サンプルデータをこちらで生成して、確認する必要があること。
- お客様のPC環境で、安定的に動作する必要があること。
ソリューション
- お客様の統計処理は、昔の論文にある特殊な処理であり、まず、論文を読むところから開始し、処理の流れと理論的な内容を把握した。
- 今回の一連の統計処理の中で、重回帰分析の変数選択(モデル選択)を行う箇所があり、処理が複雑であったことから、MATLABのStatistics Toolboxや、Rなどの統計処理ができるツールを使う方が、一から作成するよりも良いと判断。
- お客様の処理では、モデル選択にforwardのstepwise regressionの手法で行うが、その際の基準がMallowsのCpを基準に行う。ツールの関数等を調査した結果、MATLABではモデル選択の基準にAICやBIC等を利用するものはあったが、Cpを基準に行うことが出来るのは、Rのライブラリで可能であることが分かり、今回はRで実装することにした。
- 昔の論文のプログラムやデータ等は無かったため、検証用のサンプルデータ等を生成し、Rで動作の確認を行った。
- お客様のPCにRをインストールして、実行していただいたが、OSのバージョンの違い等が原因で、動作しなかった。そこで、弊社でサーバを立ち上げ、R Serverをインストールし、お客様のWebのブラウザで、動作の確認ができるようにした。PC等の環境は関係なく、どこでも動作できるようにして、リリースを行った。
- Rの使用方法が不慣れと伺ったので、使用方法を説明した動画を作成し、リリースに合わせて、お客様にご提供した。
結果
- 昔の論文の統計処理と同等の処理を行うプログラムを作成し、動作検証も行い、リリースできた。
- 当初、お客様のPCでプログラムが動作しなかったが、サーバ側で処理するように変更し、ブラウザベースで動作検証できる環境を整えて、リリースした。使用方法の動画も作成し、ご提供した。
- 古い統計処理プログラムや、論文に掲載されている統計処理方法でも、現在の環境で動作しないもの、すでにサポートが終了してしまったものなどは、よくあります。これらの統計処理を行うために、Rなどの現在のツールで、プログラムを置き換えるというお問い合わせを、いただくことがあります。
- 弊社は、論文を読むところから始めて、処理内容の理解、今の統計処理ツールへの置き換え、サンプルデータを使っての動作検証を行い、お客様に納品いたします。
- 途中経過や、論文を読んだ際の疑問点等が出てきますが、その都度、資料を作成し、お客様とご相談、確認をした上で、実装を進めるスタイルをとっています。
- また、今回のように、お客様のPCで動作しなかった場合は、サーバ側で機能を提供するなど、柔軟に対応しています。
- Rの使用方法が不慣れなお客様のために、使用方法を説明した動画を作成し、お客様にご提供することもしています。
- 今回のような事例にご興味のある方は、お気軽にお問い合わせください。
本事例のご利用サービス
お問い合わせ
開発事例にご興味ありましたら、お気軽にお問い合わせ下さい。
下記の、「今すぐお問い合わせ」をクリックして、フォームにご記入下さい。
早急に回答致します。