ここでは、Sナビのデータ抽出について、なぜRを使って自動化する必要があるかについて説明します。実は、Sナビのデータログは、下記の構成でデータが格納されています。

メインPC(Sナビの真ん中の画面がつながっているPC)

ローカルディスク(C:) 通称C ドライブ

└ INSPECTIONDATA

├ 環境別走行体験

├ 危険予測体験

├ 総合学習体験

├ 総合学習体験印刷データ

├ 反応検査印刷データ

└ 運転操作課題

これは総合学習体験印刷データのフォルダを開いたときの画像です。ご覧頂くと月ごとの各フォルダが格納されていることがわかります。

Untitled

さらに、上記各フォルダをみていくと、このようにcsvデータが格納されています。

Untitled

さらに、csvを開くと1回計測ごとのデータが格納されていて、しかも列名が付いていません。。。

Untitled

フォルダの階層は下記のようになっています。

ローカルディスク(C:) 通称C ドライブ

└ INSPECTIONDATA

├ 環境別走行体験

├ 危険予測体験

├ 総合学習体験

├ 総合学習体験印刷データ

├ 202204

| ├ 20220401131105_1.csv

| ├ 20220402151406_1.csv

|

├ 202205

これを一つずつ開いてコピペという作業は症例が数人だけのうちは良いかもしれませんが、100人200人と増えてくると苦行です。臨床業務の合間やプライベートの時間を割いて進めるのは非常に大変で、場合によっては発狂してきます。。。当然ヒューマンエラーも起こる確率も上がり、漏れなどのミスにも繋がります。しかも、列名も付いていませんので、非常に面倒な作業となります。

今回はこのデータの抽出・コピペ、列名を付けて以下のようなデータセットを作るフローをRで一気に自動化しようという試みです(念のため下記のIDと名前はモザイクを掛けています)。

Untitled

ここまで自動化できると、あとはデータクリーニング(測定がうまくできなかった日時の日時のデータを除外する)をして、神経心理検査のデータベースや運転評価結果のデータベース、アウトカム(運転再開可否)のデータを下記の方法でマッチングして結合してしまえばすべてが串刺しになったデータセットの完成です。

Untitled