ここでは、抽出したSナビのデータと病院で記録している神経心理検査などのデータベースに格納されているデータをマッチングさせて結合するRコードについて紹介する。

前提条件として、Sナビの対象者の識別は「ID」列で実施されているため、神経心理検査のデータベースも「ID」列を作っておくことが必要である。 例えば、Sナビデータでは列名が「ID」と記載されているのに、神経心理検査データベースでは識別番号などと記載されている場合はマッチングにエラーが生じる。

# IDが入っているカルテから集積したデータセットを用意する
dat2<-read_csv("神経心理検査が格納されている.csv")

#今回はdatとdat2について、IDをkeyにしてマッチング・結合
finaldata<-left_join(dat,dat2,by=c("ID"))

ここで神経心理検査データの中に実車運転評価結果や運転再開可否の項目を入れ込んでおくことで、運転再開可否別に平均値や標準偏差、グラフ化をすることができる。

もう一点大事なこととして、例えばAさんが総合学習体験を2回走行していたりすると、2回分がマッチングされることになる(Aさんの総合学習体験の1回目を①、2回目を②とすると、①と神経心理検査データ、②と神経心理検査データがマッチングされ、Aさんのデータが2個存在することになる).①が途中で気分が悪くなって中断した、検査指示の理解が甘かった場合などについては、①を削除する必要が出てくる.このデータクリーニングについては、各施設で確認するしかない.

あとはお好みで。

参考

Rグラフギャラリー ggplot package

https://r-graph-gallery.com/

gtsummary package

gtsummaryとは 人気・最新記事を集めました - はてな