ビッグデータ

今時のパパラッチは、芸能人を待ち伏せることはないそうだ。ほとんどが、ツイッターで呟かれる「now」情報を元に、行動しているそうだ。

動画サイトHuluは、視聴者の、「PLAY」「STOP」などの操作データを収集し、そのビッグデータを解析するすることにより、誰もが面白いと思う動画(ドラマ)を作り、名誉ある賞を受賞したそうだ。

将棋に至っては、過去の膨大な対戦データを、思いもらない検索方法で取得し、機械がプロ棋士を打ち負かすほどの実力を発揮するそうだ。

その他、車に搭載されたGPS情報を記憶したビッグデータを利用して、災害時の避難誘導路選定に役立てているそうだ。

このようにビッグデータの活用はニュースで聞くが、身近で感じたことがない。

この原因は、ビッグデータの殆どが数値データであり、誰もが理解できる代物でないからだろう。

では、ビッグデータは限られた人達だけのものだろうか?

私は、違うと思う。

ビッグデータをもっと身近に感じるには、ビッグデータいや数値データの可視化にあると思う。

データの可視化

数値データを可視化できるプログラムとして有名なのは表計算プログラムだ。しかし、このプログラムが登場してから40年近く経過しており、目新しさを感じない。

PC,スマホ,タブレット近頃はTVとプラットフォームは多様化している。そんななか、限られたプラットフォームでしか動作しないデータ可視化プログラムは時代遅れとしか思えない。

そこで、私が数値データの可視化で推奨するのがHTML5だ。HTML5は従来のHTML4にくらべグラフィック機能を充実させている。2DはCANVASおよびSVG、3DはWebGLと有償のプラットフォームで提供されるAPIより充実している。

さて、ビッグデータの話に戻る。

身近なビッグデータとして、病院にある、各個人の治療を記録したカルテがある。この病歴を記録したカルテも電子化が進んでいるらしいが、日本は電子カルテ導入においては後進国らしい。

2015/01~03入院していた私が、気がついたことは、医師や看護師は何時間もPCの前にいて、データの記録、医師の看護師への指示、など、何をしているのか分らないが、患者に向き合っているより、PCの前にいる時間がながい。

それでいて、苦労して入力されたデータが有効活用されているとは思えない。また、インターネットでも電子カルテのようなビッグデータの可視化を見たことがない。

現在の日本の病院ではデータを記録するだけで、患者に対して、データの可視化を見せることがなく治療が進む。(医師にデータの可視化を要求するのも酷だけど)そして、レントゲンやMRIなどの医療画像を見せられ、「ほら良くなったでしょう」と言われる。分らない医療画像を見せられ、そう言われたら、納得できなくても「ありがとうございます」と言うしかない。

そこで、HTML5を独学で習得した自分が、己の治療を記録したデータを可視化してみることにする。

医療データの可視化

私の病歴

病名 : 2型糖尿病
病状 : 免疫力低下による後頭部の皮膚潰瘍
合併症 : 糖尿病網膜症 増殖前 右目黄班浮腫(視力低下)
皮膚潰瘍治療 : 壊死組織除去手術 分層植皮術手術
糖尿病網膜症 : レーザー治療
通院 : 糖尿病内科 眼科

入院してすぐに血糖コントロールの薬を選定するべく、食前に血糖値検査を行うことになった。

以下の値がその結果だ。(単位 mg/DL)

日付朝食前昼食前夕食前
1/31161178127
2/1134181124
2/2163182182
2/3163173122
2/4151188138
2/5140198145
2/6146
2/7100229191
2/8161246103
2/9138176110
2/10143154132
2/11144203126
2/12149151127
2/13131155136
2/14138185112
2/15142185138
2/16138181148
2/17122196132
2/18117154126
2/19141172106
2/20130158114
2/21155162113
2/22140162148
2/23137177126

※2/6手術を行っているので、以降数日の値は不正確

日本糖尿病学会が分類する基準によれば、80〜110mg/DLが優、110〜130mg/DLが良、130〜160mg/DLが可、160mg/DL以上が不可となっている。(不可は赤)

正直、この数値だけ見てもよくわからない。そこで、この数値を散布図にしてみた。

この散布図から分ることは

  • 全体的に血糖値が高い(糖尿病だからあたり前だが)
  • 昼食前の血糖値が悪い

2015/01/21の血液検査では、HbA1cが9.3%だったが2015/03/09の血液検査では、5.8%と(正常4.6~6.2)と正常だった。このことから、2月の血糖コントロールが上手くいったことが証明できる。

でも、毎日おこなった検査の結果が、全体的に血糖値が高い結果になったことが納得できない。

そこで気になったのが、毎日行う血糖値検査の方法だった。

毎日の血糖値検査は指から採血し、簡易の検査機で調べる方法だった。この検査方法が気になり、インターネットで調べらところ、簡易の血糖値検査機の誤差は当たり前の話だそうだ。

そこで、血糖値検査結果を20mg/DL補正してみた(上記散布図の「補正」をクリックして下さい。)ところ、血糖値は大体正常範囲内に収まった。したがって、全体的に血糖値が高い原因は簡易の血糖値検査機の誤差だったことが分かった。

次に昼食前の血糖値が悪いことだ。

私は、30代の頃糖尿負荷試験を受けたことがある。結果は、糖分を摂取後、私の場合普通の人より1~2時間程度遅く血糖値が正常値なるものだった。これは遺伝的な問題だと診断された。このことと、血糖値検査の結果昼食前の血糖値が悪いことから、遺伝的問題で4hでは私の血糖値は正常に戻らないことが憶測できる。

退院後、血糖コントール用の薬を処方してもらうのと眼底の定期健診の為、糖尿内科と眼科に通っている。

糖尿内科では毎回血液検査と検尿を、眼科では視力、眼圧、OCT検査を受けている。病院を退院して年半以上通院しているが、自分の体が良い方向に向かっているのか、それとも悪い方向に向かっているのか、正直全然分らない。

当面の課題は、右目黄班浮腫で、視力回復だ。右目だけだと見ている中心部が歪んで見えるが、両目では何不自由なく生活できる。

糖尿内科では眼科のことは聞かれない、また、眼科では内科のことは聞かれない。そこで、内科の診断基準となるHbA1cと眼科での診察基準になるOCT画像を連携させて、自分の現在の状況を自分自身で診断してみる。

※上記図中のホームベースの形はスライダーになっているので、ドラッグして下さい。すると、OCT画像が切り替わります。

HbA1cとOCT画像だけでは、浮腫の状態が分らなかった。そこで、OCT画像の縮尺が同じなので、浮腫の高さを測り折れ線グラフ化した。浮腫の高さは以下の画像で示すxの値を画像プログラムで測定した。


この折れ線グラフの結果から、1年半前から比べて浮腫が小さくなったことが分る。また、視力も+0.1程度から+0.5まで回復した。

上記図から分ったことは

  • HbA1cが6.0%以上になると浮腫は悪化する。
  • 浮腫は腫れが引く直前に膨れ上がるようだ。(2015/09/10)
  • 浮腫は完治することはないようだ。

このことから、糖尿病黄班浮腫患者はHbA1cが6.0%以下になるように血糖コントロールすべきだ。

ちなみに、2015/12/25ころからHbA1cが悪化した原因は、HbA1cが6.0%以下だったことを良いことに、朝食前に間食したことによる。この間食を止めて、HbA1cを6.0%以下に抑えることができた。どうも、この間食で血糖値が急上昇したことが原因だと思われる。

以下の画像はOCT画像だ。OCTは眼底黄班部の断面を画像化できる。

そして2015/02/27と2016/08/25のOCT画像を元に3D画像化してみた。

※上記3D画像をドラッグすると画像が回転します。センターホィールは拡大縮小です。

2016/08/25の3D画像から歪だが浮腫が小さくなっているのが分ると思う。ちなみに比較として左目の黄班3D画像を示す。


状態遷移図

私はテレビドラマの「DR.House」が好きだ。(ただし、ドラマで描かれるHouseの性格は大嫌いだ)病院で、手に負えない患者が最後に回されるのがHouseのところだった。

このドラマを見ていて気がついた。それは、「人間の病状は、ハードウェアとのやり取りを行うソフトウェア、つまり、割り込みコンテキス内の状態管理に近い」ということだ。そこで、通信制御(OSI トランスポート層)プログラムの製造を行っていた当時、自己流で書いていた状態遷移図をこのドラマに適用してみようと思いつた。以下がその状態遷移図だ。

※補足:内が状態(症状)、実線が遷移だ。遷移する理由は無限にあると思うが、単純に原因と処置だけにした。

現実は、病状の状態遷移はカルテという医師にしか分からない暗号で書かれている。私の自己流状態遷移が優れているは全然思わないが、医学の知識が乏しい普通の人でも理解できると思う。

暗号化したカルテのデータ化が進んでいるとニュースで聞く。でも、カルテのデータ化は現在人海戦術しかない。これでは100年たっても、カルテのデータ化は実現できないだろう。

しかし、現在ディープラーニングなどの人口知能技術が発展している。このディープラーニング技術を利用すれば、カルテのデータ化を機械的に可能となる。

カルテのデータ化が出来たらと言って終わりではない。この膨大なデータから、重要な情報検索が必要になる。その際の手段として、この状態遷移図が武器になるだろう。

Treasure hunting

インターネットで「医療データの可視化」を検索すると沢山の記事がヒットします。

しかし、現在病気で苦しんでいる人が参考になる記事は一つもありません。ほとんどが、病院や学校の宣伝です。

たしかに、医療データ(ビッグデータ)の可視化での診断は必要ですが、私はもっと別の利用方法があると思います。

それはTreasure hunting「宝探し」です。

医療データ(ビッグデータ)は膨大に存在します。でも、ほとんどが時が過ぎされば捨てられる運命にあるデータ達です。

私の血糖値検査の値も、私がメモしていなければ、捨てられる運命にあったデータでした。私の血糖値検査の結果はありふれたデータかもしれまが、データ可視化により、発見があるかもしれません。

NHKの番組で、乳幼児が感染症にならないように抗生物質を投与しなけばならないが、その時期を誤ると生命に関わる。そんな状況化で、過去の医療データからその時期を探り当てた人がいました。その人は、医師でも大学教授でもなく、経済関連のプログラムを作成していたプログラマーだったそうです。

人工知能に関わった私が思うのは、現代の人工知能技術で病気診断の正確さ80%ぐらいのシステムは構築可能です。でも、問題は残りの20%です。なぜなら、20%は生死に関わる人達だからです。私はこんな人達を助けるためにも過去のデータの掘り起こし、つまり「宝探し」が大切だと思います。

※私は60を過ぎていますが、Web上のGAMEを作りたくて、日々Blender及びthree.jsと格闘しています。こんな私ですが、もしデータの可視化などでご協力できることがあればご連絡下さい。

※病院に通院されている方、毎回病院から数値データだけ渡されて、自分の状態がどうなっているか分らず不安ではありませんか。でも、数値データを可視化し見方を変えることにより新たな発見があるかもしれません。ただ、数値データ可視化は簡単ではありません。もし、自分の数値データを可視化してみたいと思われる方がいらっしゃればご協力しますご連絡下さい。

お問い合わせ

下記フォームに必要事項を入力後、確認ボタンを押してください。

ご用件
お名前 ※必須
電話番号(半角)
Mail(半角) ※必須
性別 男 
サイトを知ったきっかけ 友人・知人  検索エンジン
お問い合わせ内容

 

※IPアドレスを記録しております。いたずらや嫌がらせ等はご遠慮ください