近年、AIの発達は目覚ましいです。色々な分野で「AI」を使っています。
例えば
- 将棋電王戦:2013年にはプロ棋士5人コンピュータが戦いプロ棋士1勝3敗
- 2011年人工知能「ワトソン」がアメリカの有名なクイズ番組で人間のチャンピオンを破る
- 2014年三井住友銀行、コールセンターに「ワトソン」
- ロボットは東大に入れるか 「東ロボくん」
2014年には全国センター模試で全国581に私立大学の8割にあたる472大学で合格化可能性8割のA判定
- 自動車の自動運転
- 2014年ソフトバンクがPepperを開発感情エンジンの人工知能
- ロボット掃除機ルンバ
- iPhoneのSiri
と、あげればきりがない状態です。
もちろん医療の分野にも「画像診断」といったAIがあります。
では、AIとはいったい何でしょうか。
AIとは・・・?
人工知能(AI)とは
「人工的につくられた人間のような知能」であり「気づくことのできるコンピュータ」
などと言われたりしていますが、実のところ明確な定義がありません。
が、だいたいこんなイメージです。
現在、
- 人工知能を搭載した商品
- 人工知能を使ったシステム
は増えているが人工知能はできていない状態です。
そしてAIには「強いAI」と「弱いAI」に分類することができます。
強いAI
正しい入力と出力を備え、適切にプログラムされたコンピュータは、人間が心を持つのとまったく同じ意味で心を持つ
弱いAI
心を持つ必要がなく、限定された知能によって一見知的な問題解決が行えればよい
現時点では「強いAI」は作られておらず、現在日常で使用されているAIは「弱いAI」になります。
中国語の部屋
中国語の部屋とは、
中国語が分からない人が膨大なマニュアルに従って入力された文字を確認し、決められた返答をすることによって会話が成立したように見えても、その人は中国語を理解していないのではないかという議論
です。
人の思考を表面的に模倣するような「弱いAI」は実現可能でも、 意識を持ち意味を理解するような「 強いAI」は実現不可能という説明のための思考実験になります。
知能があるかどうかの受け答えテストを実施したとしても、本当に知能があるかどうかはわからないというものです。
シンギュラリティ(技術的特異点)
人工知能が十分賢くなって、自分自身より賢い人工知能を作れるようになった瞬間、無限に知能の高い存在が出現するようになります。このような状態をシンギュラリティ(技術的特異点)といいます。
完全な人工知能が完成できたら、それは人類の終焉を意味するかもしれない
人工知能にはかなり慎重に取り組む必要がある。結果的に悪魔を呼び出していることになるからだ
私も人工知能に懸念を抱く側にいるひとりだ
と、著名人たちも警鐘を鳴らしています。
今後のAIと仕事の関係性
2014年イギリスデロイト社よりイギリスの仕事のうち35%が今後20年でロボットに置き換わる可能性があると発表されました。
また、オックスフォード大学の研究報告ではIT化の影響によって今後10~20年でアメリカの702の職業のうち約半分が失われる可能性があると発表されました。
今後、AIに仕事が奪われてしまうのでしょうか。
AIが人間の仕事をするのでしょうか。
確かに、AIが得意とする仕事はAIが担当するかもしれませんが、人間が得意とする部分は人間が行っていくと思います。
AIが仕事を奪うのではなく、AIで仕事をするといったイメージだと思います。
では、今現在AIにはどのような種類があるのでしょうか。見ていきましょう。
単純な制御プログラムを人工知能と称している
- マーケティング的に人工知能、AIと称しているもの
- エアコンや掃除機、洗濯機など
厳格なルールを決め、その通りに動くだけの、アルバイトみたいな感じ。
縦〇センチ、横〇センチ、高さ〇センチ以上の荷物は大、〇センチから〇センチまでは中、それ未満は小など厳格なルールを決めてその通りに動くようなものです。
古典的な人工知能
古典的な人工知能とは「ふるまいのパターンが極めて多彩なもの」であり、推論、探索を行っています。古典的なパズルを解いたり、診断プログラムなどをさします。
たくさんのルールを理解し判断する会社員みたいな感じ。
荷物の縦、横、高さ、重さでの仕分け+荷物の種類に対する知識をもち、「割れ物注意」、「天地無用」など判断することが可能です。
探索木
SからスタートしてAに行くパターン、Dに行くパターンと、どんどん繰り返していく「場合分け」のようなものです。
こっちに行った場合、あっちに行った場合とドンドン場合分けをしていけば、いつかは目的とする条件が出現します。
深さ優先探索
とにかくいけるとことまで掘り下げてから次の枝葉に移る
必ずしも最短の解を最初に見つけないがだめなら戻ってやり直すためメモリはそれほど必要ない。運が良ければ時間は短く、運が悪いと時間がかかる。
幅優先探索
同じ階層をしらみつぶしに当たってから次の階層に進むため、ゴールまで最短距離で進みます。
途中を全て記憶しなければならないためメモリがたくさん必要になります。
探索の分野
探索の研究ではオセロ、チェス、将棋、囲碁などが有名です。
オセロでは10の60乗、チェスでは10の120乗、将棋では10の220乗、囲碁では10の360乗通りあります。組み合わせが多くすぎて最後までしらみつぶしに探すことができません。そのため、盤面を評価するスコアを作り、そのスコアがよくなるように次の手を探索する手法がとられています。
盤面の評価には、データの中のどこに注目するか(特微量)が重要になります。
- 王手されているか
- 王将がどのくらい前にいるか
と言ったものも特微量です。
また、2つのコマの関係ではなく3つのコマの関係、例えば、王将と銀の位置関係などをみたほうが有効ということが分かってきました。
モンテカルロ法
モンテカルロ法は、ある局面まで来たらコマの数や位置関係によって点数付けを放棄し、交互に完全ランダムに手をさし続け、とにかく終局させます(プレイアウト)。最初の試行では自分、次は相手が勝った、と例えば100回繰り返した結果、60勝40敗ならスコア60点、80勝20敗なら80点と評価します。そうやってひたすらランダムにさし続け、勝率で盤面を評価した方が最終的に強くなります。
この手法は特に囲碁の世界で取り入れられています。
探索木の問題点
迷路を解くもの、パズルを解くもの、チェスや将棋などいわゆるトイプログラム(おもちゃの問題)しか解けないことが明らかになりました。
知識をベースに入れる
- 医師の代わりをするため「病気に関するたくさんの知識」
- 弁護士の代わりをするため「法律に関する知識」
病気を診断したり、判例に従った法律の解釈など、現実問題を解くことが可能になる
エキスパートシステム
その分野でエキスパート(専門家)のようにふるまうシステム。
問題点
- 専門家からヒアリングして知識をとり出さないといけない
- 知識が増えるとい互いに矛盾したり一貫性が無かったりする
- お腹が痛い、胃がむかむかするなど「あいまいな症状」の難易度が高い
- 常識レベルの知識が難敵になる
人間が持つすべての知識をコンピュータに入力しようとすると
「パリはフランスの首都だ」、「すべての木は植物だ」と一般常識レベルの知識が膨大であり、形式的に記述することは非常に難しいのです。
意味ネットワーク
意味 ネットワーク(semantic network)は、もともと認知心理学における長期記憶の構造モデルとして考案されたもので「Is-a関係」と「Part-of関係」が重要になります。
- Is-a関係:上位下位関係
犬は哺乳類だ、イチゴは果物であるなどカテゴリ関係
- Part-of関係:部分が全体に含まれる
手は人間の一部、指は手の一部など
また、「推移律」も重要になります。
推移律:AとBに関係があり、BとCに関係があればAとCにも関係が成り立つ
- 1より3が大きく、3より7が大きければ必ず1より7が大きい
- じゃんけんの強さでは推移律は成り立たない
Is-a関係では「人間は哺乳類だ→哺乳類は動物だ→人間は動物だ」のように推移律が成り立ちそうです。ではPart-of関係ではどうでしょうか。
Part-of関係では
- 親指は山田太郎の一部だ→山田太郎は取締役会の一部だ→親指は取締役会の一部だ
とはならないため、Part-of関係は成り立たないこともありそうです。
- 車輪は自転車の一部だ→自転車のほうは車輪が無ければ自転車ではないが、車輪は自転車があってもなくても車輪。
- 木は森の一部だ→森から木を一本抜けても森のまま、木も木のまま。
- 夫は夫婦の一部だ→夫が無ければ妻ではないし、妻が無ければ夫ではない。
と、Part-of関係ひとつでも細かな違いがあります。
よって、人間が普通に使っている知識をコンピュータに適切に入力しようとすると非常に難しいことがわかります。
フレーム問題
フレーム問題とは、
あらゆるタスクを実行するのに「関係ある知識だけを取り出して使う」という、人間ならごく当たり前にできる作業がいかに難しい問題なのか
というものです。
どういうことでしょうか。ロボットを例に考えていきます。
- 洞窟の中にロボットを動かすバッテリーがある
- その上に時限爆弾が仕掛けられている
このような状況でロボットは洞窟からバッテリーを持ってくるように指示されました。
バッテリーを取ってこなければバッテリー切れで動けなくなってしまうためです。
- ロボット1号
バッテリーを洞窟から持ってくることができました。しかしロボットはバッテリーの上にのっている時限爆弾も一緒に持ってきてしまいました。時限爆弾がのっていることは知っていましたが、バッテリーを持ち出すと爆弾も一緒に持ち出してしまうことを知らなかったためです。
- ロボット2号
「自分が何かをしたら、その行動に伴って副次的に起こること」を考慮するように作成されました。ロボット2号は
- 自分がワゴンを引っ張たら壁の色がかわるだろうか
- 天井は落ちてこないか
などありとあらゆる可能性を考えてしまい、時間切れで時限爆弾が爆発してしまいました。
- ロボット3号
「目的を遂行する前に無関係な事項を考慮しないように」と改良されたが関係あることないことを無限に仕分けて洞窟に入る前に爆発してしまいました。
シンボルグラウンディング問題
シンボルグランディング問題とは
記号(シンボル)をそれが意味するものと結び付けられるかどうかを問うもの
です。
人はシマウマという動物がいて、シマシマのある馬と教えたらシマウマを認識できますが、コンピュータは「シマウマはシマウマのある馬」という記述できてもそれが何を示すかわかりません。シマウマというシンボルとそれを意味するものがグラウンディングしません。
機械学習を取り入れた人工知能
機械学習とは入力と出力を関係づける方法がデータをもとに学習する手法です。
サンプルデータが多ければ多いほど、良い結果が得られます。インターネットの普及に伴い様々なデータ数が増え、機械学習はそれらのデータを活用しています。
検索エンジンに内蔵、迷惑メールのスパムフィルターなど、ビックデータをもとに自動的に判断し、機械学習により実用化されています。
いくつかのサンプルが与えられてこれは大、これは中、これは小、これはどこにもあてはまらないと判断して自分で仕分けする、決められたチェック項目に従って業務を良くしていく課長みたいな感じです。
学習とは
学習するとは分けることであり、「イエス、ノー問題」です。
これは食べ物なのか、お金を貸していいか、猫なのか、犬なのか
などの判断はすべて「イエス、ノー問題」となります。
そして機械学習はコンピュータが大量のデータを処理しながら分け方を自動的に習得することをさします。この分け方を習得することが難しく、逆に分け方さえわかってしまえば、瞬時に分けることが可能になります。
機械学習はおおきく、
- 教師あり学習
- 教師なし学習
に分けることができます。
では、これらを見ていきましょう。
教師あり学習
教師あり学習とは
入力と正しい出力がセットになった訓練データを用意してある入力がされたとき、正しい出力ができるよう学習させる
ことをさします。
文章分類:政治系、経済系、化学系などのカテゴリ分け
画像分類:ヨット、花、ねこ、いぬなど
のような感じです。
統計的自然言語処理
統計的自然言語処理とは
文法中の意味や構造を考えず、訳される可能性が高いものを当てはめる
です。
- 英語でこういう単語の場合日本語でこう訳される可能性が高い
- 英語でこういうフレーズの時はこういうフレーズに訳される可能性が高い
と、単純に当てはめていきます。
インターネットが普及し、ウェブページのテキストを使うことで大幅に進歩しました。
教師なし学習
教師なし学習とは
入力データのみをあたえ、データの中にあるルールやパターンをつかむ
ことです。
- 遠くからきて平均購買単価が高い、近くからきていて平均購買単価が低いなどクラスタリング
- おむつとビールが一緒に買われているなどパターンマイニング
などです。
ニューラルネットワーク
ニューラルネットワークは人間の脳神経をまねています。
人間の脳はニューロンで構成されており、ニューロンは他のニューロンとつながったシナプスから電気刺激を受け取り、その電気が一定以上だと発火して次のニューロンに電気信号が伝わります。あるニューロンが他のニューロンから0か1の刺激を受け取り、その値に何らかの重みづけを行い、一定の閾値を超えると1、越えなければ0となり、次のニューロンに渡されていきます。
ニューラルネットワークでは入力を受け取る部分を入力層、出力する部分を出力層、 入力層と出力層におけるニューロンの間のつながりは重みで表され、どれだけの電気信号を伝えるか調整します。
ディープラーニングを取り入れた人工知能
ディープラーニングとは機械学習をする際の変数事体を学習します。
このタイプの荷物はサイズ的に第かもしれないが、他と明らかに形状が異なるため別扱いした方がいいと、自分でルールを作り、時間がたつほど一番効率的な仕分けを学んでいく、チェック項目まで自分で発見するマネージャークラスといった感じ。
多階層のニューラルネットワーク
多階層のニューラルネットワークはニューラルネットワークを何層にも深く(ディープ)重ねていきます。当然、階層を深くしていくことで精度があがっていくと思われましたが、実際には精度は上がりませんでした。
3層だとうまくいくのに、4層・5層と深くして言っても精度が上がらない。
なぜかというと、例えば
組織の階層が深くなりすぎると、一番上の上司の判断が良かった、悪かったが末端の従業員に到達することには影響力がほとんどなくなってしまうことに似ています。
しかし、ディープラーニングは多階層のニューラルネットワークを実現しました。それには
- 一層ずつ階層ごとに学習
- 自己符号化器(オートエンコーダー)という情報圧縮器
が関わってきます。
自己符号化器
ニューラルネットワークを作る際、正解を与えて学習させる必要がありました。
手書きの3という画像を見せれば、正解の3を与えるといった具合です。
しかし、自己符号化器では「出力」と「入力」を同じにします。
手書きの3の画像を入力して、答えは同じ手書きの3の画像にして答え合わせをします。
これは一見意味がないように思えますが、この学習により隠れ層には「入力の情報が圧縮されたもの」が反映されます。情報が要約されたというイメージです。
この行為そのものはディープニューラルネットワークではありません。
ではディープにするにはどうすればよいでしょうか。
それは、この行為を入力層から近い順番に行っていけばよいのです。
肝心なことは一気に学習すのではなく、順番に行っていくことです。
順番に学習していくことにより、隠れ層の重みが調整されるため、ニューラルネットワーク全体で見ても調整されることになります。
医療機器×AI
医療機器にAIが搭載された例を少しばかり紹介します。
超音波画像診断における影の自動検出
骨などに超音波が反射することでうまく画像が取得できない場合、そのまま解析してしまうと誤った結果になってしまう可能性があります。
そのため、「自己符号化器」を利用して影の自動検出を行うことでデータの再取得を促すことを可能にしています。
ディープラーニングを利用した脳MRI
MRIモダリティ進化により画像情報が膨大化し、読影診断を担う医師などの作業量が増加しています。そんな中、「医師の働き方改革」により負担軽減を目指してディープラーニングを活用し、脳動脈瘤の疑いがある部分を検出するソフトウェアが提供開始されました。
このソフトウェアは医薬品医療機器等法により、管理医療機器として承認。
さいごに
今回は「AIについて」記載していきました。
医療業界は他の業界と比べ、デジタル化が進んでいない領域になりますが
- 医師の働き方改革
- オンライン診療
などで一気にデジタル化が進む可能性があります。
そのため今後、医療機器×AIは当たり前になっていくと考えられます。
医療機器とAIは切ってもきれぬ関係であり、医療機器と医療従事者も切ってもきれぬ関係だと思います。
医療機器のプロフェッショナルとなるべくAIについて、どんどん勉強していきましょう。
わたしも勉強していきます。
↓医療のデジタル化、働き方改革関連の記事
参考図書・PR
- 人工知能は人間を超えるか ディープラーニングの先にあるもの
AIの入門書、非常に分かりやすいです。
コメント