ニューラルネットワークは電気羊の夢を見るか（１）

f:id:kouhei_ito:20200322193015p:plain

はじめに

こんにちは、こうへいです。

近頃はAIや機械学習が話題にならない日はない感じとなりましたが、AIの中身を知る人はほとんどいないと思われます。

かく言う僕もその一人ですが、多くのAIの中身はニューラルネットワークであると言われています。

それなら、２０数年前Matlab/Simulinkでポチポチ作って卒論書いたなあと思い起こし、何が変わったのかと、すっかり忘れてしまったことを思い出そうと思います。

タイトルは「アンドロイドは電気羊の夢を見るか」のパクリで、あんまり本文とは関係がありませんが、AIで使われるニューラルネットワークは脳の神経細胞のニューロンを模倣していますので、夢も見るのかとふと考えたりしています。

以下は今のところ、ぼくなりのまとめでもあり、理解が間違っている可能性は十分にあるのでお気をつけください。

本記事でまとめたこと

ニューラルネットワークでできること
ニューラルネットワークとはどうなってるのか
学習とはどんなことなのか

それでは、ニューラルネットワークワークに再入門しようと思います。

はじめに
機械学習の問題
人工ニューロン
ニューラルネットワーク
学習とは重みの更新
- 学習の種類
- 教師あり学習
最小値問題、最大値問題の一般的な話
勾配法
おわりに
参考文献

機械学習の問題

ニューラールネットワークによる機械学習はデータを与えることで学習をして、「分類問題」と「回帰問題」に答えを出す事ができます。

f:id:kouhei_ito:20200321202100p:plain — 機械学習の問題

分類問題

分類問題は図の例の様に何かの画像からそれが何であるのかを分類します。文字の認識などもこれにあたります。

回帰問題

回帰問題は説明が難しいですが、図の様にデータの集まりからその傾向を取り出すことにより、次のデータを予測するなどに用います。

人工ニューロン

f:id:kouhei_ito:20200321204126p:plain — 人工ニューロン

ニューラルネットワークは上図の様な神経細胞のニューロンを模倣した人工ニューロン（以下ニューロン）を複数接続したものになります。

図の丸をノードと言います。ネットワークを図示するときは、丸の中などを描かないで省略します。

この図ではニューロンに３つの信号が入っていきますが、この数は決まっておらず複数を入力する事ができます。

図の1個のニューロンは以下の数式を表しています。

ニューロンの出力を計算する式

$\displaystyle{ y=h(w_1 x_1 + w_2 x_2 + w_3 x_3) }$

各記号の意味は次の様になります

記号	意味
$x_.$	入力
$w_.$	重み
$y$	出力
$h()$	活性化関数

計算式が示している事について説明してみます。

重み付け和

入力 $x$ には重み $w$ がかけられます。それを重み付けされた入力と呼びますが、重み付けされた入力の全ての和を計算しています。これを、重み付け和と呼びます。

活性化関数

重み付け和の大きさによってニューロンがどの程度活性化するのかを示すのが、活性化関数です。主に、あるのが

ステップ関数
シグモイド関数
ReLU関数

のようです。

ステップ関数

重み付け和が閾値より小さければ０、大きければ１の様なステップ上の関数を選んだニューロンで構成されたネットワークをパーセプトロンとよびます。歴史的にはパーセプトロンが先にあり、その後ニュラールネットワークが研究されたとのことです。

シグモイド関数

ステップ関数は非連続な関数で取り扱いが難しいので以下の式で表される、シグモイド関数を使う事が多いそうです。大昔もこれを使って作った記憶があります。

$\displaystyle{ h(x)=\frac{1}{1+e^{-ax}}\\ }$

シグモイド関数の形は下図の様になり、係数 $a$ を変える事で、急峻に切り立った形になっていきます。

f:id:kouhei_ito:20200322072436p:plain — シグモイド関数

ReLU関数

これは再勉強して知った関数ですが、最近は下図の様な形になる、ReLU関数（ReLU:Rectified Linear Unit）が用いられる事が多く、良い結果を残しているそうです。２０１１年頃になって使われ始めたらしく、９０年代に勉強していた僕は知らなかったわけです。不勉強ですが、０のところで不連続になるところはうまく取り扱えるのか疑問で、もう少しこれを使った理論展開については追いかけないとならないと思っています。