人工知能って要は確率とか統計学じゃん。


スポンサーリンク

自然言語処理とか統計学の勉強初めて思ったことがある。世の中で一般的に「人工知能」とか言われているものはただの数学」の産物であるということ。

 

自然言語処理という言葉を知らない人のために軽く言葉について説明する。google検索とかsiri、アマゾンアレクサみたいな「音声認識」「文字検索」といったこれらの技術に使用されているものだ。これらには全て「自然言語処理」が使われている。

  >>自然言語処理の基本と技術 (仕組みが見えるゼロからわかる)
     

 

      >>言語処理のための機械学習入門 (自然言語処理シリーズ)
       

 

人間が生み出した言語とはプログラミング言語とかがあるが、それらではなく我々が普段話している言語のことを「自然言語」という。

それを数学(主に確率、統計学)の知識を使って統計処理しコンピュータに理解させるために「色々」することを「自然言語処理」という。

 

ここでいう「色々」というのは自分でも全てを述べることはできないが、例えばネット上にある大量の文章をコンピューターに読みこませることで、「この語とこの語のあとはだいたいこのパターンが~%だな」とか「この単語が多い文章はこのカテゴリーに属するな」とかそう言ったことを学習させる。そのために、文章を単語に分解させることから始まり、どの単語が何回出現するかとか、そういったことをプログラミングで処理させるのが一例だろう。

 


スポンサーリンク

 

もちろん大量の文章を学習させれば、そのうち前後の単語から品詞の推測や、適切な単語の意味を予測すると言ったこともできるわけである。最近ではgoogle翻訳などにももちろん、このような確率論の基礎的な知識が使われているわけである。

 

長くなったが上で述べてきたようなことが、自然言語処理とか統計学を自学してわかったのである。

 

人工知能というより、その正体を知っている人からしたらただの「数学」である。

やっていることは

  1. 文章ファイルをコンピュータに読み込ませる
  2. 数学的に処理できるように文章を色々分解したりする(自然言語処理)
  3. 数学的に記憶させ(データを蓄積させ)、新しいデータを与える
  4. 新しいデータが与えられた時に、何かしらの出力を返すようにソフトウェアを作る

最後のプロセスは文章のカテゴリー判別が目的ならカテゴリーを表示するようにするし、正答率などの数値的な指標を知ることが目的なら、それを表示するようにする可能性もある。

一般的な検索エンジンでは、単語が検索バーに入力された時に、「その単語を含む記事かつ、webページの評価が高いものを出力する」ようにアプリケーションが設計されているわけだ。

webページの評価指標には色々あるが、一番有名なのはgoogleの創始者のラリーペイジが開発した「ページランク」が有名だろう。

 

googleの創始者の一人「ラリーペイジ」

 

「ページランク」はより多くの人にアクセスされたり、別の記事内で引用されたりすると評価が高くなるものである。webページとラリーペイジがうまくかかっている笑

 

以上のことからも理解できると思うが、ただの数学だ。

 

しかしその挙動が、「我々の日常的なスピードよりも速く、大量の計算を実行し、オートに何かしらの出力を返す」からあたかも生きているように見えるのだ。

 

しかもオートに出力するように設計しているのは我々人間である。

 

それが人工知能の正体だ。

 

この名前に違和感があるので、別の名前にしてほしいと思う今日この頃笑

 

 

 

記事が役に立ったらシェア!

投稿者:

中村 俊

中村 俊

1993/09/04生まれ。機械系大学院を休学し、ベンチャーでインターンしている最中。直近では、デカルトの「方法序説」に感銘を受けた。 趣味:読書、web開発の勉強、異分野の論文読んだり、記事書いたり。 最終的には経営者か研究者になりたい。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA