KnoNの学び部屋

大学に8年在籍した後無事に就職した会社員が何かやるところ。

情報の表現と論理

一気読み→一気まとめ→記事化、でやろうとおもったら、実質二週読むことになって時間かかってしまった。

章ごとにまとめをするやり方のほうがいいかな。

 

集中読書期間の1冊目

岩波講座 現代工学の基礎〈16〉情報の表現と論理 《情報系I》(安西祐一郎ほか、2003)*1

をやります。

 

 

 1 情報と人間

◯情報には「量」「パターン」「意味」「価値」の4つの側面がある。

情報の4側面

  • 量:シャノンの情報理論による定義、ビット(binary digit)
  • パターン:人間が時間的・空間的に知覚する特定のパターン(←?)
  • 意味:どのように認識・解釈するか、文脈に依存する
  • 価値:そこから何を引き出すことができるか、外の情報と結びつく

 

◯情報にはさまざまな表現の様式(modality)がある。目的に合わせて適切にデザインされた表現を行わなければならない。

→代表として次のような分類がある。

  • 記号表現:与えられた記号の集団の内部で通用する、約束事に基づいた表現
    →論理表現*2など
  • パターン表現:厳密ではなく、ファジーな関係性に基づく表現
    →特定の楽曲に対する鼻歌での再現
  • 宣言的表現:「〜である」という形式による表現
    →「机の上に本がある」という情報
  • 手続的表現:「〜をする」という形式による表現
    →「本を鞄の中に入れる」という情報

 

⇒正直、ここらへんの分類の違いはよく分からない。

 

◯既存の情報から新しい情報を創造していくための代表的な手段として「推論」がある。

推論の3類型

  • 演繹的推論:与えられた複数の情報から隠された論理的な関係を明らかにする
  • 帰納的推論:与えられた複数の情報に基づいて新しい情報を創造する
  • 発想推論:厳密な論理性ではなく直観に基づき新しい情報を創造する

 

◯情報を理解するためには「情報の内的環境」と「情報の持つ文脈」を抑えることが重要である

 

 2 表現

◯情報の表現には「何を」「どのように」「何のために」表現するかを明確にすることがポイントとなる。

情報を表現するための3項目

  • 何を:表現の内容、what
  • どのように:表現の方法、how
  • 何のために:表現の目的、why
    →他者への伝達、自身の考えの整理、効率的な問題解決

 

◯表現の方法は一つではない。表現の仕方が思考の様式(情報の処理方法)に影響を与えることもあり、表現間のトレードオフを考慮して適した表現方法を選択・提案することが重要である。

 例として数字の表現を挙げると、次のようなメリット/デメリットがある。

  • アラビア数字(1,2,10,……)
    ◯:「0」の概念と位取り表記により表記の幅が大きく、筆算もしやすい
    ×:一部を切り出した時に値が分からない、前後の付け足しで改竄しやすい
  • 漢数字(壱、弐、十、……)、ローマ数字(Ⅰ,Ⅱ,Ⅹ,……)
    ◯:桁数を間違えることがない、改竄しにくい
    ×:表記のルールが複雑、筆算できない

 

◯個々の状態に対する表現の生成には、世界を適切に抽象化(=モデル化)することが大切である。

→世界の抽象化された表現を状態記述、その集合を状態空間と呼ぶ。状態空間における状態記述間の遷移関係を示したものが状態遷移規則である。

 状態変異規則はグラフを用いて表現するとわかりやすい。

 

3 思考

◯思考を「ある課題に対処する心的操作」と定義すると、「問題を適切に表現」し「効率的な方法で解く」ことが要点となる。

問題解決の3フェーズ

  1. 問題の定式化:問題を(計算システム上で)処理可能なモデルに落とし込む
  2. 探索:表現されたモデルにおいて、問題解決のために何をすればいいのかを探る
  3. 実行:生成された行為系列を現実世界に適用する

 

 「問題が何かを突き止めた時、問題の9割はすでに解決している」という言葉があるように*3、まず「問題を定式化」することが重要となる。

 そしてそれを「どのように解決するか」だけでなく、「どのように探索したら効率よく解決手段に到達できるか」というメタ戦略が全体のパフォーマンスを左右する。

 

◯多くの場合課題は階層性を持つ。適切なレベルにおける定式化とサブゴールの設定を繰り返しながら、全体をモデル化することを試みる。

 一般に問題の定式化とは次の5つの項目を規定することである。

問題定式化のための5項目

  1. 状態空間:状態記述の集合
  2. オペレータ(モデル化された個々行為)の集合:どのような行為を取りうるか
  3. 初期状態:グラフ上のスタート地点
  4. 目標状態:グラフ上のゴール地点
  5. 状態遷移規則:状態記述間を遷移するルール

 

◯探索は状態空間上で探索木を生成していく課題として捉えることができる。可能な探索戦略の中から「完全性」「効率性」「最適性」の観点から優れたものを選択する。

 初期状態からオペレータの選択を繰り返すことで、状態記述の連なりがツリー状に表現される。これを探索木という(それを導くオベレータの連なりは行為系列という)。

 どのようにツリーを展開していくかの方針が探索戦略であるが、次の3つの観点からその良さが評価される。

探索戦略の評価基準

  • 完全性:問題の解が探索木上に存在する場合、それを確実に発見することができるか?
  • 効率性:時間計算量や空間計算量(必要なメモリ)の観点から効率良く解を発見することができるか?
  • 最適性:解が複数存在する場合に、最も優れた解を発見することができるか?

 

◯実行段階では「環境の変化に応じたリプランニング」「思考そのもののコスト」に注意する。

 いくら頭の中で検討を繰り返したとしても、いざ実行に移すとなると当初の目論見通りに行くとは限らない。モデル化の限界、環境の変化などに対する適切なリプランニングは常に求められる。

 また問題によっては「考えるより手を動かす」方が簡単に解決できるものもある。思考に必要な探索時間(時間計算量)をどう見積もるかもより大きな枠組みでの問題になってくる。

→リアクティブ・プランニング、サブサンプション=アーキテクチャなど。

 

4 学習

◯(機械)学習を構築するために「何を」「何から」「どのように」学習するかを明確にする必要がある。

 「学習」という用語には、教育学、動物心理学、脳科学などの各分野でそれぞれ文脈に応じた定義がなされているが、本章では「機械学習」の文脈で扱うことにする。

機械学習の定義

=機械に与えられる入力(経験)をE、機械に与えられたある種の課題のクラスをT、その課題の達成度(パフォーマンス)に関する指標をPとする。

 ある機会が「学習する」とは、課題Tの達成度指標Pが経験Eによって改善されることをいう。

 

 機械学習システムを構築するためには、次の3点を明確に設定する必要がある。

機械学習のための3項目

  • 何を:学習の内容、what (for) →学習内容が課題にどう利用されるか
  • 何から:学習の題材・入力、what from →入力される経験はどのようなものか
  • どのように:学習の方法、how →戦略(アルゴリズム)はどのようなものか

 

◯学習の方法としては主に「概念学習」と「強化学習」がある。その違いは外部の「教師」の存在の有無による。

  • 概念学習:外部の「教師」によりあらかじめ正負が判定された事例を学習の材料とし、具体例からその概念の一般的な定義を推論する学習方法。
  • 強化学習:環境から得られる報酬を最大化するように、ある状況下における行動選択の仕方(選好)を強化する学習方法。

5 論理

省略!

→「記号論理学入門」みたいな内容ではあるが、あくまでこのテキストで扱ったトピックを理解するためだけに書かれている。

 内容的にまとまりに欠けるため本記事では省略することとした。

 

 

【今回の宿題】

  • 「パターンとしての情報」の一般的な説明
  • 情報の表現様式の違い

 

……さすがに一回の記事でまとめるには分量が多過ぎただろうか。ポイントは外していないと思うが、それでも全体として雑な、粗っぽいまとめかたになってしまった。時間はかなりかかったけど。

 一つのものに拘泥するより全体を掴むことを重視した読み方だと考えると、こんな感じでもいいのかもしれない。

 休む間も無く2冊目に行きましょう。

 

それでは

KnoN

岩波講座 ソフトウェア科学〈〔知識〕16〉認識と学習

岩波講座 ソフトウェア科学〈〔知識〕16〉認識と学習

 

 

エージェントアプローチ人工知能 第2版

エージェントアプローチ人工知能 第2版

 

 

乳児の世界

乳児の世界

 

 

論理学

論理学

 

 

 

*1: 書誌情報のズレについて。
どやら「現代工学の基礎」シリーズは2冊一組で配本していたらしい。でもその2冊が連番とかじゃなく、おそらく出来上がった順の2冊だったので組み合わせがバラバラ。しかもそれをAmazonでは一冊の本の書誌情報として扱っているので、タイトルや著者名に混乱が生じている、ということみたいです。
→これを報告してやりたいんだけどどこにいっても(自由記述ができる)問い合わせフォームが見つからない。ひどい作りだ。

*2:テキストでは第5章で詳しく扱っているが、本記事では(まとまりにかけるので)省略する。

*3:よく聞く文句ではあるが、出典は不明。誰か知っていたら教えてください。