Goodfind講師ブログ

次代を創るビジネスリーダーのためのキャリアサイトGoodfind

大学卒業後30年たって気づいたギャップと発見

1988年学部卒、その後、数学科ドクターに行き1993年に外資系コンサルに就職しました。就職後独立したり連続起業家になったりして世界も周りいろいろなものを見てきましたが、学生時代に思っていたことと大きなギャップがあったので今回はそれらをまとめてみました。
特に大学生など若い人の参考になれば幸いです。(*箇条書きでまとまっておらずスミマセン)

 

・自分は自然科学が好きで向いていて、文系就職してもこの傾向は変わらない。サイエンスが生かせる分野は結構たくさんありコンサル会社はその一つでよかった。(今は大学院で経済や経営を教えているが、実は今でも数学と物理のほうが得意で心地よい。)
・コンサルでうまくいった理由は自然科学の態度で観察する力。これは完全に数学と物理の研究の副産物。
・言語表現は社会人になってからのびた。とくに論理的に表現する能力は、こなした時間と共に指数関数的に進歩した。
・記憶力や学習方法にはテクニックがある。動機付けとプロセスの工夫をすると改善余地は大きく誰にでもかなり伸びしろがある。
・個人の持つ可能性は想像以上に大きい。昔は将来の可能性に対して否定的だったが、自分の思いもしない良いシナリオがたくさんあることが分かった。多くの人、特に日本人は謙虚になりすぎて自分の可能性を自ら否定しているふしがある。これはもったいないので是非『勘違い』して高みを目指してほしい。
・世の中の変化は結構激しい。自分も周囲もどんどん変わっていくのでほぼ予測不可能。
・価値観や世界観は結局自分の見たものだけで形成される。これらは客観性を求めるものではなく人と比べるものでもない。
・客観的と思われる科学の常識も新しい発見で時に180度変化する。例えばマーガリンはバターより健康的とか、静的なストレッチはウォームアップに良いなど。
・体力はトレーニングをすることで意外と落ちていかない。特に最大筋力、持久力はともに最小限のトレーニングでもそこそこ維持できる。
(ダメになるものもあり、動体視力、瞬発力、反転力、バランスなどはなかなか維持は難しく感じる)
・飲食と睡眠が人生ではかなり重要。特に心身の健康維持は頭脳労働者にとっても大切。
・上手に年齢を経ないと自分の変化に気づかない。それは10代から20代への変化でも同じ。自覚はなくとも年齢が上がり立場も変わるので他人から見えている自分の姿は変わる。
・年長者もそれほど凄い人ばかりではない。年長者への敬いは凄く美しい態度でこれには100%賛成であるが、無条件に彼らの言うことを聞いたり真似る必要はない。
・世界は広く、知識も無限にある。あのニュートンが自分はほんの一部しか分からないと言っていたが、本当にその通りだ。(少年老い易く学成り難し、孔子
・年齢と共に賢くなったり悟ることがある。(論語より「子曰く、吾十有五にして学に志す、三十にして立つ、四十にして惑わず、、、」)
・歴史から学ぶことはたくさんある。人類は同じような過ちを繰り返しているが、それは大変残念なことである。
・学問の基本は「読み、書き、そろばん」の原則は今でもなりたつ。分野で言うなら国語と算数は両方大切で、文系だからとか理系だからどちらかはダメという言い訳はよくない。

・年齢が上になるほど学ぶことの重要性を強く感じる。若いときにしっかりやっておいたほうがよいことはずばり”英語の勉強”!自分は”ちゃんと”やらなかったので今でも不完全で苦労している。

 ・日本は世界の中で小さいがプレゼンスもあり特徴のある国である。そして日本人は海外に出ればいろいろな点で特殊な習慣や価値観をもつ人々である。

・人生の成功確率は、情報量とネットワークがあると格段に上がる。したがって狭い世界にこもっていればどんどん確率は下がっていく。

・ニュースや本、メディア、教育、思想、科学などどれも完全なものではない。時にそこには利害関係者の恣意がはいっており、それに気づかないと洗脳状態になる。

 

「論理(ロジック)」について学びなおす~その6(相関と因果)「バスケットをやると身長が伸びる?」~

 
「バスケットボールの選手は身長が高い。よってバスケットボールをすると背が伸びる」
「ピアノを習う子は勉強ができる。よってピアノを習うと勉強ができるようになる」
 
よく聞きそうな話である。しかしなんか怪しいくないだろうか?
 
今回は二つ以上の物事の関係を表す「相関関係」と「因果関係」について解説します。
 
まず冒頭の
 
「バスケットボールの選手は身長が高い。よってバスケットボールをすると背が伸びる」
 
は正しい推論だろうか?
 
まず推論の検証の前に現在分かっていることを確認すると、遺伝子に関する統計的な調査で身長には遺伝子が大きく関係する。だからと言って科学的な結論は「遺伝子が全てだ!」とまでは言っておらず、「遺伝子の影響が大きい」と言っているに過ぎない。
 
では身長を決める要因として「遺伝子」以外に「バスケットボール」は関係あるのであろうか?
 
結論から述べると、これだけでの情報では分からない。
少なくとも論理的に言えることは、
「バスケットボール選手の身長が高い」ということから「バスケットボールをすると身長が伸びる」ということは導けない。
 
おそらくは、ゴールが高いところにあるバスケットボールでは身長が高いとゴールに近いため有利である。その特徴のため身長の高い人が選手として残っていく。というのが正しい推論だろう。
 
ここで「相関関係」という言葉について説明すると、「バスケットボールの選手である」ということと「身長が高い」という事実が同時に起こりやすいときに「相関がある」という用語で表す。より一般的な言い方をすると「一つの事象の性質が強くなればなるほど、もう一つの事象の性質も強く(または弱く)なる時”相関(関係)がある”」という。
簡単な例では身長と体重は相関関係がある。一般には「身長」が高くなればなるほど「体重」は大きくなる傾向がある。これは統計的に正しい事実で、我々も経験上よくわかっている。
 
「身長」と「体重」の例は初歩の統計学で相関関係の典型例として教えられ、だいたいクラスなどの中でサンプルを30名くらいとれば、グラフに示すと身長と体重の関係は右肩上がりに散らばっているのを見たことがある人は多いはずだ。数学の用語ではこれに度合いを付けて「相関係数」という数字でその強さを表現したり、近似する一次直線を求めたりする。
ちなみに相関は2つの変数(対象」だけを扱うわけではなく3つ以上でも問題ない。例えば「身長」、「体重」、「体積」の3つを取ったとすると、これもそれぞれ相関関係がある。
 
このように「相関」というのは2つの対象がそれぞれ他方と連携しているか、というのがこの用語を使う気持ちである。
ここで注意したいことは相関する2つを考える場合、それらの間には時間の前後(Aが起こったからBがおこる)や因果関係(AはBの原因である)は必ずしもないということである。(つまり関係ない)
 
ここでさりげなく述べたが
 
(1)時間の前後がない
(2)因果関係がない
 
に注意してほしい。
 
(1)「バスケットボールをする」=>「身長が伸びる」には時間の前後がある
(2)「バスケットボールをする」=>「身長が伸びる」と考えるときには因果関係を想定している
 
この例で言えることは
 
「バスケットボールの選手」<=>「背が高い」 *相関関係がある
 
だけであり、上記の時間の前後や因果関係は一切ない。
 
 
 
(★ここ大事)
今回の話の結論をここでまとめると、以下のようになる。
 
「相関関係」がある時に時間的な順序や因果関係を勝手に想定しない!
 
ちなみに、しかしなぜ我々はそのような誤解をしがちなのであろうか?それには理由があり、そこを理解するとこのバグに引っかかることが少なくなりますので、「疑似相関」について解説しようと思います。
 
「バスケットボールの選手であること」と「背が高いこと」は相関関係はありるが因果関係はありません。この2つを結び付けているのは「(ゴールの位置が高い)バスケットボールは背が高いことは有利」という事象です。
 
「バスケットボールの選手である」<=>「(ゴールの位置が高い)バスケットボールは背が高いことが有利」
「背が高い」<=>「(ゴールの位置が高い)バスケットボールは背が高いことが有利」
 
このように2つの事象を関係づける”第三の”事象があって初めて関係が説明されます。
このような時に元の2つの関係を「疑似相関」とよびます。
 
「擬似相関」とは、2つの事象に因果関係がないのに、第三の要因により因果関係があるかのように推論されること。(少し厳密ではない言い方ですが、ここではこの言い方をします)
 
 
他の例で説明すると
 
「ピアノを習っている子供の学校の成績は良い。ピアノを習うことで学校の成績が良くなる」
 
ここでの2つの事象を結び付けているのは、「良い家庭環境」でしょう。これがある家はピアノを習わせているし、たぶん勉強もしっかししているので学校の成績が良くなります。
 
最後になりますがこれを読んでいる就職活動をしている人には、この疑似相関があるか考えてみてください。
 
「コンサル会社に入ると成長できる!」
 
バスケットボールの例とどこか似てないでしょうか?(だいぶ前提も曖昧ですが。。)
 
 
 
 

(番外の補講)「論理(ロジック)」について学びなおす~その5(数字編)「PCR陽性はどれくらい危ない?」

前の記事の番外の補講です。
前回のPCR検査の記事が思いのほか反応があったので、現実に近いと思われる数字を使いより具体的なケーススタディとしたいと思います。

*予めお断りしておきますがPCRやコロナ対策の是非を主張するための試算ではありません。

 あくまで数字を使いながら実体把握し推論を進めるケーススタディとして解説します。

前回の記事では以下の数字を想定して計算しました。
「論理(ロジック)」について学びなおす~その5(数字編)「PCR陽性はどれくらい危ない?」


==================================
(以下計算のための仮定)
このPCR検査は”本物の”コロナ患者が受けると99%の割合で陽性が出るが1%は陰性(「偽陰性」という)になる。一方患者でない人が受けても10%陽性が出て(「偽陽性」という)、90%は陰性となる。*実際確実に検出しようとするとそうなるらしい。
さてコロナの患者の割合は全人口の0.1%と分かっているとすると、陽性と判断された人が本当にコロナにかかっている確率はいくらか?
==================================

この計算結果は上記の前提だと、実際に感染者である確率(陽性的中率)は約1%でした。


さてこの時は計算の練習として適当に数字をおきましたが、本物の数字を入れたらどうなるの?と思ったので、ネットで正しそうに思われる数字を調べたうえで、それを使って試算しなおします。

(参考)

COVID-19でのPCR検査体制 | 日本医師会 COVID-19有識者会議
【COVID-19 に関する一般的な質問に対する現時点での文献的考察】 v1.2 (2020/3/23)
感染症結核学術部会
https://www.jrs.or.jp/uploads/uploads/files/information/20200325v1.220200323.pdf

 

上記などのネットの記事をもとに以下の仮定を置いてパターン分けして試算しました。

<仮定>

(1)感度(感染者が検査で陽性になる確率)は70%で固定 *ここは多分これくらい
(2)特異度(非感染者が検査で陰性になる確率)は以下で試算(90%/99%/99.9%/99.99%)
(3)事前確率(全人口に占める感染者の割合)は以下で試算(10%/1%/0.1%/0.01%)

そこで作ったのが以下の表になります。

 

f:id:goodfind:20201103235206p:plain


 

事前確率を一定とすると、特異度が高い(=陰性の人が検査で確実に陰性になる)と、「陽性的中率」は上がる。言い換えると検査で陰性の人がちゃんと陰性反応と出るほど、嘘の陽性(偽陽性)がでにくくなる。*以下の図の青の線

特異度を一定とすると、事前確率が上がるほど「陽性的中率」は上がる。言い換えると世の中の人の感染者の割合が高いほど、嘘の陽性(偽陽性)がでにくくなる。*以下の図の緑の線

f:id:goodfind:20201104133401p:plain






以上は定性的な記述をしていますが、ここからは数字を使ってもう少し実態を記述することにします。

★ここから少し数学を使った話になります★

独立変数(=お互いに独立して関係のない変数)は3つで、それぞれx、y、zとおきます。

 

(1)感度(感染者が検査で陽性になる確率)(70%)(=x)

(2)特異度(非感染者が検査で陰性になる確率)(90%-99.99%)(=y)

(3)事前確率(全人口に占める感染者の割合)(0.01%-10%)(=z)

 

なんとなく「独立変数は3つ」と言いましたが、この3変数がお互いに全く影響を与えない勝手な値をとれることがまず第一のポイントです。

 

「感染者が陽性になる確率が70%の場合、非感染者が陰性になる確率は30%じゃない?」

 

違います。

 

これは「AならばBである」の命題が”裏”である「AでないならばBでない」と同じ形です。

 

A(=「感染している」)/Aでない(=「感染していない」)

B(=「陽性になる確率は30%」)/Bでない(=「陽性にならない確率は70%」)

 

命題の裏は元の命題が真でも、必ずしも真とはならないことは以前の記事でも述べていますので復習しましょう。


(1)の感度と(2)の特異度は独立です。(1)は感染者についてのみ述べています。非感染者については全く何の制約もありません。同様に(2)は非感染者についてのみ述べており感染者にはまったく関わりはありません。

 

(3)については検査とは全く関係ない情報で、全人口の中でどれくらいの人が感染しているかだけを述べています。

その中から感染者を選んできて検査した場合が(1)で、非感染者を選んで検査した場合が(2)です。なのでこの3つは全てお互いに影響しない独立した値(数字)を取ることができます。

 

(陽性的中率)=(z*x)/{z*x+(1-z)(1-y)} ・・・(4)

 

今回の試算ではx=0.7で固定しているので、ここから先はxを変数とみることはやめにして、定数0.7という決まった数字であると考えてください。

そうなると(4)式をzで整理すると

 

==>a-b/(z+c) (a,b,c>0の定数)

 

の形になるのでzが大きくなると陽性的中率が上がることが分かります。

 

同様に(4)式をyで整理すると

 

==>d/(-y+e)  (d,e>0の定数)

 

の形となるのでyが大きくなると陽性的中率は上がります。

 

(★ここから大事★)

今回主張したいのはロジックとか計算方法についてではなく、ここでの数字を用いた試算結果の解釈です。

 

2つの変数を動かしてシミュレーションした結果、陽性的中率は最低の0.07%から最大の99.9%までかなりの幅があることです。

 

(最低の数字)事前確率0.01%、特異度90%の時、陽性的中率=0.07%

(最高の数字)事前確率10%、特異度99.99%の時、陽性的中率=99.9%

*数字は表の物から四捨五入

 

この2つの数字がどうなるかによってPCR検査の解釈は大きく変わり当然施策も変わってきます。

もしも感染者で偽陰性(感染者が検査で陰性)の検査結果が多いなら、安心して外に出る感染者が増えるとより感染者が増えるので外出制限すべきです。

また非感染者で偽陽性(非感染者が検査で陽性)の検査結果が多いなら、再検査の頻度を上げる、検査の精度を上げるなどに取り組まないとPCR検査を受けることで行動制限を強いられるスポーツ選手などが増えてきます。

 

いずれのケースでも数字の絶対数と割合を考えたうえで判断すべきであり、実態はこの数字によって表されます。

 

実際に今回の例では「事前確率」が最も確定しにくい数字です。「特異度」は対象が検査を受けた人で数も限定的なので検査の結果を追えば精緻化できます。一方で「事前確率」は国民全体のうちの感染者割合ですからランダムに抽出したサンプルから求めないといけない数字ですが、健康で一見問題ない人は検査に来ないので母集団に入ることが少なくなります。こうなると感染が疑わしい人たちだけのサンプルで感染者率を割り出すと当然数字は高くなります。

これまで見てきたように「事前確率」が高くなると「陽性的中率」も高くなるので、PCRの検査結果を過大評価することになります。

 

少しややこしい話が多かったですがいかがでしょうか?

 

純化して偽陽性偽陰性が多いからダメだとか少ないからどうだとかよりも具体的に微妙なバランスが見えたのではないでしょうか。

少し具体的な数字の感覚をもって両極端ではない世界を考える習慣を持つと世界の見え方が変わるのではないかと思います。

 

 

 

 

 

 

 

「論理(ロジック)」について学びなおす~その5(数字編)「PCR陽性はどれくらい危ない?」

 
前回の記事で「数字を使って実態を正しく把握する」ということをお話しました。
 
「論理(ロジック)」について学びなおす~その4「数字を考えている?」~
 
今回はそれを象徴するような事件(「コロナ偽陽性」)が実際に起こったので、それを例として数字を用いた実態把握について考えたいと思います。
 
報道によると、元オリンピック体操選手がPCR検査で一旦は陽性が出ましたが、何度か再検査した結果実は陰性であることが判明しました。(「偽陽性」というらしいです。)
ここではそのニュースやPCR、コロナ対策の是非についてではなく、純粋に数学的にどれくらいの確率でそういうことが生まれるかを計算し、我々が持っている危険のイメージと実体の違いを検証します。
 
 
PCR検査の結果は陽性だった!」
 
以下のように数字をおいて計算します。
*実際の数字とは異なる可能性がありますが”仮で”おいています。
==================================
(以下計算のための仮定)
このPCR検査は”本物の”コロナ患者が受けると99%の割合で陽性が出るが1%は陰性(「偽陰性」という)になる。一方患者でない人が受けても10%陽性が出て(「偽陽性」という)、90%は陰性となる。*実際確実に検出しようとするとそうなるらしい。
さてコロナの患者の割合は全人口の0.1%と分かっているとすると、陽性と判断された人が本当にコロナにかかっている確率はいくらか?
==================================
 
これは「条件付き確率」と呼ばれる種類の問題で大学入試の数学で出ます。数学の世界では「ベイズの定理」とよばれています。
 
「やばい!99%コロナに感染している!」
 
と思うかもしれませんが検証してみましょう。
 
感染している人(0.1%)・・・ 陽性が出る(99%)/陽性が出ない(1%)
感染していない人(99.9%)・・・陽性が出る(10%)/陽性が出ない(90%)
 
まとめると4つのパターンがあるので番号を付けます。
 
(1)感染していて陽性が出る
(2)感染しているが陽性が出ない
(3)感染していないが陽性が出る
(4)感染していないで陽性が出ない
 
今回は検査の結果陽性が出ているので、上のパターンの(1)か(3)のどちらかということになります。
 
本当に感染している確率=(1)の確率/((1)の確率+(3)の確率)
=0.001*0.99/(0.001*0.99+0.999*0.1)≒0.00981267≒約1%となります。
(*この部分が「条件付確率」の計算でベイズの定理そのもの)
 
約1%!!!
 
もしかすると想像よりずいぶん小さくないですか?
 
それでもかかったら危ないから、というのは別の話です。これはまったく論理的ではありません。
今回の試算は実際に起こる確率を計算することで地域や国全体でどれくらいの患者がいるかの実態を求め、自治体や病院などの対応を考えるときに役立ちます。
 
一つこの数字から導かれる結論としては、もし上記の仮定の数字をそのまま使うなら
 
「陽性反応が出た人も約99%は実はコロナにかかっていない!」
 
ということが分かります。こう見ると実は試算結果はショッキングなのではないでしょうか?
(*しつこいですが仮定の数字の検証はここではしていないです)
 
こうみると数字で物事を見てみることの大切さがわかると思います。
普段ニュースなどでは「ある、なし」だけの報道も多いと思いますが、実態を見るときには範囲や程度などの数量も大切になることを覚えておいてください。
 
 
 
 
 
 
 
 
 
 
 

「論理(ロジック)」について学びなおす~その4「数字を考えている?」~

論理的な議論を進めると、言葉を定義するとか、理由はファクトか、などのチェックを行うことが多くなります。しかしながら(数理)論理は命題(文章)の真偽を中心に演繹的に判断するため、数字や程度の情報がしばしば欠けます。
例えば明日雨が降りそうかな?という時に調べてみると気象庁の予測では90%の降水確率だったとします。この状況で「明日は雨が降りそうだから傘を持っていこう。」というように簡略されて判断されることが日常では発生しますが、この推論をもう少し見てみると以下のようになります。
 
気象庁の情報):「明日の降水確率は90%」
(人間Aの判断):「明日は雨が降りそうだから、傘を持っていく」
 
*10%の降らない確率にかける人はもちろん少数ながらいてもよい。
 
ではもし気象庁の予報が以下の場合は同でしょうか?
 
気象庁の情報):「明日の降水確率は50%」
(人間Aの判断):「明日は雨が降りそうだから、傘を持っていく」
(人間Bの判断):「明日は雨は降らなそうだから、傘は持っていかない」
 
*たぶん人によって解釈は分かれると想像されます
 
この場合
 
「降水確率が90%」=>「雨が降りそう」(人間A)
 
「降水確率が50%」=>「雨が降りそう」(人間A)/「雨が降らなそう」(人間B)
 
だいたい世の中こんな判断をしていることが多いのではないかと想像します。
 
簡単な例ですが、論理的な推論という点で重要なルールが含まれています。それは降水確率という「0-100%の数字の範囲」が「0と1(真と偽)」という2つの値のみに収斂されていることです。
 
降水確率:(0から100%)*値は(0から1の間の実数の数だけ)無限通りある(ニュースでは10%単位で区切る)
雨が降る/降らない(0か1)*2通りしか値を取らない(”二値論理”と言います)
 
この2つの情報を結びつけるのは以下のような関係です。
 
”降水確率関数f”の定義
降水確率(60以上-100%)=「雨が降る」(例えば”1"という値、”真”)
降水確率(60%未満)=「雨が降らない」(例えば”0"という値、”偽”)
 
ちなみに数学ではこういう書き方をします(参考まで)
def 
<=> 
f:{x|0≦x≦100}->{0,1}
f(x)=1(When 60≦x≦100)
f(x)=0(When x<60)
 
前後でずいぶん情報量が違うことは明らかです。
しかしなぜそうなるかを考えてみると、それは「命題」が真偽(0と1)の2つの情報しか持たないからで、その命題を使って我々は論理を組み立てているという構造的な事情があります。
 
 
前置きが大変長くなりましたが、ここで提起したい問題は「0と1」の2つの値しかもたない命題では降水確率などの多くの値を持つケースをうまく表現できないということです。「論理的」とか言いながらちっとも、現実の論理的な話ができないということが発生します。
 
「0と1」からなる(古典的な)命題では、それをもとに推論を行い物事の正しい、正しくないなど判断したり、この情報に基づいて新しい情報を導いたりすることには大変便利です。例えば「人間は必ず死ぬ」、「ソクラテスは人間である」という2つの情報から、「ソクラテスは死ぬ」が導けるというような具合です。
 
もしもこの命題を以下のようにしてみてはどうでしょう?
 
「人間の70%は病気になる」、「ソクラテスは人間である」その時、ソクラテスはどうなるのでしょうか?
 
 
これはシンプルに「ソクラテスは70%病気になる」を導けばよいです。なぜよいかというと「人間」を「ソクラテス」に置き換えただけで情報は欠落していないからです。
 
ところが「人間の70%は病気になる」を「人間は病気になる」と言い換えると「ソクラテスは病気になる」の結論になります。実際問題こういう議論は多いのではないでしょうか?論理的に推論する場合は命題を真または偽に決めないとやりにくいです。なのでいわば仮定の部分の「70%」のところを四捨五入するなどで近似(きんじ)するわけです。
 
このような情報の欠落を少なくして事実に近い推論や議論を進めるにはどうすればよいのでしょうか?
 
2つの方法があると思います。
一つ目は数字を「0または1」に近似しないでそのまま使うこと。
ソクラテスは70%病気になる」というように数字のまま表現することですね。
 
もう一つは段階的な2つ以上の程度を表す表現を使うこと。
例えば
 
(1)「雨が確実に降りそう」(降水確率80%以上)
(2)「雨が多分降る」(降水確率50%以上80%未満)
(3)「雨は多分降らない」(降水確率20%以上50%未満)
(4)「雨は確実に降らない」(降水確率20%未満)
 
分岐を多くして程度を表す例です。ちなみに降水確率はすでに段階的に10%単位で近似されています。
 
降水確率={0%、10%、20%、、、80%、90%、100%} *57.3%などの細かく刻まれた数字は出てきません。
 
これは数学ではこのように2つ以上の分類をする分野があり「ファジー理論」(そこで使う論理のことを”ファジー論理”という)と言います。ファジーの世界では確率など多くの値を取る場合を「メンバシップ関数」というものを使って数字の大きさにより分けて考えます。
(詳細は例えばこちらへ)
 
こうすることで雨が「降る/降らない」という極端に単純化された分類から、雨が「確実に降る/多分降る/多分降らない/確実に降らない」のように少し中間を扱えるようになりました。
 
 
 
もう一つ違う例を考えてみましょう。
 
アメリカと中国がが貿易戦争をしている。中国も大きいけどアメリカも大国でA国はどちらと付き合うべきか?」
 
という推論を考えてみましょう。
 
「中国は大きい」
アメリカも大きい」
 
両国とも大きいのは事実です。しかしどれくらい大きいのか?
 
アメリカの人口(3.3億)vs中国の人口(14.4億)
アメリカのGDP(約2000兆円)vs中国(約1400兆円)
 
現在のGDPアメリカが中国の約1.5倍くらいありますが、人口で見ると中国はアメリカの4倍以上あります。なので今後経済成長をつづけて中国人の生活水準がアメリカと同レベルになった時にはGDPアメリカの4倍以上になることが計算上分かります。
 
そうなるとビジネスで稼ぎたいA国としては、アメリカと中国は同じ「大きな国」ではありません。この場合は経済的に合理的は判断をするのであれば中国とも仲よくしないといけないな、という推論は自然です。
(*意思決定するかどうかは別問題であくまで合理的な推論の話)
 
このように実際の数字を入れてみれば「アメリカも中国と”同様に”大国だ!」というのは情報としてはかなりミスリードするものになります。このように「大きい/大きくない」のような単純化した文章の情報だと実体を表すには不十分です。なのでもしも数字が分かるのであればその数字をそのまま用いるか、もしくは程度を表すファジー理論の「メンバシップ関数」のよいうに複数の表現で近似するかというのが選択肢となります。
 
 
(★最後にまとめ★)
 
以上の話から我々が気を付けることは以下のことに要約されます。
 
(1)我々は論理的に考えるときには「ある/なし」のような単純化して考える傾向がある
(2)単純化した論理では程度や数字の情報が欠落し実態が分からない
(3)情報を欠落しないようにするには数字をそのまま使うか、程度を場合分けして考える
 
 
 
 
 

「論理(ロジック)」について学びなおす~その3「Aか?Bか?」の選択~

仕事は「好き」か「得意」かどちらで選ぶべき?

今回は上記のような問いに対する論理的考察法を解説します。具体的には「Aか?Bか?」の形の論理的な判断における、典型的な誤りと正しい使い方を分かりやすく説明しようと思います。

 

キャリアについて相談を受けるときによく出てくる質問で

「仕事を決めるときに、自分が好きなことで選ぶのか得意なことで選ぶのかどちらがよいでしょうか?」

仕事を決めるときに何を基準とするかは慎重に考えないといけないことは間違いありません。しかし論理的に考えるのであれば、この問い自体に問題があることがわかります。

「仕事は好きか、得意かどちらで選ぶべきか」の構文を一般化すると以下のような文章になります。

「AとBがある時に、どちらが正しいのか?」

 

この問い自体に含まれてる問題点は以下の2つです。

(1)AとBの二つの選択肢がある時になぜ一つだけが正しく、他方が正しくないと判断するのか?

(バグ1)答えは常に一つである!


この例でいうと「自分の好きなこと」を選んだ時になぜ「自分の得意なこと」を捨てなければならないのか?またはその逆で「自分の得意なこと」を選んだ時になぜ「自分の好きなこと」を諦めなければならないのか?


このように2つ選択がある時、一つが正しい(数学では「成り立つ」という)ときに他方が正しくない(「成り立たない」)ことを「排中律」と呼んでいます。例えば「大人/子供」、「日本人/外国人」などはこの排中律が成り立ちます。数学的な言い方をするなら、ある集合とその補集合を考えるとき(集合の)元は必ずどちらか一方にだけに属します。

我々が日常でも排中律が成り立っていると考える背景は、命題の「真偽」には排中律が成り立つからです。命題では「真」か「偽」のどちらか一つだけが決まるため、日常生活でも同じように全てのことに成り立つと判断しがちで、それで納得したり次の行動に移ったりします。

でもどちらかに決めないと、次のことを考えたり行動に移すことがしにくくなりますよね。特に行動に移す場合は、「AでもありBでもある」と言われても「結局どっちやるの?」とかややこしくなります。だからシンプルに解は一つにしたい事情があると思います。

命題の排中律が成り立つときは答え(結論)が一つですが、同じ数学でも一般に問題の答え(「解」とも言います)は複数あってもよいのです。例えば「自然数で1より大きくて5より小さいものは?」といえば「2,3,4」の3つが解となりますし、この自然数の条件を実数に広げると無限に解は存在します。2次方程式の解も実数内では重複する場合も含め2つあることは高校までの数学で学んだとおりですね。

 

答えが一つである、というのは受験の影響が大きいと思います。マークシート式の入試では解答は一つです。だからマークシート解答用紙を機械で採点できるのですが、それに慣れていると人々はいつも問いに対する解答が一つだと誤解しがちになります。

 

(2)そもそも分類する基準が違う2つの物差しを同じ物差しで考えようとしている

 
(バグ2)AとBで判断軸が異なる!

 

「好き/好きじゃない」
「得意/得意じゃない」

この2軸は全く別のものです。ですのでもしも進路をこの2軸で分類するなら2*2=4通りが考えられ、以下のようにパターン分けされます。

・「好き and 得意」
・「好き and 得意じゃない」
・「好きじゃない and 得意」
・「好きじゃない and 得意じゃない」

実際は「好きじゃない and 得意じゃない」からは選ばないと思いますので、3つの中から現実的な選択をするのではないですかね。

それにしても3つの可能性を考えるというのは人間の頭にとっては結構負担かもしれません。場合分けしてそれぞれのパターンを考えると思考としてはシンプルですが考える量が3倍になるのでより複雑です。この事情からなんとなく解を一つにしたいと本能的に考えていると思います。

 

(ここから先は数学の論理とは別の話になります。)

最後に数学や論理学の範疇からははずれて本題の趣旨とは異なりますが、この最初の問題が含む別の2つの”推論バグ”について解説します。(こちらのほうが現実的な問題かもしれません。。)


(3)「好きである」または「得意である」ことは決まっている!?

 
(バグ3)AとBがはっきり決まっている!

ここで出てくる「好き」や「得意」というものが本当に分かっている保証はありません。就職活動などでは「私は何をしたいのか?」ということの答えを持っていない人も普通にいます。
(というより多数いると思います)
この出発点である条件があやふやだと推論自体が無意味になるのはこれまでの論理の解説でも述べたとおりです。

(*前回と前々回の論理についての解説はこちら)
「論理(ロジック)」について学びなおす~その1「命題」について~ - Goodfind講師ブログ

「論理(ロジック)」について学びなおす~その2「帰納」と「演繹」~ - Goodfind講師ブログ

 


(4)問いに対する解答は常に存在し、かつ誰かはそれを知っている

 

(バグ4)答えは常に存在し誰かが知っている!

 

一般に問題には常に解があるわけではありません。例えば数学において

自然数で5より大きく、かつ、2より小さいものは何か?」

の解は存在しません。つまり一般には問いに対しては必ずしも解は存在しません。それを常にあるものとして求めすぎるのは問題と解が一体になっている受験勉強の悪い影響だと思います。そしてその受験勉強の影響の延長で言うと、学校や塾に行けば誰かが解答をしっていて教えてくれるという習慣があるためきっと知っている人がいる(たぶん先生)と信じています。その状況からの類推で、あたかも一般の問題についても塾のように解答があり先生のような人が知っていると勘違いしているところがあるのではないでしょうか。

 

元大リーガーの上原浩治投手はご自身のyoutubeチャンネルで「野球に正解はない!」と言っています。練習の仕方とかフォームとか実は様々な解がありそれは個人がそれぞれであっているものであればよい、という意味だと思います。

大げさかもしれませんが「人生」も正解があるわけでなく、それぞれの個人がよいと思うものでよいのではないでしょうか?それを受験と同じように、こうなったら正解とか、この職業は勝ち組などと判断するのは論理的にも実際の意味としてもちょっと違うと思います。

 

本日の「Aか?Bか?」の形の命題の判断での我々がやりがちなバグを最後にまとめます。

(バグ1)答えは常に一つである!
(バグ2)AとBで判断軸が異なる!
(バグ3)AとBがはっきり決まっている!
(バグ4)答えは常に存在し誰かが知っている!

ありがちなバグなので意識すると修正されるので心掛けてください。

「論理(ロジック)」について学びなおす~その2「帰納」と「演繹」~

前回の記事(「論理」学びなおす~その1)について、自分の予想に反してのアクセス数が思いのほか多かったので、その2を書く意欲が出ました(笑)。
 
今回はその2として、論理の基本である「帰納」と「演繹」について、なるべく分かりやすく例を使いながら解説しようと思います。
 
*前回のその1では論理学における「命題」についてその真偽の判定が推論でどのようにできるかを解説しました。
 
 
論理的/ロジカルであるとは、何かを推測したり真偽を判断する場合に、客観的で事実に沿って正しく行うことです。
 
今回お話するのは結論を導くプロセス、すなわち”推論”をする時の2つの異なる手法である「帰納」と「演繹」についてです。
前回「pならばqである」というタイプの命題について解説しましたが、その推論プロセスにも大きく2つの形があるというお話です。
 
帰納」も「演繹」も共に日常ではあまり使わないのではないでしょうか。私もこれらの言葉は大学院を出るまで西洋哲学史と数学以外では見たことも使ったこともありませんでしたが、社会人になって初めて見て使ったのは入社した外資コンサル会社のロジカルシンキングの研修の時でした。(その後講師もやった)
 
本日これからするお話の基本はその部分を踏襲したもので特別に凄いものが加わってはいません。また論理や数学も高校で学ぶ範囲での話に限ります。
 
 
◆「帰納」と「演繹」
 
wikipediaを見ると以下のように書かれています。
 
帰納(きのう、英: Induction)とは、個別的・特殊的な事例から一般的・普遍的な規則・法則を見出そうとする論理的推論の方法のこと。演繹においては前提が真であれば結論も必然的に真であるが、帰納においては前提が真であるからといって結論が真であることは保証されない。
 
 
演繹(えんえき、英: deduction)は、一般的・普遍的な前提から、より個別的・特殊的な結論を得る論理的推論の方法である。
帰納に於ける前提と結論の導出関係が「蓋然的」に正しいとされるのみであるのに対し、演繹の導出関係は、その前提を認めるなら、「絶対的」「必然的」に正しい。したがって理論上は、前提が間違っていたり適切でない前提が用いられたりした場合には、誤った結論が導き出されることになる。近代では、演繹法とは記号論理学によって記述できる論法の事を指す。
 
*それぞれwikipediaより引用(2020/10/12)
 
 
うーーーん、難しいです。。。
なので、これから解説します!
 
なお数学の証明などで使う「数学的帰納法」は名前と違い帰納ではなく演繹です。また前回、その1の中でお話した「命題」についての推論の論理的検証などには全て演繹のみ使っており、帰納は全く使っていません。
(なので今回「帰納」の話題を取り上げたかった)
 
ちなみに数学の世界では、帰納をあまり使いません。この世界ではユークリッド幾何学のように最初に決められた定義と公理から結論を導く演繹だけを使うのが絶対の掟(おきて)です。
しかし物理や化学では帰納的な結論を認めます。いくつかの実験や観測の結果が予想値と合致した時には証明されたと考えることがあります。
 
 
帰納」と「演繹」の解説にうつります。
 
◆「帰納」とは実験や調査の結果から結論を推測する行為です。
より現実に近い言い方をするなら実験をたくさん行った結果、共通点や共通するルールを見つける行為をさします。
 
例を挙げると
 
「男性は女性よりも背が高い」
 
という結論を導くためにはサンプル(調査)をたくさん持ってきて平均身長を比べればこれは正しいことが分かります。
実験やサンプリング調査による結論は全て帰納による推論になります。経験則というのも帰納的推論です。
(「帰納的」「帰納法」などの用語も使う)
 
帰納的な推論をするときに前提として必要なのは、対象となる事象なり事実です。それが一般に複数ある時にそれから結論を、”なんとなく”導きます。
実験がそうであるように対象となる事象の数が少ないとそこに存在する法則(ルール)を誤って結論付けることが多々あります。よく「Nイコール300あるから、、」という言葉を聞きますがこれは「サンプルが300個があるところから推測した」という意味で使います。
 
サンプリングが1個か2個しかない時に、それをもとに一般法則を見つけようとしても結構無理があります。
例えば、サイコロを1回振って「2」が出たら「サイコロを振った時に2が出る確率は100%」という結論にはしませんよね。我々は経験的にもっとたくさん振れば1/6になるのはご存じのとおりです。
 
しかしこのサイコロの例のような推論が世の中には非常に多いのです。
 
例えば小学校に行く子供を2人を朝見かけて、2人とも赤い服を着ていた。それから「今年は赤い服がはやっている」という結論を導いたとして合っているかはわかりません。ですが帰納的推論としては正しいのです。
 
このように帰納的に推論を進めるときには結論が必ずしも正しいとは限らないことを理解する必要があります。
 
実際のディスカッションでは以下のようになケースになります。
 
(あるアパレルメーカーで)
今年の基本戦略は「赤」を推していこうと思います。なぜならば、現在赤が流行している傾向があり、サンプルリ調査もそれを裏付けています。。。
 
ちなみに、この理由付けはもう少し正確な言い方をすべきです。
 
「現在赤が流行している傾向がある」は何を根拠に結論づけたのかを言っていません。仮に別の理由があるなら以下の言い方になります。
 
『今年の基本戦略は「赤」を推していこうと思います。なぜならば、「***によると」現在赤が流行している傾向があり、サンプル調査もそれを裏付けています。』
 
もしも「現在赤が流行している傾向があり」の理由が「サンプル調査もそれを裏付けている」が根拠であるなら。以下の言い方が適切です。
 
 
『今年の基本戦略は「赤」を推していこうと思います。なぜならば、サンプル調査によると現在赤が流行している傾向があるからです。』
 
 
帰納的推論では「何を根拠に」その結論を出したかはっきりしないと推論が正しいか判定できません。そこは具体的にサンプルや実験などを記述することで、推論の道筋を検証できることになります。
 
(★ここ大事★)
上記の例もそうですが帰納的な推論において大変良く見られるエラーは少ない事例や情報から一般化を拡げすぎることです。本当はそこまで一般的に成り立たないのに、たった少数の事例から全部がそうであるように判断するということを我々は非常に頻繁に行っています。
特に人間は生物として心理学的なバイアスというものを持っており、自分の気に入った(つまり生命を脅かすものを避ける本能に従った)結論を出したい傾向を持っていますが、それはこの帰納的推論で自分の望む結論にほんのわずかなサンプルを根拠に確信してしまうという傾向があります。
 
例えば直近で言えば「コロナは危ない!」と生物学的な危険から思っている時に「感染者増加!」というニュースが流れれば、それはやはり危ないと判断して納得するようなケースです。
 
実際は帰納的に推測するならサンプル数を増やして例えば「テスト数」に対する「陽性数」または「重篤率」、「死亡率」などを取って、他のインフルエンザや風邪のデータを較べないと客観的には言えないはずですが、なんか一瞬で結論を受け入れちゃってますね。
 
(注、コロナについては事実が分からないので論理の展開の例として挙げただけでコロナが危険でないと主張する意図はない)
 
 
 
 
◆「演繹」は前提となる条件を仮定したときに、一定のルールで結論が必ず導かれる推測の行為です。
 
例としては三段論法が有名です。
 
「全ての人間は死ぬ」「ソクラテスは人間である」したがって「ソクラテスは死ぬ」は有名な例です。
 
数学の証明は全て演繹を使います。演繹を使った推論による結論は100%正しくなります。(というより、100%正しくなるように定義から作っている)
 
前回の記事で「命題」の真偽を扱いましたが、そこでしたお話は実は全て演繹を用いて話をしています。
 
少しだけ前回の復習すると「命題」とは真偽が区別できる文です。
そのうちの「pならばqである」という形の命題を考えるとき、pという仮定が成り立つときにqが成り立つ時に、この命題は「真」であると言い、成り立たないならば「偽」であると定義しました。
別の言い方をすると「pならばqである」という真の命題がある時に、もしpが真ならば必ずqが成り立つことが保証されます。
 
ちょっと細かくなりますが上記のソクラテスの例をこの命題に当てはめると
 
 
p=人間
q=必ず死ぬ
 
「人間ならば死ぬ」(「pならばq」)は真である。
ソクラテスは人間であるからpに該当する。つまりpの条件を満たす。
よって「ソクラテスは死ぬ」は正しい(真である)。
 
(余談、なので混乱する場合は飛ばしてよい)
「人間ならば死ぬ」という命題は真である、と言ったが実はこれは帰納的推論の結論である。現在まで人間は(今生きている人を除いて)例外なく死んでいるのでこれまでのところはこの主張は正しい。しかし今後人類が不死の能力を得る可能性もないとは言えないので、これ主張が正しいかどうかは検証できないし、もちろん既存の科学ても演繹的には証明できない。(「全ての有機細胞は有限の寿命がある」などの事実があれば演繹的に導ける)
 
 
ここから少しややこしくなります。(気合い入れてください!と言っても高校の数学の教科書に書いてある範囲です。)
 
「pならばqである」
 
仮定のpと結論のqにはそれぞれ真偽があります。
このあたりが少しややこしいのですが、「命題」に真偽がありますが、pとqにも真偽があります。
 
「真」「偽」というと分かりにくいのでpとqでそれぞれ「成り立つ時(真)」と「成り立たない時(偽)」がある、と言うと分かりやすいですかね。
 
上の例ではpは「人間であること」ですがソクラテスが人間であるからpは真。もしもソクラテスの代わりに犬がきたらどうなるでしょうか?
 
「pならばq」はpが成り立たない場合、つまりpが偽の時はどうなるのでしょうか?
言い換えると「人間ならば死ぬ」が正しい時に、もしもその場所に「犬」が来たらどうなるか?
 
正解はpが偽の時はqは考えない。なぜならpという条件が成り立たない時のことは何も言っていないから。
そして(ここ大事!)pが成り立たない時には「pならばqである」は真である!(偽ではないから、という説明が分かりやすいか)
 
このpやqそして命題(=pならばq)の真偽を一覧にしたものを「真偽表」という。
 
p q pならばq
------------------
1   0    0
1   1    1 
0   0    0
0   1    0
 
*真=1、偽=0 で表している。
 
 
 
前回の記事で使った例をここで再度登場してもらいましょう。
(前回の記事はこちら)
「大人ならばこれは分かる。しかし彼は子供だから分からない。」
 
命題としては正しくない(=偽)ことを解説しました。(*真の命題の”裏”は必ずしも真でない例として)
 
記号を使って解説すると
 
「(誰かが)大人であれば、(その人は)これは分かる。」
 
「pならばqである」
p=大人である
q=これは分かる
 
子供は大人でない。したがってpが真にならない。ゆえにqは何も主張できない。そして命題としては矛盾がないので真である。
つまり、子供である場合について、ここでは述べられていないからどちらとも言えない。
どうでしょうか?

ここで彼は子供であって、大人でないから、これは分からないという推論は論理として誤っています。
 
 
(★ここ大事★)
もう一つ演繹についての注意を述べておきます。
演繹の「pならばqである」タイプの命題はpが成り立つ時にqは成り立つとは主張していますが無条件にqが成り立つとは主張していません。ですからpとqはセットで考えるべきでありq単体の主張はできません。pが成り立たなくなればqは即座にどちらでもよい存在になったのは上記の例でたくさん見てきました。
 
 
最後に現実的にありそうなこんな話で締めくくろうと思います。
 
南極は常に氷点下だから氷が解けないので、湖の上に住める。
 
海の上に住める!よかった!
 
それからしばらくたって地球が温暖になってきた。そうして夏には気温がプラスになることもありそうだ。そしてある時本当にそうなり湖の上には住めなくなった。
 
「湖の上に住めるって言ったじゃないか!」
 
しかしこの議論にはいつのまにか前提である「南極は常に氷点下だから」という部分が抜けています。元々言った人の言葉は間違っていなかったが、話が伝わっている間に仮定の情報が消えてしまったということですね。
 
 
 
 
帰納と演繹まとめ
 
実際の生活の中では推論の時に、帰納と演繹の両方を使います。演繹は論理的には強力ですが出発点における仮定がないと推論は進みません。幾何学などの学問であればそれを厳密に定義し矛盾のないように体系を構築できますが、一般社会ではなかなかそうはいきません。そのため帰納的な結論を演繹における仮定として使うことが多々あります。(「人間ならば死ぬ」という例)
しかし帰納的な結論は時に後から変わる可能性もあります。その場合には演繹では仮定が偽であるケースでは有効となる推論ができませんので論理的には何も出てこないことになります。
 
(★これも大事★)
あと注意すべきことは推論の正しさと、結論の正しさは別物です。
 
仮に推論が正しかったとしても前提が違っていたら結論があっている保証はありません。同様に推論が誤っていたとしても結論だけはあっていることもありえます。論理を使った推論はあくまでプロセスとして判断し、仮定や結論も切り離してみるのではなく必ずセットで考えないと、後々の検証や修正の時に混乱し、なんか知らないところで結論だけが独り歩きするということは世の中ではよくあることですのでご注意ください。
 
 
最後の本日上げた論理的なものを考えるときの注意をまとめます。
 
 
1)推論は帰納か演繹か?
2)それぞれ何を前提として推論しているか?
3)帰納の場合、前提のデータなりサンプルが十分足りているか?
(=一般化を広げすぎていないか?)
4)演繹の場合、仮定の条件を本当に満たすか?
(満たしていない場合は何も言えない)
5)前提条件や仮定が抜けて結論が独り歩きしていないか?
6)推論の正しさと結論の正しさは全く別物