日本への農業、民族、原語の伝搬

Triangulation supports agricultural spread of the Transeurasian languages
Robbeets et al. 2021
Nature 599, pages616?621 (2021)

 

ユーラシア大陸の言語、すなわち日本語、韓国語、ツングース語、モンゴル語トルコ語の民族の起源と初期の分散について、農耕牧畜に関する語彙、考古学データ、古代ゲノムコレクションの3つによって推理した論文である。

 

トランスユーラシア諸語の起源は、新石器時代東北アジアにおけるキビ栽培の開始と初期のアムール遺伝子プールにまで遡ることができることが示された。これらの言語の伝播には、農耕や遺伝子の散布と同じように、大きく分けて2つの段階があった(図4)。新石器時代前期から中期にかけて、アムール関連遺伝子を持つキビ農民が移動し、黄河、西ユーラシア、縄文人と混血し、稲作、西ユーラシアの作物、牧畜が農業に加わった。

 

f:id:Ikimono-Nigiwai:20220124142118j:plain

図4 東北アジアにおける言語、農業、遺伝子の拡張の統合
アムール族の祖先は赤、黄河の祖先は緑、縄文人の祖先は青で表示されている。赤い矢印は、新石器時代にキビを栽培する農民が東へ移動し、朝鮮語ツングース系言語をもたらしたことを示している。緑の矢印は、新石器時代後期から青銅器時代にかけて稲作が盛んになり、朝鮮半島から日本へ日本語族言語(japonic langage)がもたらされたことを示している。

 

9千年紀前後の西遼地域におけるキビ栽培の開始は、実質的なアムール関連の祖先と関連付けることができ、トランスユーラシアの祖先の言語社会と時間的・空間的に重なっている。
 9~7千年前のキビ栽培によって人口が増加し、西遼地域において分かれたサブグループが形成され、アルタイ語話者と日韓語話者の接続性が断たれた。

また、西遼地域から沿海州にアムール語の祖先が、沿海州から韓国にアムール語と黄河の混血祖先が持ち込まれることになった。著者らが新たに分析した韓国のゲノムは、日本国外に縄文人関連の祖先が存在し、混血していることを示している。

 3300年前頃、遼東-山東地域の農民が朝鮮半島に移住し、雑穀農業に米、大麦、小麦を追加した。この移住は、韓国の青銅器時代のサンプルに含まれる夏家店上層人と推定される遺伝的要素と一致し、日本語と朝鮮語の間の初期の借用に反映されている。考古学的には、夏家店上層文化に限定されることなく、より広い遼東-山東地域の農業に関連づけることができる。

 この農業パッケージは3千年前に九州に伝わり、本格的な農耕への移行、縄文系から弥生系への遺伝的転換、日本語への言語的転換を引き起こした。さらに、琉球列島南部の試料から、縄文人の祖先が宮古島まで南下していたことを証明した。この結果は、台湾からのオーストロネシア人集団の北上というこれまでの想定を覆すものである。また、韓国のヨクチドで発見された縄文人のプロファイルと合わせて、縄文人のゲノムと物質文化は必ずしも重なり合っていなかったことが示された。

読書メモ:経済社会の学び方3

第4章から第6章

この部分は社会研究に特化した方法論の議論

p121 第4章曖昧な心理は理論化できるか

p121 不確かさの源泉―他者と未来

「観察されていることを知った場合とそうでない場合では行動が異なってくることがある」

社会研究では、「人間は現在をどう捉え、未来に向かってどのように行動するかが探求の主要なテーマの一つになる」

しかし、未来という概念は曖昧である。->未来は不確実

もう一つは、人間が社会の一員として行動すること。->他者の心を正確に読み取ることはできない。

これらが社会研究を困難にする根本原因

 

p124 蜘蛛の巣サイクルに見る「期待」の難しさ

蜘蛛の巣サイクル「例えば「供給者」が来期の価格を予想するときは、今期の価格と同じ価格が来期も成立すると考える」生産と供給のタイムラグのため、「供給超過と需要超過のサイクルが生まれ」る。

「このシンプルなモデルのどこに、どのような修正を加えていけば、よりよく現実を記述できるかを検討するのが、「理論的に考える」ということなのだ。」

 

p128 期待を重視したケインズ

「合理的期待形成(RE: rational expectations)は、「モデルの中の行動主体はそのモデルを知っており、平均としてモデルが予測するところを妥当だとみます」と仮定する」

適応的期待:「人は前期の予想の誤り分(予測値と実現値の差)の一部を取り入れながら、前期の予測値を修正して(適応して)今期の予想を立てるというモデル」

「「期待」は人間の行動を把握するカギとなる概念」

 

p130 「米騒動」(1918年)の特徴

「「期待」が、現実の歴史の中でいかなるショックによって生まれ、いかなるメカニズムで作動してきたのか」

 

p133 若き石橋湛山の分析

米価高騰は思惑の結果であり、その思惑は「政府の愚劣なる輸出奨励政策」によって生じた。

 

p135 事実と「事実と信じられたこと」の違い

「「あることを事実だと考える」ことの意味をどう理解するのかは、歴史学だけでなく、多くの学問にとって、認識上の難問の一つだといっても過言ではない」

古事記日本書紀は史実の記録ではなく、思想の表現である

 

p137 津田左右吉の歴史哲学

「社会研究をするものは、人々がその社会をどのように認識しているのかについて認識している」という二重性

「小説はその時代の人々が信じていた事実を(虚構として)物語ることによって、その時代の事実そのものに迫ることができる」

 

p143 自己実現的予言とは何か

「人間は単に状況の客観的な所得帳に対して反応するだけでなく、自分にとってこの状況が持つ意味に対しても、反応する」

 

p145 銀行の取り付け騒ぎのメカニズム

「予測が予測内容の不成立を招くという関係は「自己実現的予言」と逆の現象「自滅的予言」と呼んだ」

 

p149 クリティカル・マス(臨界質量)という考え方

「個人の行動が、他者のそれに強く連動している場合、集団全体の動きを示すパラメーターがある閾値を超えると、全体が突如異なった局面に突入する場合がある」

「 1国経済の各部門が、いずれもその部門だけでは工業化の採算が取れない場合でも、その経済のほかのオークの部門が同時に工業化すればすべてをする方向へ動く現象を説明する「ビッグ・プッシュ」理論」

 

p152 相互依存のない状況で、ささやかな好悪が極端な結果を生むケース

「個人個人のささやかな好み・選択が、集計されたマクロの現象として驚くべき極端な結果をもたらすというケースがある」

 

p158 優れた理論家の犯しがちな過ち

「社会科学はその理論構造が堅固であればあるほど、その政策的な適用には注意が必要だ」

「複雑な経済現象を理解するためには、「事実」と「人びとが事実だと信じていること」の把握と論理的に(つまり筋道を立てて)考える力が必要だ」

 

p163 第5章 歴史は重要だ

「ある事物が(個人、社会制度はもちろん、慣習も)現在そのような仕方であることは、過去の多数のできごとや時間の経過が作用した結果と考えられる」

「現在のあり方を理解し、変えようとする場合、その変革が真の「改善」をもたらすためには、過去に影響を与えてきた多数のファクターを知る必要がある」

 

p166 範囲が一般化を避ける

「歴史を知れば、範囲が一般化の危険を避けられるということだ」

 

p168 日本は終身雇用?

ここではデータの重要性について書かれてある。日本は終身雇用だとよく言われるが。歴史的には、短期で転職する人は増減している。

 

p176 経路依存性について

「物事や制度の歴史的な側面を充分に学んでいないと、観察結果を非歴史的に一般化してしまい、検証できないような「命題」を蔓延させることになる。こうした悪弊に陥らないためにも、現在の問題を現代の観察事実とデータだけから説明してしまうことには慎重でなければならない」

「変化には「初期条件」だけでなく、ある種コントロールのできない「攪乱(perturbation)」が存在し、両者が後の経路(path)を規定している点を強調するという考えが注目を集め始めている」

「過去が現在を形作っているという考えには、大きく分けると2つのタイプがある。 1つは、過去のある要素が、現在でも物事や体制を規定していると合理的に理解しようとするケース、もう1つは、過去の要素がもはや重要な働きを持たないにも関わらず、現在の状況や精度が、過去の経験や事象に規定(拘束)されてしまっているケースである」

 

p179 初期条件とかく乱要因

「(1)攪乱があった場合となかった場合を比較するケース、(2)異なる攪乱が加わったケース、さらに(3)かく乱の性格はどのケースも変わらないが、初期条件の違いによって異なる結果が生まれる場合、を区別する」

ダイアモンドらの著作に触れ、

「これらの「自然実験」は社会体制が1つの均衡点に向かって修練するのでなく、それぞれに加えられていく内的・外的条件によって別々の結果がもたらされていることを示す事例である」

 

p186 それでも残る問題点

「その社会が場所の選択がランダムになされたものではないとすれば、それらがなぜ選択されたのかという点には積極的な説明が必要である」

 

p188 3 証拠の客観性をめぐって

1つの均衡点には収束しない

「歴史的偶然―その多くは「小さな偶然」なのだが―の存在により、動的なプロセスは必ずしも1つの点に収束することはない」

タイプライターの配列が決まった理由を例に

 

p191 個別事例研究と法則定立科学

「社会研究において初期条件や攪乱を含めた歴史的要素を重視するのか、あるいはより一般的な合理的理解が可能な普遍的命題を求めるのか、という学問探求の姿勢の違いは、しばしば「方法論を問う」という形で論争されてきた」

 

p195 証拠(evidence)をめぐるビデオと公共政策の違い

「治療の場合は、患者の治療という点では医師と患者の目指すところ(利益)は一致している。そのためいかなる治療を選択するのかについて、「目標価値」の不一致はほとんどの場合ない。しかし公共政策においては利害関係者の目標が一致しないことが多い。」

「EBEP によって問題が解決するわけではない」

EBEP:証拠に基づく経済政策

 

p197 説明責任(accountability)とは

「公共政策の場合、ある政策を採択する根拠としてEBEPあ重要な役割を果たすようになるのは、採択された制作の財源が主として税金で賄われるため、その説明責任(accountability)が必要となるからである」

 

p198 客観性(objectivity)について

「政策論に関しては、「こちらの政策よりあちらの政策」というように、選択が問題となるとき、そこに何らかの規範性が持ち込まれることは避けられない。 だが経済学の場合、
規範性、あるいは価値の上下関係の判断について無自覚になりがちなことは否めない」

ウェーバーの言う価値自由とは「自分の視点・立脚点を明確に意識しつつ、価値観を持ちながらもそれに囚われずに、自由に見ることなのだ」

「経験的事実として「そうあること(Sein)」と、先験的原理に基づいて「こうあるべき事(Sollen)」の原理的区別を強調している」

 

第6章 社会研究とリベラルデモクラシー

p203 「科学の政治化」という問題

「科学に価値の選択の問題が入り込むようになったのはなぜか。それは化学が生み出した知識のほとんどが実利性を持ち、その実利性が社会のすべての人々に均霑するとは限らないからだ」

ガリレオ裁判とルイセンコ論争の例

 

p206 月と雲の時代

「断言できること、確率的・統計的にしか言えないこと、あるいは全く謎でしかないことなど、我々の知識の確実性にはさまざまなレベルがある」

「自然科学の問題の立て方と分析方法に見せようとする努力には明晰さという点で大きなプラスの面があるが、同時に自然科学的な分析のフレームワークに乗せるために、数々の要素を削り落としてしまう点ではマイナス面がある。」

この点は自然科学においても同様である。モデルの単純さと現実への適用性は反することが多い。何を目的とするか(問題の立て方)によって、方法は変わる。

 

p208 限定と単純感があるという自覚

「論証する(verify)学と探求し(explore)続ける学があり、すべての問いかけを論証する、論理的に証明することだけが「学の本質」ではない」

 

p210 現代の科学も政治家されうる

感染症や疫学の専門家が科学的な知見に基づく可能性や事実を明らかにするステップ、それをベースとしつつ、政治家対策を選び取るというステップを分けてしばしば語られた。確かにわかりやすい正論だが、 2つのステップはそれほど単純には分けられない。その最大の理由は、第1のステップ自体に、すでに不確実な情報が混入しているからだ。」

 

p213 ゼロリスクへの誘惑

ここは、市民の中にあるゼロリスクに直面して、いつも感じている点ではあるが、

「根本的な原因の原因の1つは、科学が「絶対的真理」というものにたどり着いていないところにある」という著者の見解には賛同できない。科学には「絶対的真理」はありえないので、たどり着くことはない。自然現象の不確実性を人間の脳が理解できないでいるのではないか。

「政治判断の混入をゼロにする事が事実上無理な場合、望ましい態度は、その「主張」の根拠を吟味し、できる限り全体のリスクが少ないと総合的に判断できる方向に舵を切らざるを得ないということだ」

 

p215 マーシャルの"Cool heads but warm hearts"

「問題に対して冷静に(「無私」の立場から)分析の刃を突きつけること、と同時に、その姿勢には他者への「共感」の気持ちが伴わなければならない」

 

2 競争の利点はどこにあるのか

p220 貧困問題との対峙

「信仰生活と経済生活は分断された「別の部屋」で営まれるものではない」

 

p223 競争を過度に重視してはならない

「人々が競争的になることは確かであるが、それは2次的な現象の一つであって、あらゆる種類の「共同と結合」に向かうこともあり、この「共同と結合」は、各人が慎重に考慮した結果、最適の行動だと判断する場合に生まれる」

競争の正の面:活力と自発性を与える

競争の負の面:「経済競争も行き過ぎると様々な(隠れされた)ルール違反が起こることがある」

 

p224 「摩擦のない世界」を想定する

厚生経済学の第1定理は、この完全競争均衡が各財の存在量、生産技術、消費者の選好を所与とする限り、「どの個人の厚生(welfare)レベルも低下させないという条件のもとでは、もはや改善の余地がない状態」、すなわちパレード最適であることを示す」

 

p226 発見の装置としての競争―ハイエクの重要な指摘

「競争は、誰が1番優れているか、誰が1番上手にこなすということを予めすることが出来ない場合に有効な、「発見のための装置」」

「今日双和化学の実験のような性格を帯びた「発見のための手続き」」

 

3 「どうにか切り抜ける」ために

p230 感情の重要性―「同感」と社会秩序

「人間社会の成立やその秩序の起源として」 2つの考え方

「理性に基づく社会契約によって秩序が成立するとする「社会契約説」」

「人間の感情の一致が社会の安定的秩序をもたらす」

 

「社会研究に取り組むときに持つべき心構え、或いは研究対象と研究者との間の距離感覚について、この「同感」という概念から学ぶべき事ところは大きい」

「スミスの言う「同感」とは感情のレベルを、中立的な観察者が受け入れられるようなレベルに調節することによって生まれる、自己を他者の理解できる所へと導く感情なのである」

 

p233 政策論の対立か、感情の対立か

「政治家の対立は主張の内容そのものよりも、「感情的な好悪」「なんとなく虫がつかない」という、些末に見える狭量な感情に記入することも少なくない」

 

p233 一般的モデルではなく、特殊モデルが必要なこともある

歴史の「複雑さを、部分的であれ、解きほぐすひとつの道は、第2章で強調したように、比較することであろう」

「全く異質で類似点がないものは比較できない」

「理論を批判の対象としつつ、事実そのものに迫るという点で、日本研究や地域研究は重要な反例と成り得るのだ」

 

p238 社会問題を見つけ、研究するとは

「自分が通ったこと、知りたいことを徹底的に調べ、証拠を上げつつ筋道を立てて推論し、人を納得させる作業だ」

「価値判断がどこに入るのかをできる限り意識しつつ、分析と推論の構造を自覚する必要がある」

「数量化できない社会風土(mores)と呼ばれる歴史的堆積物や文化的環境を考慮しつつ、感情に押し流されることなく論証する(demonstrate)こと」

 

強調したい点「(1)重要なことは、何が問題なのかを見出し、同時代(contemporary)の社会が直面する問題・課題との関連も改めて問うべきだろう」

「(2)問題は、政治学、経済学、社会学といった1つの分野だけの学問で理解できるわけではない」

「(3)複雑で不確かな人間社会を対象とする社会研究の分野では、解決策は「パッチワーク」を重ねるほかないと言うケースが多い」

 

最後に冒頭に書いたリベラル・デモクラシーにおける社会研究が論じられている

 

読書メモ:経済社会の学び方(2)

第3章

p90 ヒポクラテスが考えた因果の論理

「原因があるか否かという問題と、ある現象なり結果を特定の原因に帰すことができるかという問題は区別されるべき」

ヒポクラテスは「「経験科学としての医学」の道を切り拓いた」

「技術そのものは、正しい、誤っているとの判断が介入する余地はなく、用いられ次第」

「顕在する要因だけでなく、陰伏している要因があることを自覚し、その潜伏的な要素の影響力を探求することを怠ってはならない」

 

p94 アリストテレスからヒューム、カントへ

カントは「「真の」因果関係があるかないかにかかわらず、人間が因果的な形で物事や経験を理解する限り、自然を対象とする探求において因果関係による理解は客観的妥当性を持つと考えたのである。」

 

p98 因果関係にまつわる困難

p98 ルビンの壺に見る認識の特質

「ヒュームが論じたように、ある事象を観察し、それより先に起こったことがその事象を引き起こし、その事象に続いて起こったことがその結果であるとわれわれは考えがちだ。Aが起こり、その後にBが起こった、したがってAが原因でBが起きたと理解しやすい。」

 

p103 社会現象における因果関係把握の難しさ

「Xが、YとZの共通の原因だとする。その場合、Xが起こったとき、もしYとZが独立の事象であれば、YとZは独立に動くはずだ。しかしXを共通の原因とするためにYとZが同じような動きを見せることから、YとZの間の因果関係を推測してしまうかも知れない。」

「XがZの原因、YもZの原因だとすると、二つの独立した原因XとYがZの結果を支配することになる」

これは重回帰

 

p105 統計的差別の理論

情報が不足しているときの推論として、「「過去こうであったから、今度もこうなるはずだ」という推論」

これは帰納法

「情報の「不完全性」を補うために、過去のケースや他社のデータによってリスク情報に関する統計(男女間の離職率の平均値の違い)を利用して、個別具体的な2人の応募者の将来行動を予測する」

「統計的な差別理論は、個別ケースに関する完全な情報がない時に統計的データ(ヒュームの言う「蓋然的知識」)を用いて、因果的な推論を行う典型的なケースと考えられる。」

 

p114 近年の展開は朗報である

「「完全ではないから価値がない」というのは、知的ニヒリズムである」

因果を統計学の中心課題として位置づけるのが「統計的因果推論」(注1)

 

注1:統計的因果推論の考え方

表 研究の分類とそのための方法論(岩崎2019をヒントに)

 

 

研究目的

 

 

 

 

現状把握

予測と判別

因果関係の確立

方法論

実験

(介入研究)

 

 

〇処置とランダム化

A/Bテスト

 

観察研究

 

 

傾向スコア

 

調査

多変量解析

機械学習(教師なし)

回帰分析

機械学習

 

観察研究とは、患者さんに血液・尿などのサンプルや診療記録(カルテや検査結果など)のデータをご提供頂いたり、アンケートや定期的調査へのご協力をお願いすることによって、病気の予防・診断・治療に関する情報を集め、これを詳しく調べて、医療の改善につながる新たな医学知識を発見するための研究。(慶応大学臨床研究推進センター)

「ある個人や集団の健康状態や診療記録をありのまま観察して、データを分析する」「地域住⺠の健康状態を⻑期間にわたって観察することで、心疾患の危険因子を明らかにしたフラミンガム研究のような疫学研究は観察研究の代表」横断研究、縦断研究、前向き研究、後ろ向き研究(バイエルファーマナビ)

この表の観察研究と調査は区別するのが難しい。観察研究は仮説あり、調査は仮説なしということか

 

 

読書メモ:経済社会の学び方(1)

経済社会の学び方

猪木武徳著、中央公論新社

「本書の目的は、社会の経済構造やその動き方、そこから生ずる様々な問題の改善や解決を考える者は、何を知っておかねばならないかを示すことにある。」

 

この本を読むことにした理由は、

(1)環境問題は自然科学的なプロセスによって生じるが、生じさせるのは人間である。そのため、社会研究が欠かせない。自然科学者が見ている問題と社会科学者が見ている問題の共通点と相違点を明らかにすることは重要である。そのためには、それぞれの方法論についても分析する必要がある。

(2)環境問題は現在ではグローバルな問題としてとらえられることが多いが、もともとは郊外のようなローカルな問題であった。今なお、地域循環などローカルな視点は欠かせない。ローカルごとの違い、グローバルとローカルの相互関係について分析する必要がある。

 

 本書は6章から構成されている。

第1章 まずは控え目に方法論を

第2章 社会研究における理論の功罪

第3章 因果推論との向き合い方

第4章 曖昧な心理は理論化できるか

第5章 歴史は重要だ(History Matters)ということ

第6章 社会研究とリベラル・デモクラシー

 

前半の3つの章は、自然科学との対比を盛り込みつつ、科学としての社会研究の方法論を論じている。著者は社会科学でなく社会研究という言葉を使っている。

 

著者は自然科学の方法論を参照しつつ、社会研究に必要な方法論について論述している。著者は、自然科学では大きな問題にはならないが、社会研究の特殊性のひとつは研究対象である未来に向けた人間の行動が、研究による介入によって変化することだとする。また、政策論のように、政策の選択が問題になるときに、何らかの「規範性」が持ち込まれることは避けられないと書いている。したがって、方法論の選択にも規範性が影をなげかける。

 それでは、著者にとっての「規範」は何か。リベラル・デモクラシーである。ここでは、リベラル・デモクラシーは、 「自由放任」ではなく、「経済政策」を導入することを意味している。1870年代のイギリスで自由放任についての疑念が高まり、「「問題解決のための科学」としての社会研究への関心が高まる。」「リベラル・デモクラシーを社会の基本理念とする限り、」制度の抜本的改革ではなく、「パッチワークを重ねながら問題解決に当たる」とする。

注:リベラル・デモクラシーは、「リベラル (自由主義的) な原理と結びついた独特な形態の民主主義」(川出 1999: https://www.gpc-gifu.or.jp/chousa/infomag/gifu/100/7-kawade.html

 

以下、いくつか印象に残った点を列挙する

第1章

p5 問うことの重要性:「日本人は「学問」というと「学ぶ」ことに重きを置き、「問う」ことを重視しない」

「何を知りたいのか、「内発的な」自分の問いは何なのかを確認しておかないと、社会研究を「持続と蓄積」の精神で継続することは難しい。」

ここで内発的な問いとしているのは、研究者の立場であって、一般化するとある主体にとって重要な問いは何かということ。

 

発見的方法

p8 「民俗学で重要な仕事を残した人は皆旅をして、その社会を観察しながら、試行錯誤を重ねつつ自分の仮説を打ち立てる「発見的な(heuristic)」手法を用いた。」

「自然科学では、実験室の中であれ、目に見えるものを観察するという作業の重要性は変わらない。」

「聴き取り調査やフィールドワークをも「観察」に含めると「観察」は社会研究でも重要な手法である点では自然科学と変わらない。」

 

p13 概念:「われわれが観察の対象を認識する場合、実は目で見ているというよりも、概念で見ていると表現した方が適切なことが多い。」

 

p15 指標:「比較を可能にする指標(indicator)が必要になる。」例えば、豊かさという概念をGDPのような指標で比較する。

 

p26 自然科学的な体裁を目指すことのマイナス面

「自然科学的な分析のフレームワークに収まる問題だけしか取り上げなくなるといったマイナス面も出てくる。」

 

p33 定義の不確かさ

概念「自然科学には概念そのものに、量的に測定可能なものが含まれているものが多い。」

「人間や社会の研究においては、その中核的な概念がかなりの幅を持つ場合が多い」

例えば資本という概念も研究者によって異なる

 

p37 試行錯誤の可能性

「社会研究の対象となる諸々の問題は、統計的処理だけで答えが得られるものばかりでない。」

「新しい問題の理解や解決方法を見つけようとする場合、フィールドで試行錯誤を重ねて自分で見つけていく方法(heuristic)で調べることが不可欠である。」

 

第2章

p46 仮定に潜む価値判断

理論「仮定あるいは条件を設定してそこから論理的に演繹して一定の結論を得るという構造」したがって、「仮定や条件の中にすでに結論が隠されている」

 

「価値と理論を切り離すことは難しい」

自然科学ではあまり大きな問題とはならないだろう。しかし、工学や農学など応用研究では、社会的価値と研究テーマは切り離せない。

 

p51 シュンペーターが批判した「リカード的悪弊」

「大胆な単純化の仮定を置き、数理モデルに依拠した論理から現実問題への勧告を導き出す分析方法を、ヨーゼフ・シュンペーター(1883-1950)は「リカード的悪弊(Ricardian Vice)」」と批判した。

自然科学では、現象から本質的な要素だけを取り出して単純化する数理モデルの手法は、必要不可欠である。当然、現実の自然現象上の問題に対しても有効である。

 

p69 演繹論理のみに頼る危うさ

「人間自体は、考えにおいても行動においても混合的・折衷的であり、二律背反的なところがある。」

「現実を理解するためには、こうした理論の世界からもう一度現実の生きた人間社会へと戻らなければならない。」

 

p72 比較経済史と地域研究の重要性

「「類似性がある」という場合、似ているからこそ、逆に違いが問題になる。」

 

p75 比較によって対象を相対化する

「比較することによって差異と類似性を議論する方が、対象を相対化し、多くの知見を引き出す有効な手段となる。」

「自然科学は研究者が、研究対象を直接認識する。ところが社会科学(経済学ももちろんそのひとつであるが)で取り扱う対象、すなわち「社会生活を営む人間」は、彼自身、現実を感じ取り認識して行動する主体である」

 

p77 改めて理論の役割を考える―その否定的な使用

「モデルからの乖離が生み出されると、モデルによって我々は「何故」という疑問を発するように仕向けられるもしよいモデルがあるならば、「何故」という疑問は(常にではないにしても)興味ある問となろう」

 

p80 プロスペクト理論は思考の枠を広げてくれた、しかし…

「歴史を学び、似たケースの中に伏在する事柄をよく理解することによって、そこから知恵や勇気、反省、時には諦観などを引き出しうる」

プロスペクト理論の意義は認めつつ、「単一のことに拘泥することは間違いを生みやすい」

INLAによる空間モデル

INLAによる空間モデル

参考文献

Gómez-Rubio V (2021) Bayesian inference with INLA. https://becarioprecario.bitbucket.io/inla-gitbook/index.html

Logan M (2017) Tutorial 12.13 - Spatial and spatio-temporal models with INLA. https://www.flutterbys.com.au/stats/tut/tut12.13.html

Krainski, E., Gómez-Rubio, V., Bakka, H., Lenzi, A., Castro-Camilo, D., Simpson, D., ... & Rue, H. (2018). Advanced spatial modeling with stochastic partial differential equations using R and INLA. Chapman and Hall/CRC. https://becarioprecario.bitbucket.io/spde-gitbook/index.html

 

 通常のモデルでは、観測値は互いに独立であることが前提であり、応答変数は切片(平均値)+説明変数の関数+誤差という関係を持つ。しかし、空間的に近い場所からの観測値は、互いに似ている可能性が高い。つまり、場所の間の類似性は、場所の間の距離の関数である。

 

(1)   強い空間自己相関を伴うデータ

 少し乱暴な例を見てみよう。5x5の平面に25個の調査地点がある。座標は、

lat<- c(1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,4,4,4,4,4,5,5,5,5,5)

long<-c(1,2,3,4,5,1,2,3,4,5,1,2,3,4,5,1,2,3,4,5,1,2,3,4,5)

それぞれの説明変数xと応答変数yは以下の通りである。

x<-c(4.8,1.6,6.7,0.2,8.3,2.8,3.3,6.6,7.8,5.3,3.7,7.4,0.5,8,6.7,8.8,3.4,7.1,2.6,3.2,9,0.5,4.6,7.8,0.6)

y<-c(12.2,7.4,15.05,0,0,9.2,9.95,14.9,0,0,10.55,16.1,5.75,0,0,0,0,0,0,0,0,0,0,0,0)

plot(long,lat,type="n")

text(long,lat,y)

f:id:Ikimono-Nigiwai:20220101133802p:plain

yの値は、左隅の9地点以外は0である。空間的に偏りのあるデータであるが、y>0の9地点については、

                 y = 5 + 1.5x

の関係がある。単純化するために誤差項は含めていない。

 

(2)   線形回帰

このデータを線形回帰すると、

dt<-as.data.frame(cbind(long,lat,x,y))

model.lm<-lm(y~x,data=dt)

summary(model.lm)

Coefficients:

             Estimate Std. Error t value Pr(>|t|)

(Intercept)  4.076003   2.387642   1.707    0.101

x           -0.006596   0.425214  -0.016    0.988

 

library(ggplot2)

g<-ggplot(dt,aes(x=x,y=y))

g+geom_point()+

geom_smooth(method="lm")

f:id:Ikimono-Nigiwai:20220101133836p:plain

切片は4、傾きは0というとんでもない値が返される。

 

 

(3)   INLAによる解析

INLAの手順

 空間効果を組み込んだモデルをINLAで構築するには、以下の手順に従う。

・調査地点の座標の取得

・調査地点をすべて含む領域についてドローネ三角形を作成

・距離による空間効果を示すSPDEモデルの作成

・調査地点のドローネ三角形への投影

・スタック:説明変数と空間効果の結合

・モデル・パラメータの推定

・モデル選択

 

テストデータの例

(1)のデータを用いてINLAで解析する。

library(INLA)

library(ggplot2)

coords.m<- cbind(long,lat)

coords<-as.data.frame(coords.m)

dt<-as.data.frame(cbind(long,lat,x,y))

 

ドローネ三角形

空間効果の強さは地点間の距離に依存する。地点間の距離を求めるために、ドローネ三角形(メッシュ)を作成する。ドローネ三角形を生成するには、inla.mesh.2d()関数を使う。オプションによって、メッシュの形状を変えることができる。

この関数には、すべての調査地点の座標か、または領域(すべての点を囲む包絡線の座標)を与えなければならない。また、三角形の辺の長さの最小値を指定しなければならない。それによって、領域を三角形に分割する粒度を間接的に指示することになる(エッジが小さいほど、三角形が小さくなり、その結果、三角形の数が増える)。周縁の三角形の分散特性は、内部の三角形の分散特性の半分なので、外辺をバッファとして定義すると良い。

min(dist(coords))

[1] 1

max(dist(coords))

[1] 5.656854

 

この例で地点間距離は1から5.7であったので、バッファをc(1.1, 2)とし、辺の長さの最大をc(2, 3)、最小値を0.9(1未満)とする

 

mesh<-inla.mesh.2d(coords,

offset=c(1.1,2),

 cutoff=0.9,

max.edge=c(2,3))

 

plot(mesh)

points(coords, col = "red", pch = 16)

f:id:Ikimono-Nigiwai:20220101133913p:plainfig. 53

頂点の数は、

mesh$n

[1] 65

調査地点に対応する頂点の番号

mesh$idx$loc

[1] 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45

 

SPDE

INLAの空間効果は、確率的偏微分方程式と呼ばれるいくつかの複雑な数学的機構を使用して推定する。基本的な考え方は、回帰スプラインと同様に、離散点(メッシュで定義されたノード)と基底関数のセットを使用して連続空間効果を推定することである。

 空間効果は2点間の距離の関数であるが、Matern相関関数が用いられる。データセット内の任意の2点間の共分散は、

 

 

距離( d )、Matern関数の範囲( κ )と空間分散( δ )で示される。

SPDEモデルはinla.spde2.matern関数によって作る。

 

spde <- inla.spde2.matern(mesh, alpha = 2)

 

meshは先に作成したドローネ三角形である。パラメータαは、プロセスの平滑性パラメータ に関連しており、 である。0から2までの値をとり、デフォルトは2。空間はd=2なので、 の場合、a=2である。tとkはデフォルトである。

 

事前確率を自分で設定するには、inla.spde2.pcmatern()関数を用いる。これらによって空間効果の範囲()と空間効果の標準偏差s を求める。範囲の事前確率prior.rangeは範囲がある距離未満である確率、c(距離, 確率)を与える。例えば、調査地点間の最大距離が5.7なのでc(3, 0.5)、とし、d の事前確率prior.sigmaは、dがd0より大きい確率p、c(d0, p)を与える。

#spde2 <- inla.spde2.pcmatern(

#               mesh = mesh, alpha = 2,

#               prior.range = c(3, 0.5),

#               prior.sigma = c(2, 0.01))

wというベクトルには、空間フィールドのインデックスが含まれており、これをモデルに渡す。

w <- inla.spde.make.index("w", n.spde = spde$n.spde)

# w <- inla.spde.make.index("w", n.spde = spde2$n.spde)

 

投影行列

任意の調査地点の値は、その地点が配置されている三角形にその点を投影することによって作成される。点の正確な値は、各頂点に関連する3つの重みの加重平均である。

SPDEモデルはm個の次元を持つメッシュ上で定義され、応答値はn個の位置で定義される。そこで、m個のメッシュの頂点とn個の応答値を結びつける方法が必要である。これは、投影行列(A)によって実現される。この投影行列は、inla.spde.make.A()関数を用いて構築する。

観測値と空間効果の間のリンクを作成する。

A <- inla.spde.make.A(mesh, loc = coords.m)

A行列は、調査地点が行、頂点が列を示し、50の頂点のうち、4点だけにデータが含まれる。

 

dim(A) #A行列のサイズ

[1] 25 65

table(rowSums(A > 0))

1

25

table(colSums(A) > 0)

FALSE  TRUE

   40    25

 

スタック

inla stackでは、異なる次元の項を含む予測因子を扱う。推定のためのデータをstackというスタックに構築し、「est」という文字列でタグ付けする。固定効果は切片(Intercept)で、ランダム効果は空間ガウス・ランダム・フィールド(ここではw)である。したがって,effectsには,固定効果を含むdata.frameを含むリストと,SPDEオブジェクトのインデックス(s.index)を含むリストwを渡す。Aには,ランダム効果の投影行列であるAと固定効果(切片とx)を示す1であるリストが設定される.dataには,応答変数のベクトルを指定する.

stack <- inla.stack(data = list(y = dt$y),

A = list(A, 1,1),

effects = list(w,list(Intercept = rep(1, nrow(coords.m))),

x=dt$x),

tag = "est")

tag: データを区別する文字列

 data: データベクトルのリスト

 A: 投影行列のリスト

 effects: 固定効果とランダム効果のリスト

なお、inla.stack()関数は、合計が0になる列に関連するすべての要素を自動的に削除する。

dim(inla.stack.A(stack))

[1] 25 48

 

モデル

応答変数y、切片 Intercept、説明変数x、空間効果fから構成される。ここでは説明変数はひとつなのでxだけだが、多変量の場合は+で加える。また、応答変数の誤差項は正規分布なので、デフォルトのままだが、GLM関数と同様に多数の分布が用意されており、family=で設定する。

model.inla <- inla(y ~ -1+ Intercept +x+ f(w, model = spde), data = inla.stack.data(stack),

    control.predictor = list(A = inla.stack.A(stack),compute=TRUE))

summary(model.inla)

Call:

   c("inla(formula = y ~ -1 + Intercept + x + f(w, model = spde), data

   = inla.stack.data(stack), ", " control.predictor = list(A =

   inla.stack.A(stack), compute = TRUE))" )

Time used:

    Pre = 1.15, Running = 0.328, Post = 0.0469, Total = 1.52

Fixed effects:

           mean    sd 0.025quant 0.5quant 0.975quant  mode kld

Intercept 1.730 4.461     -7.807    1.808     10.851 1.925   0

x         0.372 0.231     -0.091    0.374      0.824 0.378   0

 

Random effects:

  Name    Model

    w SPDE2 model

 

Model hyperparameters:

                                             mean       sd 0.025quant

Precision for the Gaussian observations 21377.128 20207.33   1633.066

Theta1 for w                               -2.832     0.21     -3.235

Theta2 for w                               -0.249     0.35     -0.966

                                         0.5quant 0.975quant     mode

Precision for the Gaussian observations 15563.286  74393.118 4559.193

Theta1 for w                               -2.837     -2.409   -2.853

Theta2 for w                               -0.237      0.412   -0.195

 

Expected number of effective parameters(stdev): 25.00(0.00)

Number of equivalent replicates : 1.00

 

Marginal log-Likelihood:  -84.74

Posterior marginals for the linear predictor and

 the fitted values are computed

 

固定効果は切片が1.7、傾きが0.37と推定された。設定と異なるのは空間効果の影響である。

summary()は、内部スケールのパラメーターの要約推定値を出力する。固定効果だけなら、model.inla$summary.fix、事後周辺分布は、inla.spde2.result関数を使用して取得できる。inla.emarginalは事後周辺分布の期待値を取得する。また、事後周辺分布のパラメーターの要約統計量をinla.zmarginal関数で取得できる。

model.inla.field <- inla.spde2.result(model.inla, "w", spde, do.transf = TRUE)

空間効果の事後確率は、

#kappa

inla.emarginal(function(x) x, model.inla.field$marginals.kappa1) #期待値

# inla.zmarginal(model.inla.field$marginals.kappa1) # 平均値、SDと分位数も含めて

[1] 0.8272446

#Range

inla.emarginal(function(x)x,model.inla.field $marginals.range.nominal1)

# inla.zmarginal(model.inla.field $marginals.range.nominal1)

[1] 3.85958

 

Precision for the Gaussian observations は精度なので、標準偏差に変換する必要がある。

post.se <- inla.tmarginal(function(x) sqrt(1/x), model.inla$marginals.hy1)

inla.emarginal(function(x) x, post.se)

[1] 0.009612023

 

 

#variance

inla.emarginal(function(x) x, model.inla.field$marginals.variance.nominal1)

# inla.zmarginal(model.inla.field$marginals.variance.nominal1) #

 

 

 

空間効果の図示

library(tidyverse)

library(ggregplot)

 

ggField(model.inla, mesh, Groups = 1) + scale_fill_brewer(palette = "Blues")  #空間効果マップ

INLARange(ModelList = model.inla, MaxRange = 10, MeshList = mesh) #距離による相関係数変化

 

f:id:Ikimono-Nigiwai:20220101134009p:plainf:id:Ikimono-Nigiwai:20220101134025p:plain



 

予測

予測では、モデルを、対象となる特定の空間的な位置(すなわち、空間グリッド)のメッシュに投影する。空間モデルはランダム効果として含まれているため、すべての係数の合計はゼロになる。つまり、これらは全体的な平均(切片)からの偏差である。したがって、応答尺度に投影するためには、推定された切片を追加する必要がある。

coords.grid <- as.matrix(expand.grid(long = seq(0, 5, len = 50), lat = seq(0,5, len = 50))) #5050列のグリッド

data.inla.projector <- inla.mesh.projector(mesh, loc = coords.grid)

# このinla.mesh.projector()関数は、新しいグリッドの点を含むメッシュの投影行列を自動的に計算する。

 

newdata <- data.frame(coords.grid, mean = inla.mesh.project(data.inla.projector,

    model.inla$summary.random$w$mean) + model.inla$summary.fixed$mean[1])

# inla.mesh.projectは平均値を取得する

 

ggplot(newdata, aes(y = long, x = lat)) + geom_tile(aes(fill = mean)) #newdataの中のlongとlatの位置に予測値の色でタイルを塗る

#ggplot(coords, aes(y = long, x = lat)) + geom_point(aes(color = y), size = 2) #調査地点の予測値の平面図

f:id:Ikimono-Nigiwai:20220101134118p:plain



coords$pred = model.inla$summary.fix[1, 1] + drop(A %*% model.inla$summary.random$w$mean)

ggplot(coords, aes(y = pred, x = y)) + geom_point() #測定値と予測値の散布図

 

f:id:Ikimono-Nigiwai:20220101134212p:plain

 

予測2

新たに25個の地点を設定し、説明変数だけを与えて、応答変数を予測する。

long<-runif(25,min=1,max=5)

lat<-runif(25,min=1,max=5)

newcoord<-cbind(lat,long)

newcoord<-rbind(coords.m,newcoord)

 

fitted <- subset(dt, select=c(x,y))

blankdata <- expand.grid(x=seq(min(dt$x), max(dt$x), len=25), y=NA) #xのみ値のあるデータ

dt.pred<-rbind(fitted,blankdata)

 

A <- inla.spde.make.A(mesh, loc = newcoord)

stack <- inla.stack(data = list(y = dt.pred$y),

A = list(A, 1,1),

effects = list(w,list(Intercept = rep(1, nrow(newcoord))),

x=dt.pred$x),

tag = "est")

 

model.inla1 <- inla(y ~ -1+ Intercept +x+ f(w, model = spde), data = inla.stack.data(stack),

    control.predictor = list(A = inla.stack.A(stack),compute=TRUE))

# summary(model.inla1)

newcoord.df<-as.data.frame(newcoord)

newcoord.df$pred = model.inla1$summary.fix[1, 1] + drop(A %*% model.inla1$summary.random$w$mean)

 

#予測値の出力

write.table(newcoord.df,"predict.csv",sep=",")

# 平面への値の図示

ggplot(newcoord.df,aes(y=long, x=lat))+geom_point(aes(size=pred))

f:id:Ikimono-Nigiwai:20220101134141p:plain

 

INLAの手順を理解するために4地点の単純な空間データについて考える。

library(INLA)

long<-sample(10:100,4) # x座標値、10から100までの整数を4個非反復抜き取り

lat<-sample(10:100,4)

x<-c(1,2,3,4) # 説明変数

y<-x*1.5+5+rnorm(4,0,1) #応答変数 y=5+1.5x+誤差(平均値0、標準偏差1の正規分布

coord<-data.frame(long, lat)

plot(coord, xlim=c(0,100), ylim=c(0,100))

 

dist(coord) #4点間の距離を求める

      1        2        3

2 36.40055                 

3 55.21775  87.86353        

4 32.20248  25.61250  87.13208

 

SPDE

ドローネ三角形

空間効果の強さは地点間の距離に依存する。地点間の距離を求めるために、ドローネ三角形(メッシュ)を作成する。ドローネ三角形を生成するには、inla.mesh.2d()関数を使う。オプションによって、メッシュの形状を変えることができる。

この関数には、すべての調査地点の座標か、または領域(すべての点を囲む包絡線の座標)を与えなければならない。また、三角形の辺の長さの最小値を指定しなければならない。それによって、領域を三角形に分割する粒度を間接的に指示することになる(エッジが小さいほど、三角形が小さくなり、その結果、三角形の数が増える)。周縁の三角形の分散特性は、内部の三角形の分散特性の半分なので、外辺をバッファとして定義すると良い。上の4地点間距離は25から88であったので、バッファをc(15, 30)とし、辺の長さの最大をc(30, 50)、最小値を10とする

mesh<-inla.mesh.2d(coord,

offset=c(15,30),

cutoff=10,

max.edge=c(30,50))

plot(mesh)

points(coord, col = "red", pch = 16)

 

引数の説明

loc

三角測量の初期ノードとして使用される座標の行列

loc.domain

空間領域を定義するポリゴンの座標

max.edge

内側(および外側)領域の三角形の辺の長さの最大許容値。値は、座標の大きさに関連したスケールでなければならない。値が小さいほど三角形の数が多くなる。

offset

頂点と領域の辺との間の距離と辺の外側に拡大する距離を指定する。正の値は絶対的な距離として、負の値は乗数として扱われる。

cuttoff

頂点間の最小の距離である。これにより、非常に近い位置にある調査地点は同じ三角形の中に配置される。注意すべき点は、非常に鋭角な三角形は、投影の際に効果を発揮しないため、避けたい。

 

頂点の数は、

mesh$n

[1] 50

 

調査地点に対応する頂点の番号

mesh$idx$loc

[1] 17 18 19 20

 

# 100組の座標値を作成する

set.seed(1)

n <- 100

coords <- cbind(long=sample(1:n), lat=sample(1:n)) #1から100までの整数を非復元抽出

plot(coords

 

mesh1 <- inla.mesh.2d(loc = coords,

max.edge = c(30, 30),

offset = c(15,30))

plot(mesh1)

points(coords.sp, col = "red", pch = 16)

 

mesh2 <- inla.mesh.2d(loc = coords,

max.edge = c(30, 60),

offset = c(15,30))

plot(mesh2)

points(coords.sp, col = "red", pch = 16)

 

mesh3 <- inla.mesh.2d(loc = coords,

max.edge = c(30, 30),

offset = c(15,30),

cutoff = 10)

plot(mesh3)

points(coords.sp, col = "red", pch = 16)

 

 

SPDEモデル

INLAの空間効果は、確率的偏微分方程式と呼ばれるいくつかの複雑な数学的機構を使用して推定する。基本的な考え方は、回帰スプラインと同様に、離散点(メッシュで定義されたノード)と基底関数のセットを使用して連続空間効果を推定することである。

 空間効果は2点間の距離の関数であるが、Matern相関関数が用いられる。データセット内の任意の2点間の共分散は、

 

 

距離( d )、Matern関数の範囲( κ )と空間分散( δ )で示される。

 

SPDEモデルはinla.spde2.matern関数によって作る。

spde <- inla.spde2.matern(mesh, alpha = 2)

meshは先に作成したドローネ三角形である。パラメータαは、プロセスの平滑性パラメータ に関連しており、 である。0から2までの値をとり、デフォルトは2。空間はd=2なので、 の場合、a=2である。tとkはデフォルトである。

 

事前確率を自分で設定するには、inla.spde2.pcmatern()関数を用いる。これらによって空間効果の範囲()と空間効果の標準偏差s を求める。範囲の事前確率prior.rangeは範囲がある距離未満である確率、c(距離, 確率)を与える。例えば、調査地点間の最大距離が88なのでc(40, 0.5)、とし、d の事前確率prior.sigmaは、dがd0より大きい確率p、c(d0, p)を与える。

#spde2 <- inla.spde2.pcmatern(

#               mesh = mesh, alpha = 2,

#               prior.range = c(40, 0.5),

#               prior.sigma = c(2, 0.01))

 

SPDEモデルは非常に複雑になる。wというベクトルには、空間フィールドのインデックスが含まれており、これをモデルに送る。

w <- inla.spde.make.index("w", n.spde = spde$n.spde)

# w <- inla.spde.make.index("w", n.spde = spde2$n.spde)

str(w)

List of 3

 $ w      : int [1:50] 1 2 3 4 5 6 7 8 9 10 ...

 $ w.group: int [1:50] 1 1 1 1 1 1 1 1 1 1 ...

 $ w.repl : int [1:50] 1 1 1 1 1 1 1 1 1 1 ...

 

投影行列

任意の調査地点の値は、その地点が配置されている三角形にその点を投影することによって作成される。点の正確な値は、各頂点に関連する3つの重みの加重平均である。

SPDEモデルはm個の次元を持つメッシュ上で定義され、応答値はn個の位置で定義される。そこで、m個のメッシュの頂点とn個の応答値を結びつける方法が必要である。これは、投影行列(A)によって実現される。この投影行列は、inla.spde.make.A()関数を用いて構築する。

観測値と空間効果の間のリンクを作成する。

A <- inla.spde.make.A(mesh, loc = as.matrix(coord[,c("long","lat")]))

dim(A) #A行列の次元

[1]  4 50

round(A,2) #A行列の内容

4 x 50 sparse Matrix of class "dgCMatrix"

                                                                           

[1,] . . . . . . . . . . . . . . . . 1 . . . . 0 . 0 . . . . . . . . . . . .

[2,] . . . . . . 0 0 . . . . . . . . . 1 . . . . . . . . . . . . . . . . . .

[3,] . . . . . 0 . . . . . . . . . . . . 1 . . . . . . 0 . . . . . . . . . .

[4,] . . . . . . . . . . . . . . . . . 0 . 1 . . 0 . . . . . . . . . . . . .

                               

[1,] . . . . . . . . . . . . . .

[2,] . . . . . . . . . . . . . .

[3,] . . . . . . . . . . . . . .

[4,] . . . . . . . . . . . . . .

 

table(rowSums(A > 0))

1

4

table(colSums(A) > 0)

FALSE  TRUE

   46     4

A行列は、調査地点が行、頂点が列を示し、50の頂点のうち、4点だけにデータが含まれる。

 

スタック

inla stackでは、異なる次元の項を含む予測因子を扱う。推定のためのデータをstackというスタックに構築し、「est」という文字列でタグ付けする。固定効果は切片(Intercept)で、ランダム効果は空間ガウス・ランダム・フィールド(ここではw)である。したがって,effectsには,固定効果を含むdata.frameを含むリストと,SPDEオブジェクトのインデックス(s.index)を含むリストwを渡す。Aには,ランダム効果の投影行列であるAと固定効果(切片とx)を示す1であるリストが設定される.dataには,応答変数のベクトルを指定する.

 

stack <- inla.stack(data = list(y = y),

A = list(A, 1,1),

effects = list(w,list(Intercept = rep(1, nrow(coord))),

x=x),

tag = "est")

 tag: データを区別する文字列

 data: データベクトルのリスト

 A: 投影行列のリスト

 effects: 固定効果とランダム効果のリスト

 

なお、inla.stack()関数は、合計が0になる列に関連するすべての要素を自動的に削除する。

[1] 4 9

 

 

 

 

ベイズ推定のためのINLA

Integrated Nested Laplace Approximation(INLA)はベイズ推定を行う方法である。INLAは回帰モデルや一般化線形混合モデル,加法モデル,生存解析モデル,時空間モデルなどに対応する非常に汎用性の高い方法である。

ベイズ推定は、仮説の事後確率は、尤度に事前確率を乗じたものと等しく、データの確率をパラメータのすべての可能なレベルで積分したもので割ることにより、すべて正規化(曲線の下の面積が1になるように)される。

 

 

MCMCは理論的には厳密な推論を行うことができるが、満足のいく収束を得るためには、長い時間を要する。ラプラス近似に基づいたモデルパラメータの事後周辺分布の新しい近似方法の一つがINLAである。INLAモデルは、以下のようなコンセプトで作られている。

潜在的ガウスモデル

ガウス・マルコフ・ランダム・フィールド(GMRF

ラプラス近似

 

私にとっては、ブラックボックスであるが、最近日本語の解説が公開されたので、参照してほしい。

「Integrated Nested Laplace Approximationを用いた近似ベイズ解析」

https://qiita.com/Nospare_Inc/items/925f3abbac4aed49db28

 

R-INLA

INLAはRパッケージとしてつくられており、

install.packages ("INLA")

でインストールできる。

このパッケージの主要な関数はinla()で、INLAの手法を用いてベイズモデルをフィットさせるために使用される。この関数は、glm()や gam()と同様の方法で動作する。固定効果とその他の効果の組み合わせを便利に指定することができる。さらに、INLAでは、確率的偏微分方程式(SPDE)を用いて空間モデルをフィッティングすることができます。

 

 また、結果の図による表現などのために、

tidyverseに含まれるggplot2はグラフィックスを作成するパッケージ

ggregplot:空間効果の作図などに使うパッケージ

などが便利である。

devtools::install_github("https://github.com/gfalbery/ggregplot")

あるいは

install.packages("remotes")

remotes::install_github("gfalbery/ggregplot")

夢洲の未来

2025年に大阪市夢洲万国博覧会が開催される.1970年の万博は,「人類の進歩と調和」がテーマであった.中学生だった私は、長い行列に加わって月の石を見て、科学技術のすばらしさに感動した.一方、岡本太郎太陽の塔内部に製作した「いのちの樹」でいのちの躍動と尊厳を訴えた.その思想は万博終了後に受け継がれる.会場跡地は「緑に包まれた文化公園」とする基本計画が策定され,60万本の樹木が植栽された.植樹約40年後にはオオタカが営巣するなど自然が着実に回復している.2000年からは生物多様性を高めるために,密生しすぎた木を切って空き地をつくる「人工ギャップ」という管理手法を採用し、モニタリングを継続している.

f:id:Ikimono-Nigiwai:20211227190158j:plain

 2005年の愛・地球博では,会場予定地にオオタカの営巣が確認された.貴重な自然を守るために会場計画が大幅に修正される.里山が守られたのみならず,造成による土地改変をおこなわずに地形の起伏やため池を残した会場となった.会期中は再生可能エネルギーの利用や壁面緑化「バイオラング」の利用など,自然環境保全のための知恵が活用された.これらの取り組みは,2010年の生物多様性条約COP10や2014年のESDユネスコ会議の愛知開催につながった.

 2025年万博はこれまでの博覧会と異なり,海上埋立地を会場とする.しかし,ここが自然の宝庫であることは知られていない.過渡的にできた湿地に本州最多,数百羽のツクシガモを含む数千羽以上の水鳥やワシ・タカ類が飛来し,絶滅危惧種コアジサシが繁殖する.大阪では絶滅した水草,カワツルモの生育も確認された.夢洲がある大阪湾奥はもともと難波潟という干潟が広がり,豊かな漁場が形成されていた.陸と海のつながりが豊かな自然を実現する.埋め立てによって干潟は失われたが,水鳥たちの渡りのルートは変わらず,人工的な干潟が出現すると再び訪れたのだ.人間が奪ってしまった、住かの一部を返せないだろうか.

f:id:Ikimono-Nigiwai:20211227190356j:plain

大阪は人と海が創りあげてきた.藻塩が焼かれ,海産物が採られ,商船が行きかった.コンクリートで覆われた大阪は一時的な姿に過ぎない.コロナ後の社会の在り方として,環境を重視した経済政策であるグリーンリカバリーが必要とされる.夢洲が最新の技術を用いるスマートシティとなることは素晴らしいが,海の豊かさを置き去りにしてはならない.

どうすれば子供たちに海の豊かさを伝えられるのか.阪南市では小学生がアマモ場の再生に取り組んでいる.海の森(アマモや海藻)は魚のゆりかごとなり、地球温暖化対策に役立つ.東京湾ではコンブが養殖されている.関西空港の傾斜護岸には豊かな藻場が形成され、カサゴメバルが住みついた.野鳥園臨港緑地(南港野鳥園)の森にはアカテガニが住み、泉南の海岸ではウミホタルが光る.夢洲で実装される「いのち輝く未来社会」は地球が人のためにだけあるのでなく,多くのいのちを育んでいるという気づきをもたらす社会としたい.