伝統的な集合知(Wosdom of Crowds; WoC)のモデルによれば、個体の意見を集約した集団の成績が個体の平均よりも高まるためには、そもそも各個体が、少なくとも「でたらめ」よりは高い意思決定精度を発揮できなければならない。動物の学習が情報サンプリングのバイアス(ホットストーブ効果)を受けやすく、個体の意思決定が必ずしも効用最大化へ向かないことを考えれば、このWoCの条件が満たされる状況は自然界においてはむしろ稀かもしれない。にもかかわらず、人間を含めた多くの動物では、多数派同調というバイアスを増幅させる社会的学習戦略を広く採用している。動物の集団は、非最適なバイアスの増幅を克服できるのだろうか?数理モデル解析とシミュレーションを通して、この疑問に迫った。モデルでは、強化学習を行うエージェントたちがしばしば他者を模倣する。すると、ベースとなる強化学習は効用最小化となるリスク回避バイアスを示すにもかかわらず、集団は全体として効用最大化となるリスク選好性を示すことがわかった。これは、多数派同調が、副産物的に個体の探索を促すことがあり、そのおかげでホットストーブ効果が弱まったことが原因だった。またこの観察は、人間を使ったオンライン行動実験でも支持された。集合知(Collective intelligence)とは、単に個体の意見を集約し、バイアスを増幅するものではなく、もっと動的に個体の学習と意思決定の時系列へ影響を与え、探索と知識利用パターンを質的に変化させる現象として捉えるべきだろう。