多文化・多言語対応の安全な大規模言語モデルの構築を目指して - 東京カレッジ

多文化・多言語対応の安全な大規模言語モデルの構築を目指して

日時:
2024.11.11 @ 10:00 – 11:00
2024-11-11T10:00:00+09:00
2024-11-11T11:00:00+09:00
多文化・多言語対応の安全な大規模言語モデルの構築を目指して

講演資料こちらから、ウェビナーの報告書こちらからダウンロードできます。

シンガポールAIセーフティレッドチーミングチャレンジ参加レポートこちらからダウンロードできます。

終了しました
Zoom ウェビナー
開催日時 2024年11月11日(月)10:00-11:00
会場

Zoomウェビナー(登録はこちらへ)

申込方法 事前申込制(当日参加できないため、後日の動画配信案内を希望する方もご登録をお願いします)
言語 日本語
要旨

生成人工知能(AI)の利用が世界的に広まるにつれ、AIモデルが地域ごとの文化や言語におけるリスクや懸念を敏感に反映できることがますます重要になっています。

 

そのためには、何がリスクや有害なコンテンツなのかを地域・文化ごとに特定する作業を更新し続けていくことが必要となります。この作業には、AIや情報セキュリティの研究者はもちろん、人文・社会科学の研究者、AIやメディアのプラットフォーマー達や実務家の方や政策関係者たちと継続的に議論できるコミュニティを形成していくことが重要となります。

 

これに対する1つのアプローチとして展開されている「レッドチーミング」は、生成AIを評価するため、安全性に違反するような暴力を煽る有害コンテンツ、攻撃的な言葉、汚い言葉などをあえて誘発し、モデルを「壊そう」とするものです。しかし、現在のAIの安全性に関するレッドチーミングは、欧米中心であり、地域的な被害(モデルが特定の民族を差別するリスクなど)に対処する方法を考える必要があります。

 

このような問題意識のもと2024年11月、シンガポール政府 Infocomm Media Development Authority が「AI安全性レッドチームチャレンジ プロジェクト」を開始しました。文化や言語の専門家のコミュニティを集め、AIモデルをレッドチーム化することを目的として組成しており、生成AIを地域にとってより安全なものにするための重要な第一歩と捉えています。同プロジェクトには日本も協力しています。本イベントでは、11月5日に行われたプロジェクトの報告会を行うと同時に、このようなコミュニティを継続させていく枠組みについてお話します。

 

生成AIの安全性やガバナンスにご関心をお持ちの方々のご参加をお待ちしております。

プログラム

10:00-10:15 開会挨拶と趣旨説明:江間有沙(東京大学東京カレッジ)

10:15-10:30  LLMの安全性に向けた取り組み:関根聡(NII-LLMC/理研AIP)

10:30-10:45 CTFチャレンジの概要説明と今後について:築地テレサ(日本ディープラーニング協会)

10:45-11:00 コメントと質疑応答

お問い合わせ tg-event@tc.u-tokyo.ac.jp
主催 東京大学国際高等研究所東京カレッジ、東京大学未来ビジョン研究センター、東京大学次世代知能科学研究センター、東京大学B’AI Global Forum、日本ディープラーニング協会
後援 情報学研究所大規模言語モデル研究開発センター、日本AIセーフティ・インスティテュート

Upcoming Events

開催予定のイベント

言語における協働──記録から再興へ(講演者:Mark TURIN教授)

イベント予定講演会/Lecture

2025年4月4日(金)13:00-14:30

"本講演では、これまでMark TURIN教授が関わってきた、歴史的に周縁化されてきた先住民族コミュニティとの2つの協働プロジェクトについて議論する。対象となるのは、ヒマラヤ地域および北米先住民社会であり、彼らはそれぞれの言語を保存し、再興するために取り組んでいる。本講演では、「収集(Collect)」「保護(Protect)」「つながり(Connect)」という3つの言葉について探求する。
"

役に立たない機械の目的とは何か(講演者:Dominique LESTEL教授)

イベント予定講演会/Lecture

2025年4月9日(水)15:00-16:30

ヒューマノイドロボットが注目されているが、実際に人間やその他のロボットと比べてヒューマノイドロボットは何を得意とし、安価であるのかを正確に特定することは難しい。その問題は哲学者にとって大きな課題となっている。本講演では、2017年に市民権を与えられた最初のヒューマノイドロボットであるソフィアを事例として取りあげ、その奇妙な機械が、救世主機械(他の機械の到来を告げる機械)、形而上学的機械(誰が人間か、誰が生きているかなど、根本的な形而上学的質問を私たちに強いる機会)、そして魔法の機械(危険な機械への恐怖と戦うのに役立つ機械)の役割を担うことにより、社会において繊細な位置を占めていることを論じる。

黒死病の世界:新たなアプローチ(講演者:Patrick BOUCHERON教授)

イベント予定講演会/Lecture

2025年4月16日(水)10:00-11:30

1347年からヨーロッパに広がった第二次ペスト大流行は「黒死病」と呼ばれ、史上最大の人口災害として知られている。今日では、葬送考古学、人類学、微生物学、環境科学を組み合わせた学際的研究により、ペスト研究のアプローチは大きく変容した。DNA分析や気候研究の進展は新たな理解をもたらしたが、長期的で世界規模の出来事をどのようにしてグローバル・ヒストリーとして叙述すべきか、という課題は残されている。ペストの流行経路は世界のつながりを示すが、その正確な地理は依然として不明瞭である。そはまるで群島のように不連続でありながらもグローバルな広がりを持つ。

世界文学を超えて(講演者:William MARX教授)

イベント予定講演会/Lecture

2025年5月8日(木)10:30-12:00

少なくとも19世紀以降、世界文学は現実のものとなった。テキストは大陸や文化を越えて旅をし、あらゆる言語から翻訳され、世界中の大学で教えられ、新たなグローバルな規範を形成している。これほど自由に、どこにいても好きな作品を読むことができる時代はかつてなかった。あるいは、そう思えるかもしれない。しかし、それは本当の自由なのでしょうか?単なる心地よい幻想にすぎないのでしょうか?この一見無限に広がる文学の交流には、どのような境界があるのか。本講演は、その限界を探り、文学への新しいアプローチを提案することを目的とする。それは、まったく新しいテキストの読み方、あるいは、かつて存在し忘れ去られた方法かもしれません。
ようこそ、「世界の図書館」へ!

Previous Events

公開済みイベント

ブリュッセル効果への対応:日本企業はEU-AI法にどう備えるべきか3

イベント予定パネルディスカッション/Panel discussion講演会/Lecture

2025年3月19日(水)12:00-13:00

東京大学では2024年12月11日にEU-AI法の解説とCoPの第一ドラフトの解説、2025年1月15日に第二ドラフトの解説を行いました。本ウェビナーでは最後となるCoP第三ドラフトについての解説と、日本企業が特に留意すべき重要なポイントについて概説します。

デジタル時代の 教育と 科学の役割(ユヴァル・ノア・ハラリ)

イベント予定パネルディスカッション/Panel discussion共催/Joint Event

2025年3月17日(月)15:00-16:30(14:00開場)

今日、デジタルネットワークは私たちに膨大な情報を 提供しています。特に教育や科学の分野ではかつて ない規模となっています。しかし、これらの成果にもか かわらず、私たちの精神的、社会経済的、政治的状況 は改善されていません。むしろ、それらは悪化してい るように見えます。何が間違っているのでしょうか? 私たちは何をどう改善すべきなのでしょうか? 過去 の情報革命から、私たちは何を学べるのでしょうか? メディアとAIガバナンスの分野で活躍する日本の 2人の著名な研究者が、世界的に有名な思想家で ベストセラー作家であるユヴァ ル・ノア・ハラリとともに、情 報時代のリスクとチャンスに ついて新著『NEXUS 情報の 人類史』をもとに議論します。

グローバル・ブランドとしての日本語:「ヨーロッパ風」に書かれる日本語とは(講演者:Viktoria ESCHBACH-SZABO教授)

イベント予定講演会/Lecture

2025年3月4日(火)15:00-16:30

この講義では、日本語が、国境を越えた日本のグローバル・ブランディングに与える影響を探り、独特のイメージ、文化的意義、信憑性を呼び起こすために、日本語がどのように戦略的に用いられているかを検証する。また、重要な世界言語としての日本語の在り方の現状と、今後の研究の方向性についても洞察する。ドイツとハンガリーにおける言語学的ケーススタディを用いて、日本語表記がどのように言語的に再構成され、製品のアイデンティティや日本らしさを呼び起こすデザインと組み合わされているのかを明らかにする。海外の新たな文脈に創造的に適応された日本語は、ヨーロッパにおいて強力なブランディング・ツールとなっている。

日本の過去を再考する:通史の改訂と歴史の修正(講演者:Andrew GORDON教授)

イベント予定講演会/Lecture

2025年2月27日(木)15:00-16:30

過去というのはまるで異国だと言われており、歴史家は現代の価値観を押し付けることなく過去を理解しようとする。しかしながら、歴史叙述とは、必然的に過去と現在の対話を行うことである。本講演では、これまでA Modern History of Japanを4版執筆し、現在5版の執筆を検討中の著者が、25年にわたる内的対話を紹介する。

イギリスの対中認識と対日政策 ー 2010-2024年(講演者:Alastair MORGAN潮田フェロー)

イベント予定講演会/Lecture

2025年2月18日(火)15:00-16:30

保守党率いるイギリス政府の中国に対する認識は、2010年から2024年にかけて大きく変化しました。2010年、デーヴィッド・キャメロン首相は中国の台頭を機会と捉えていました。しかし、10年後には、政府は中国をイギリスの経済安全保障に対する最大の長期的脅威とし、海外での中国の自己主張に対する懸念が高まっていると表明しました。この期間に、イギリスと日本はますます密接な安全保障関係を築きました。イギリス政府の中国に対する認識がこの期間の日本への政策を決定付けたのでしょうか、それとも他の要因も同様の影響力があったのでしょうか?新しい労働党政府からはどのようなアプローチが期待されるのでしょうか?

日常の「外交官」: 分断された世界で混沌をつながりに変える(講演者:Annelise RILES教授)

イベント予定講演会/Lecture

2025年2月13日(木)10:00-11:30

Annelise RILESは、新著『Everyday Ambassadors』で、私たちは今、リーダーシップが少数の手にあるのではなく、すべての人の手にあるエキサイティングな新世界秩序の瀬戸際にいると主張する。世界に今必要なのは、政治的、文化的違い、科学と宗教、芸術とテクノロジーの世界の間の橋渡し役であり、翻訳者、通訳者など、より多くの外交官であると提唱している。本講演では、RILES教授が、数十年にわたる法律と民族誌の研究をまとめ、誰もがどこにいても優れた外交官になるための 7 つの「行動」をまとめた著書について語る。


TOP