NLP2023 Workshop on Japanese Language Resources (JLR2023)
言語処理学会第29回年次大会 併設ワークショップ JLR2023

日本語言語資源の構築と利用性の向上

言語処理学会第29回年次大会(NLP2023) 併設ワークショップ

日時:2023年3月17日(金) 9:30〜18:00

会場:沖縄コンベンションセンターB1会議室(サテライトA2会議室)+オンライン中継(Zoom)のハイブリッド開催

共催:株式会社 Studio Ousia
   国立国語研究所共同研究プロジェクト「実証的な理論・対照言語学の推進」
   科学研究費補助金・基盤研究(A)「計算知と人知の融合による汎用言語理解基盤の構築」

Twitter公式アカウント@jedws

What's new

2023/03/17 ワークショップは終了しました。たくさんのご参加、ありがとうございました。
2023/03/01 ワークショッププログラムを更新しました。

趣旨

自然言語処理における各種タスクのモデルを訓練、評価、分析するためには、注釈付きコーパスや事前学習済みモデルなどの言語資源が必要不可欠である。 英語を中心に多くの言語資源が構築、公開されているが、日本語では多くない。 この状況は、日本語における自然言語処理の迅速な発展を阻害する要因となっている。

本ワークショップでは、日本語における言語資源の構築手法そのものに加えて、言語資源の公開方式、利用性を高めるための著作権・ライセンス設定、タスクの複合化など、普及および応用を容易にするための研究について集 中的に議論する。これによって、日本語言語資源の公開の流れを加速し、日本語自然言語処理のさらなる発展および生産性向上につなげていきたい。

招待講演:知識拡張型言語モデルLUKE

講演者: 山田育矢 先生株式会社Studio Ousia, Co-founder, Chief Scientist)
概要

LUKEは、単語とエンティティを扱う知識拡張型言語モデルで、エンティティに関する知識が重要となるダウンストリームタスクを良い性能で解くことができる。このモデルはHuggingface Transformersに組み込まれており、簡単に使うことができる。本講演では、LUKE (EMNLP 2020) 、多言語版LUKE (ACL 2022)、LUKEのエンティティリンキングへの応用 (NAACL 2022, EMNLP Findings 2022)、日本語版LUKEまでの取り組みを紹介する。

講演資料

知識拡張型言語モデルLUKE

略歴

(株)Studio Ousiaを共同創業し、自然言語処理の技術開発に従事。2000年に(株)ニューロンを起業し、2005年に売却。2007年にStudio Ousiaを設立。博士(学術)。理化学研究所AIP客員研究員。Kaggle Master。

タイムテーブル

プログラムの詳細はこちらから

9:30-9:35 オープニング
9:35-10:30 日本語データセットの構築(1) [一般発表2件]
10:40-11:40 日本語データセットの構築(2) [一般発表2件・LT2件]
11:50-13:15 多言語・多分野の言語資源の構築 [一般発表3件・LT3件]
13:15-14:20 昼休憩
14:20-15:20 招待講演(山田育矢先生)
15:30-17:05 事前学習モデルの構築と利用 [一般発表3件・LT2件]
17:15-18:00 パネル(総合討論)・クロージング

NLP2023 Slack チャンネル

NLP2023参加者限定Slackワークスペースで、当ワークショップのチャンネルが用意されています。
#zzz_0317-0930-ws1_日本語言語資源の構築と利用性の向上-b会場

スケジュール

発表募集要項

募集する発表内容

日本語のデータセットや事前学習済みモデルなどの言語資源を構築されている方は,論文では語られない苦労話を含めて,構築ノウハウをぜひご発表ください.これから言語資源の構築を始めようとしている方には,その構築の狙いについてご発表をお願いします.また,自然言語処理に関する知識をお持ちかどうかを問わず,金融や医療といった応用領域の業務知見から,特定ドメインの日本語言語資源の必要性を伝えるご発表を歓迎します.さらに,日本語言語資源の充実にむけて克服すべき障壁や課題,そしてそれらの解決に向けたアイディアのご発表も歓迎します.下記に内容の例を示しますが,これらにとどまらず様々な取り組みについてご発表をお待ちしています.

日本語データセットの構築と公開

日本語事前学習済みモデルの構築と公開

日本語言語資源不足の解決と自然言語処理研究開発・産業応用の加速に向けた取り組み

発表スライドの事前提出について

発表方法

発表種別

一般発表

ライトニングトーク

※発表希望者多数の場合,一般発表からライトニングトークへの振り分けや不採択とさせていただく場合がありますので,予めご了承ください.

発表申込期間

※発表申込は締め切りました。

一般発表

ライトニングトーク

発表スライド提出期限

発表申し込みフォーム

※発表申込は締め切りました。

参加申し込み

本ワークショップは言語処理学会第29回年次大会(NLP2023)の併設ワークショップとして開催されます. 本ワークショップにおける発表・参加のためにはNLP2023に参加登録(有料)を行う必要があります. NLP2023の参加登録期間は,事前登録が2023/01/10〜02/13,直前登録は2023/03/01〜10正午,当日登録は2023/03/13〜17正午です.

提案者

問い合わせ先 jlr2023 (at) googlegroups.com