マテリアル先端リサーチインフラ データ利用に関するガイドライン
マテリアル先端リサーチインフラ
データ連携基盤委員会
制定 令和5年12月12日
改正 令和6年4月1日
-
概要
文部科学省マテリアル先端リサーチインフラ(以下「ARIM」という)では、ARIMに参画する二十五機関が保有しARIMに登録している設備や機器等から創出されたデータを、見つけやすく、使いやすい構造化されたデータセットとして、データ利用者に提供します。データセットは国立研究開発法人 物質・材料研究機構が運用するシステム(以下ARIMシステム)から提供されます。
「マテリアル先端リサーチインフラデータ利用に関するガイドライン」(以下「ガイドライン」という)は、ARIMシステムが提供するデータセットやサービスの利用に関するガイドラインであり、「マテリアル先端リサーチインフラデータ利用約款(以下「データ利用約款」という)」を補足するものです。
データ利用約款では、ARIMが提供するデータセットから作られたあらゆるデータを「派生データ」と呼び、それ自体の再配布や公開を禁ずる一方、派生データを含んだ論文や派生データに新たな価値を付加したデータベースなどを「成果物」と呼び、一定の条件でその共有・出版・公開を許可しています。
- 派生データ・成果物についいて
データ利用約款において、派生データと成果物は以下の様に定義されています。
第1条⒀ 「派生データ」とは、ライセンスデータについて加工、編集、翻案のいずれか1つ以上を1回もしくは複数回行って得られたデータをいいます。
第1条⒃ 「成果物」とは、契約者またはユーザーが、第9条第1項から第3項に従って、ライセンスデータもしくは派生データを利用して作成した創作物であって、
①ライセンスデータ及び派生データの表示を全く含まないもの
②本事業内の委員会が定めるガイドラインにより許容される量を超えない範囲内で、ライセンスデータ又は派生データを含む論文
③ライセンスデータに加工や編集を加えることにより新たな学術的もしくは技術的な価値を付与された派生データ(ライセンスデータと実質的に同一であるものを除く)を含むもの
をいいます。これらに該当する成果物について、その種類は以下の各号のものを含みますが、これらに限定されるものではありません。
a. 論文やプログラム等の著作物
b. AIモデルおよびこれによる作成物
c. 派生データの集合・データベース
d. サービスおよび製品
e. ビジネスモデル
上記に該当がないケースでのご利用でご懸念がある場合には、下記の連絡先にお問い合わせください。例えば、以下の様なものは成果物として認められ、その共有・出版・公開が可能です。
- 「ライセンスデータ」を教師データとして行った機械学習モデル(ソースコード、パラメータ:両者とも成果物に該当)やそれに関する論文や文書。ただし、このとき教師データとして使用した「ライセンスデータ」の公開には制限がありますので、下記 のガイドラインに従ってください。また、Data Availabilityの記載が必要な場合には、データ利用約款 第14条(引用、謝辞の表記の明記)に従ってデータ入手方法をご明記ください。
- 「ライセンスデータ」の情報を入力に用いて第一原理計算などの非自明な解析を行うことで得られたデータおよびそれらをまとめたデータベース。ただし、「ライセンスデータ」そのものの公開やData Availabilityについては上述のとおりです。
- 派生データもしくは成果物の利用・権利・禁止事項
派生データもしくは成果物に係る利用・権利・禁止事項はデータ利用約款の第9条、第10条および第13条において定められており、派生データは公開・共有は禁止となりますが、成果物は公開・共有が可能となります。
- 成果物の共有・出版・公開可否にかかるガイドライン
以下のようなものは成果物として共有・出版・公開は認められません。
- ライセンスデータ及び派生データの表示を含み、その公開によってARIMと競合するまたはARIMの評判、利用可能性、信用、ARIMデータベースの価値などを棄損するとARIM運営機構が判断し得る作成物・サービス・製品
- ARIMのライセンスデータの登録者の権利を著しく毀損する恐れの高いとARIM運営機構が判断し得る作成物・サービス・製品
- データ利用申請の目的から逸脱して作成した作成物・サービス・製品
詳細はデータ利用約款の第13条をご確認ください。ご自身がデータ利用により得た作成物・サービス・製品について、公開・出版可否のご判断が難しい場合には、下記までご連絡・ご相談下さい。なお、以下に示す例は認められない可能性があります。このような利用を考えられる場合はお問い合わせください。
- データセット全体あるいは大半のデータを再構成して提供するデータベースの公開
- ライセンスデータを容易に復元可能であったり、新たな学術的もしくは技術的な価値を付与されていない派生データおよびそれらをまとめたデータベースの公開
- ライセンスデータの教育目的での利用について
データ利用約款 第11 条(3)において、日本国内の小学校、中学校、高等学校、大学等における教育目的とした場合、ライセンスデータの利用に関する禁止事項が緩和されることが述べられています。教育目的に限り、以下のような利用が認められます。
- 「ライセンスデータ」を用いて講義等を行う際、必要最低限の「ライセンスデータ」を受講生に無償で配布することが可能です。ただし、「ライセンスデータ」を受領した受講生によるデータの講義外での2 次利用や再配布は認められません。「ライセンスデータ」を配布する場合には、十分な注意喚起を必ず実施してください。認められていない2 次利用や再配布は、データ登録者やARIM の権利を著しく毀損する不当な行為である点を認識してもらうことも含めて、「教育目的」に有意義にご活用ください。
- 「ライセンスデータ」を用いて講義等を行う際には、データ利用約款 第14 条(引用、謝辞の表記の明記)に従って謝辞等をご明記ください。
お問い合わせ窓口
国立研究開発法人 物質・材料研究機構マテリアル先端リサーチインフラハブ
データ事務局データライセンス担当
記載していただきたいこと
- 当該データセットの課題番号
- データセット名
- そのデータセットにかかる質問事項
