金融審議会ディスクロージャーWGに係る意見 (ニコラス・ベネシュ）

企業情報の開示・提供のあり方についての意見書

ニコラス　ベネシュ(個人として)
平成30年5月18日

総論

企業の持続的・長期的な成長のため、いわゆるESG（環境・社会・ガバナンス）の投資手法が日本でも広まってきていますが、私はこれまで、この中でも特に「G（ガバナンス）」が重要であるという認識のもと、コーポレートガバナンス・コードとスチュワードシップ・コードの制定・発展に寄与すべく、金融庁や日本取引所グループ等に対して様々な働きかけを行ってきました。今では、日本のコーポレートガバナンスは、（もちろんまだ不十分な点も多いですが）世界的に見ても急激な発展を遂げていると評価できます。

そうした中、企業情報の開示・提供は、企業と投資家を結び付ける重要事項です。しかしながら、今のままでは、この点で日本は主要国から遅れを取る恐れがあると言わざるを得ません。いかに近代的なコーポレートガバナンス原則の枠組みを構築しても、多数の企業の比較分析が可能な形でそれぞれの企業の現状が投資家に伝わらなければ画に描いた餅になってしまいます。コーポレートガバナンス・コードとスチュワードシップ・コードを車の「両輪」として機能させるため、企業情報の開示・提供のあり方を検証し、整備することは、今日本において最も必要な喫緊の課題であると考えています。（このことは、コーポレートガバナンス・コードを提唱する時から私が強調していた点です[1]。）

以下、この点に関して私がお伝えしたい点をいくつか述べます。

AIによる情報収集を意識した開示の在り方

(1) AIによる情報収集の重要性

ご承知の通り、昨今はAI（人工知能）がめまぐるしい発展を遂げています。AIを利用すれば、膨大な量の企業情報を集積して企業間の比較を行うとともに、どのようなガバナンスをもつ企業が実績を上げるかを検証することが可能になります。これにより企業と投資家の対話は活発になります[2]。このようなAIを利用した投資活動は今や世界の投資家のスタンダードとなりつつあり、5年先まで見据えれば、財務情報だけではなく叙述的な非財務情報も含めたAIによる情報収集・整理・分析は常識になります。これが困難な市場は世界から見捨てられかねません。日本の市場が世界の中で生き残るためには、AIの技術的発展をキャッチアップしつつ（むしろ、リードしつつ）、AIによる情報収集が行われることを常に意識した情報開示のあり方を追求しなければなりません。特に、日本語は自然言語処理に適していない言語であるという特殊な課題がありますので、当局である金融庁や日本取引所グループは危機感を抱くべきです。この意見書の中で私が最も強調したい点です。以下、具体的に述べます。

(2) 詳細なXBRLタグ付け（又はそれに代替する工夫）

（ア）XBRLタグ付けの意味と日本の状況

XBRL（eXtensible Business Reporting Language）は、各種報告・開示資料用の情報を作成・流通・利用できるように標準化されたXMLベースのコンピュータ言語です。XBRLタグ付けとは、端的に言えば、開示資料に入っている情報の項目毎にコンピュータが「この数字・テキストはどの項目なのか、又はどのトピックに関するものなのか」などを特定できる、世界のグローバル・スタンダードになっているXBRLの基本的な使い方を言います。

EDINETなどの開示書類においては、記載事項毎に詳細なXBRLタグ付けをすればするほど、AIはより細かく何がどこに記載されているかを瞬時に判断することができます（逆に言えば、XBRLタグがなければ、開示資料全部を初めから解析する膨大なAIプログラムを開発しなければならないし、解析に時間がかかる上、解析エラーがとても多くなります。）。金融庁（総務企画局　企業開示課）が平成30年3月に公表したEDINETタクソノミの概要説明（CG・IFRS 対応版）2-5（36ページ以降）では、詳細タグ付けの範囲及び方針が記載されており、このような方針自体は、AIによる情報収集を意識した積極的な施策として評価することができます。

このEDINETタクソノミの最新版の導入によりいくらか改善されると期待していますが、少なくとも現状の日本におけるXBRLタグ付けは十分とは言えません。以下、任意にピックアップした日米の企業を例にとって、EDINETにおける有価証券報告書とそれに相当する米国SECのEDGARシステムにおけるForm 10-Kのタグ付け数を比較してみました。

項目	日立製作所 29年度の有価証券報告書	General Electric　FY2017の10K (Annual Report)
XBRLタグ数の推定 (contextRefタグの数)	773	5,033
参考：資料の期間は一年間。通常のXBRL instance document。日立：H29.06.21 16:31提出、FYE 29年3月31日。GE: 2018-02-23提出、FYE 2017年12月31日。

もちろん、アメリカと日本のXBRLの使い方には違いがあって、上記のような数字の単純比較が妥当とはいえない複雑な面もあります[3]。そもそも、アメリカの電子情報開示の体制は完璧でも何でもなく、ユーザーから批判されている面が多々ありますので、単純にアメリカを見習えばいいというものでもありません。しかし、米国との間でこれほどの差異が生じていることは見過ごすわけにはいかず、EDINETタクソノミの最新版の導入によってもこれが抜本的に改善されるとは思われません。

（イ）日本のXBRLタグ付けの課題

日本のXBRLタグ付けの課題として、2つの点を指摘することができます。

一つ目は、有価証券報告書に頻繁に現れるそれぞれの表の中に記載された個々の数字に個別にXBRLタグが付けられていない点です。専門家によれば、EDINETタクソノミの最新版を導入した後でもXBRLタグが付いていない数字が残りそうだと言います。その原因は、そのような表自体が統一された書式として用意されたものではないため、XBRLタグを付けることができないからだと思われます。

二つ目は、主に非財務情報に関して、大きなテキストブロック全体にしかXBRLタグが付いておらず、それを構成する小項目にはXBRLタグがないことです。例えば、今の有価証券報告書の「事業リスク」を説明するテキストにはXBRLタグが一つしかありませんが、もしその中でパラグラフを分けて「サイバーセキュリティに関するリスク」といったように各リスクの詳細タグがあれば、AIは、何ページもの長い文書（テキスト）を分解するためのアルゴリズムをプログラミングすることなく、ユーザーが欲しい情報に直行することができます。

この点、TDnetで開示されているコーポレートガバナンス報告書では、いわゆる“コンプライ・オア・エクスプレイン”の原則に従ってコーポレートガバナンス・コードの遵守状況が記載されることになっており、その記載要領のでは、説明すべきコーポレートガバナンス・コードの11の原則が特定されています。しかし、コーポレートガバナンス報告書では、これら11の別々の原則を記載すべき欄について、全体として一つのXBRLタグしか付けられていません。11の原則は別々に特定されているわけですから、そのそれぞれにXBRLタグを付けることは容易であり、通常のやり方で何の支障もないはずです。この十把一絡げの対応はあまりにも杜撰であると言わざるを得ません。[4]

AIは膨大なデータの中から必要な情報の探索・分析をすることのできる潜在的な能力を有していますが、十分に詳細なXBRLタグ付けが行われていないと、単に分析に必要な特定の情報だけを取り出すのに時間がかかるだけではなく、様々な不都合が生じます。実効的AI活用に適したデータベース[5]を構築する上で不可欠であるcategorization（データをカテゴリに分類する）及びnormalization（正規化）の作業[6]が難しくなり、一定程度抜け（エラー）が出ることも含めて考えれば、結果としてAIの実効性が減ってしまいます。特に叙述的な文章のデータの場合、かかるコストも時間も増えます。AIには、何千もの上場会社の何年分もの情報を比較・処理することが期待されているのですから、詳細なXBRLタグ付けが行われているかどうかで、投資家にとっての“使い勝手”は大きく違ってくるのです（一方で、タグ付けのための書式さえ整えれば、XBRLタグ付け自体には大したコストがかかるわけではありません。）。

（ウ）具体的な解決策

上記で指摘した一つ目の点（表の中の個々の数字のXBRLタグの点）については、有価証券報告書の表などの記載方法を形式面でより統一化することにより、個々の数字に詳細タグ付けを行うことが可能になります。そのためには、AIの時代に向けて有価証券報告書の書式や記載要領のより一層の見直しが必要となります。EDINETタクソノミをより実効的なものにすべく、是非とも、有価証券報告書の書式（表など）や記載要領を全般的に見直して特に数値の記載方法につき形式面の統一化を図って頂きたく、お願い致します。

二つ目の点（大きなテキストブロック全体にしかXBRLタグが付いていないこと）については、形式面を見直すだけでは済みません。先ほど挙げたコーポレートガバナンス報告書の例（コーポレートガバナンス・コードの11の原則）の場合は、既に11の原則が特定されているのですから、その記載欄を分けてそのそれぞれにXBRLタグを付ければ解決します（すぐにも対応して頂きたい。）。しかし、一般的な非財務情報については、企業に文章で自由に説明させる場面が多く、そのままでは詳細なXBRLタグ付けが困難です。そこで、そのような非財務情報についても、できるだけその内容をカテゴライズ化することが必要となります。すなわち、先の「事業リスク」の例で言えば、「サイバーセキュリティに関するリスク」など、そこで記載されるべき典型的な内容をいくつか予め特定し、それぞれについて説明させるようにするのです。企業によっては「該当なし」で片づけられる事項も出てくるでしょうが、それでも構いません。そして最後に「その他」の欄を設けて、カテゴライズ化されていない事項について自由に記載させればよいのです。そしてカテゴライズされた事項毎にXBRL詳細タグを付けます。

また、このようなカテゴライズ化がどうしても難しくXBRLタグ付けができない場合でも、それで諦めるのではなく、AIによる情報探索・整理が容易になるよう記載方法を工夫することを考えるべきです。例えば、記載内容毎に表題を付けさせて、その表題の記載方法を統一すること（例えば【○○】といった形で記載させる。）などが考えられます。同じ内容であれば同じ表題が使用されるように、予想される表題の例を多数挙げておくのが望ましいです。これは、EDINETが【○○】を使った分割を既に（ある程度）実施していることの延長に当たります[7]。

このようにカテゴライズ化したり表題の記載を義務付けたりしたとしても、企業にとって開示書類の作成に当たって特段の不便にはなりません。むしろ、利便性が高い様式・テンプレートであれば、かえって便利になるはずです。

なお、カテゴライズの内容や例示する表題の内容は、時代によって変動するかもしれませんので、随時見直すことも必要になると思われますが、過去に遡っての時系列の比較を効果的に行えるようにするという観点から、あまりころころ変更するのは好ましくなく、変更する場合であっても、同じ内容の名称変更であれば新旧で紐づける仕組みを解析ツールに取り入れるべきですし、廃止するのであれば廃止したことが分かるようにしておくべきだと考えます。

そもそも、日本語は（例えば英語のように単語と単語の間にスペースが存在しないことなど）自然言語処理に適していない言語です。そうであるからこそ、詳細なXBRLタグ付けやそれに代替する手段を講じる必要性・重要性が高いのです。今のAI技術は日々進歩しており、自然言語処理に適していない日本語でもこれまで以上に理解して処理することができるようになっていますが、このような工夫をすることにより、処理・分析のスピードは格段にアップしますし、エラーの数は大幅に減じられます。ESGなどの投資手法では「非財務情報＝主に文章」の分析が不可欠です。「ESG」を唱えるだけで、そのための分析を容易に行うことができる環境を整えないのでは、何の意味もありません。建前だけの実質の伴わない政策と批判されても仕方ありません。AIによる探索を常に意識して、非財務情報のカテゴライズ化や記載要領の見直しを進めて頂ければと思っております。

(3) システム上の対応

上記(2)は、AIによる探索を容易にするための開示書類の内容面での対応を述べましたが、それと同時に以下のようなシステム上の技術的な対応もお願い致します。私自身はコンピュータ・システムの専門家ではありませんので、正確な表現ができていない部分もあるかもしれませんが、今般、専門家に相談し、専門家の目から見た問題点を聞きましたので、それを指摘させて頂くものです。これらを対応することによってAI探索機能は飛躍的に向上するはずです。

（ア）「character html」への移行

有価証券報告書その他EDINETの開示資料の一括XBRLファイルのソースコードには、「エンティティ参照（entity reference html code）の表記」と「文字参照（character reference html code ）の表記」が混ざって使用されています。しかし、エンティティ参照の表記は最新のAI技術に適合していませんので、これらを統一すべく、「character html」への移行を推奨します。こうすれば、AIの作業・処理スピードが上がると同時に、データのエラーの数は減じられるとのことです。

（イ）まとまったiXBRLファイルへの変更

一方、有価証券報告書その他EDINETの開示資料のいわゆるiXBRLのファイルでは、概して「character html」が使用されていますが、多くの場合には一つの資料（ドキュメント）は複数のiXBRLファイルで構成されており、これらを束ねるプロセスを自動化することが簡単でないという問題があります。一つの資料（ドキュメント）毎に一つのまとまったiXBRLファイルとするように変更して頂きたく思います。

（ウ）「スクレイピング」や「クローリング」を可能とするようなデータのオープン化

パソコン上でEDINETを使用して有価証券報告書などの開示書類を見る場合、お気づきのように、特殊なウィンドウが開きます。そして左側に出る目次欄をクリックして初めて開示内容に辿りつきます。AIが開示情報を収集する際、「スクレイピング」や「クローリング」と言われる方法を使用できれば、効率的に情報を収集することができるのですが、現状のシステム設計ですとデータが「スクレイピング」や「クローリング」を行えるようなオープンな状態になっていないため、そのような機能を十分に発揮できません。
対照的に、SECのEDGARは「クローリング」を比較的に容易にできるようになっています。SECの以下ウェブページ、“Accessing EDGAR Data”をご参照下さい。ユーザーはEDGARのデータベースを自動クローリングすることができるようになっております。https://www.sec.gov/edgar/searchedgar/accessing-edgar-data.htm　

（エ）APIの導入

APIとは、アプリケーション・プログラミング・インタフェース（Application Programming Interface）といって、外部にあるデータに対するアクセスを提供するための仕様を意味します。APIを利用すれば、AIによる情報探索・収集・分析は飛躍的に容易になります。米国では早くからAPIの開発が行われ、現在は有料（月額1,774ドル（但し、二番目のユーザーは598ドル））で投資家の利用に供されています。APIを利用すれ場合、ユーザーは以下のような様々なファイルフォーマットで開示資料の提供を受けることができます。

・ASCII / SGML (* .txt or * .fil)

・HTML or Inline XBRL (*. Htm)

・JPEG / GIF (*. Jpg or *. Gif)

・XML (*. Xml)

・XBRL (*. Xml and *. Xsd)

・PDF (*. Pdf)

・PROCESSED XBRL (*. Xml, *. Htm, *. Xlsx, *. Css, *. Js, *. Json, *. Png, *. Zip)

英国でも、Companies Houseはベータ版として同様のAPIを無料で提供しています（こちらのリンクをご参照下さい。https://developer.companieshouse.gov.uk/api/docs/　）。英国の場合、現時点ではほとんどのデータは機械可読ではないPDF形式のファイルである等の問題点があるのですが、FRCとCompanies Houseは明らかにAIの新時代に向けて行動を開始しています。[8]

このような米国や英国のAPIはもちろん完璧なものではないので、全く同じものを真似ることは多分よくないが（むしろ、その欠点から見習うのが得策かもしれません。）、少なくとも、日本でも、このようなAPIの導入についてすぐにでも検討を開始すべきです。日本は、イギリスよりも何年も早く殆どの開示資料をXBRL及びiXBRLのフォーマットにしていたのですから、APIによる提供をイギリスより早い段階で検討することもできたはずです。一刻も早く遅れた時間を取り戻すべきです。

以上、（ア）から（エ）の4つの点を指摘させて頂きました。コンピュータ・システムの専門家ではない私でも、AIによる情報探索・収集・分析のチェインを念頭において専門家に相談すれば、必然的にこのようなシステム上の問題意識に思い至ります。もちろん、開発コストの面やセキュリティ上の問題との折り合いもつけなければならず、直ちに導入が難しいものもあるかもしれませんが、金融庁や日本取引所グループ等では、このようなシステム上の問題についての現状どれほどの検討が行われているでしょうか。私の目からは、AIを想定した十分な取り組みが行われているとは到底思われません。日本だけが世界の先端から取り残されないよう、直ちに検討を開始して頂きたく、お願いする次第です。

(4) 著作権上の問題の解決

開示された企業情報をAIが探索し、比較検討・分析を行うに当たっては、既存の情報をいったん機械可読データとして保存しなければならないところ、その際に情報提供企業の著作権を侵害するのではないかという疑義が生じます。この点に関しては別の機会に私の意見をまとめていますので、添付別紙の内容をご参照下さい。「そもそも企業開示情報は著作物なのか」、「私的使用として許容されないか」、「オープンデータに関する政府の取り組みで解決されないか」等を検討した上で、具体的な提言も行っております。

人によっては、「神経質過ぎる」、「AIによる分析が常識になりつつある現状で、その著作権違反を問う企業など出てこないのではないか」といった感覚をお持ちの方もいるかもしれません。しかし、これが正面から議論されないまま放置されていることは少なからずAIによる情報収集を阻害する要因になっていると感じます。金融庁として是非とも検討して頂きたい事項です。AIの時代は既に到来しているのです。[9]

有価証券報告書とコーポレートガバナンス報告書の関係

有価証券報告書もコーポレートガバナンス報告書も、企業情報を投資家に提供する手段であり、企業と投資家の対話を促進させるためのツールという意味で違いはありません。有価証券報告書にも「コーポレートガバナンスの状況」という項目があり、そこで記載される内容はコーポレートガバナンス報告書で記載される内容と重複します。

思い返してみれば、私がコーポレートガバナンス・コードの制定を提言した際、“コンプライ・オア・エクスプレイン”を行う場として有価証券報告書ではなく（その時点で既に存在していた）コーポレートガバナンス報告書を選択したことには、本質的な理由はありません。一刻も早くコーポレートガバナンス・コードを制定し、“コンプライ・オア・エクスプレイン”してもらえるように、関係各所に受け入れてもらい易い書類としてコーポレートガバナンス報告書を選択したに過ぎません（有価証券報告書に記載するのであれば、法改正が必要となるためです。）。

しかし、私の知人の海外投資家から話を聞くと、多くの者が口を揃えて、「（有価証券報告書と比べて）コーポレートガバナンス報告書はあまり使えない」と言います。人によってはコーポレートガバナンス報告書は全く無価値だと感情的に言う人もいます。例えば、コーポレートガバナンス報告書で開示が義務付けられている項目についても、「曖昧な文言で、短い説明で済ませている企業が多い」、「明らかに方針らしい方針が存在しないのに、存在するかのように書こうとしている」といったコメントを、内外の投資家から耳にします。これは、企業がコーポレートガバナンス報告書を有価証券報告書よりも低く見ていて、そのことを投資家が敏感に感じ取っているからではないでしょうか。実際、有価証券報告書の虚偽記載は金融商品取引法上の刑事罰や課徴金の対象となりますが、コーポレートガバナンス報告書は金融商品取引法の対象ではありません。また、有価証券報告書又はその主要部分は取締役会で決議されますが、コーポレートガバナンス報告書が取締役会で正式に決議されている例は少ないのではないでしょうか。

私の意見としましては、信頼性・信憑性の観点から、コーポレートガバナンス報告書の位置付けを有価証券報告書と同レベルまで押し上げるような施策をご検討頂きたいと思っています。例えば、コーポレートガバナンス報告書を取締役会決議事項にしたり、コーポレートガバナンス報告書の虚偽記載に対する制裁を強化したりすることが考えられます。最終的には有価証券報告書にコーポレートガバナンス報告書を添付させることができれば最も望ましいと考えています。

政策保有株式に関して開示すべき内容

政策保有株式に関しては、先日、コーポレートガバナンス・コードの改訂に関するパブリックコメントとして私の意見を述べたところですので、ここでもその内容を繰り返し述べさせて頂きます。

（以下、引用です。）

我が国では、ガバナンスを空洞化するような「政策保有株式」がまだ高い水準（30％以上）で存在しています[10]。

投資家が企業との間でこれまで以上に深度のある対話を行うためには、個別の銘柄毎に具体的に株式保有の必要性等を議論できるよう、保有株式の状況をこれまで以上に詳細に開示すべきです。すなわち、個別の銘柄毎に以下の3つの事項を開示することを要求したい。

（1）具体的な業務提携契約の有無。

（2）各事業年度において当該投資先企業との取引により得られた売上その他の収入総額が当該投資株式の簿価の金額以上であるか否か。

（3）保有目的が、（あ）継続的な顧客、（い）ポテンシャル顧客、（う）グループ企業、(え)その他、のいずれに該当するか。

上記（2）について少し補足します。投資家の目から見れば、当該政策保有株式を保有することによる投資リスク及び資本コストに見合うだけの利益をあげているのであれば、その保有について一定の合理性があると判断することができます。そうはいっても、全ての銘柄について、そのような利益の額（又はその前提となる売上の額）を開示することは問題も多いと思われます。そこで、何らかの目安を設定し、その目安を超えているかどうかについてだけでも、開示すべきです。私としては、最低でも、投資金額の現在価値である当該投資株式の簿価程度の年間売上（実際の利益はもっと少なくなります。）を得ていることが望ましい[11]と考えますので、上記（2）の通り提案しました。

上記（1）から（3）の事項は、有価証券報告書の中で開示されるのが本来であり、最終的にはそのような法改正が行われることを期待しますが、そうでない場合は、有価証券報告書の開示と同時に他の適切な方法により開示するようCGコードで明記して頂きたい。

終わりに

以上、企業情報の開示・提供のあり方に関して今私がお伝えしたい意見をまとめました。お読み頂き有難うございました。是非とも検討課題として取り上げて頂きたいです。新しい時代に向けて、金融審議会ディスクロージャーワーキング・グループの活動に大いに期待しております。

以上

別紙

企業開示情報の著作権の取扱についての提言

平成30年1月19日

企業開示情報の果たす役割

上場企業のコーポレートガバナンスの強化に関して、機関投資家の受託者責任を定めたスチュワードシップ・コードが制定される一方、企業に対してはコーポレートガバナンス・コードの遵守が求められ、これらが車の両輪となって機能することにより、日本企業の持続的な成長が促されることが期待される。その際に重要となるのが各種の企業開示情報である。多くの企業情報がインターネット上に溢れかえっているデータマイニングの時代において、多数の企業（例えば東証一部上場企業の全社）のデータをいかに的確に把握して効率的に比較・分析・検討するかが投資家にとっての重要な関心事であり、そのような比較検討を容易に行えるような環境を整えることは、コーポレートガバナンスの更なる充実に向けた重要課題と言える。

対象となる企業開示情報

企業開示情報の中でも、国又は国に準じる機関が運営する媒体で公表された公共性のある企業情報は特に重要なものとして位置づけることができる。その筆頭は、金融庁が運営するEDINETで開示される有価証券報告書その他の情報であるが、これ以外にも、例えば環境省が運営するESG対話プラットフォームなど国が主体となって企業情報の開示に関与する場面が増えてきている。この点、最近では、政府によって、いわゆるオープンデータに関する取り組みが進められてきており、「オープンデータ基本指針」（平成29年5月30日）では、公共データの二次利用の積極的な促進などが基本的ルールとされている。民間企業の情報も、国が保有している以上は、このオープンデータの取り組みの範疇で捉えることができる。一方、金融庁設置法の定めに従って金融庁が監督する東京証券取引所が運営するTDnet（適時開示情報伝達システム）における開示情報は、国によるものではないが、国に準じる公共性のある機関によるものであり、オープンデータに準じてこれと同様に扱うべきである。TDnetでは、2006年からコーポレートガバナンス報告書の開示が義務付けられているが、これは正に、投資家にとってのコーポレートガバナンス情報の比較可能性の向上を念頭に置いた施策である。

AIの活用と著作権法上の問題点

これら各種媒体における大量の企業情報を全て人力でチェックして的確に把握することは膨大な労力を要するが、昨今では情報収集及びその後の分析を自動で効率的に行うことのできるAI（人工知能）が開発されるに至っており、その活用が大いに望まれる。ところが、このAIの活用に際して著作権法上の問題が生じる。すなわち、AIが各種情報にアクセスするためには、既存の情報をいったん機械可読データとして保存しなければならないところ、その際に情報提供企業の著作権を侵害するのではないかという疑義が生じるのである。また、AIは企業開示情報のうち特定の情報のみを横断的に収集して比較検討用にまとめる（データパッケージ化する）こともできるが、このような情報の一部の切り取りやデータパッケージ化も著作権法上問題視されるかもしれない。これを法的な観点から分析すると以下の通りとなる。この著作権の問題を解決することは、AIを広く一般的に活用させるために避けて通れない必須の課題である。

(1)　そもそも企業開示情報は著作物として保護される対象か

公開された情報であるからといって、直ちに著作物でなくなるとか、著作権が放棄されるということにはならない。情報自体が「著作物」として認められれば、著作権の問題が生じ得る。この点、著作権法によれば、「著作物」とは思想又は感情を創作的に表現したものであるとされているところ、一般に企業開示情報は企業の状況を事実として伝えるための情報に過ぎないので、そこに創作性が認められることは珍しいかもしれない。しかし、企業開示情報の中には、例えば、自社のコーポレートガバナンスの充実を投資家にアピールするための表現も含まれるであろう。投資家としては、財務上の数字だけではなくそのような文章も比較検討したいと思うであろうし、AIはそのような膨大なテキストのマイニングも行うことができる。裁判においては、著作者の個性が何らかの形で現れていれば著作物たり得るとされており、将来的に公表されるものも含め全て一切の企業開示情報が著作物でないと断言することは到底できない。ちなみに、著作権法上、「憲法その他の法令」や「裁判所の判決」などは著作権の目的にならないと定められているが（同法第13条）、これはそのような「法令」や「判決」も著作物たり得ることを前提に、法律上あえて権利の目的から除外しているのである。同条には「企業開示情報」は掲げられていない。

(2)　私的使用として著作権法上許容されるのではないか

著作権法上、私的使用のための複製は許容されている。投資家自身がAIを使って自ら情報収集するのであれば、その中に著作物が含まれていたとしても、私的使用と見ることができるであろう。しかし、AIは、データの収集、機械可読データへの転換、分類、細分化など様々なことを自動的に行うことが可能であり、これらの技術は普通の個々の一般投資家が自由に使いこなせるものではない。しかも、一言にAIと言っても、いかに効率的に必要な情報を収集するか、収集した情報をいかに整理して様々な観点からの比較検討・検索を可能にするか等、まだまだ発展途上の分野であり、専門家による今後の更なる技術向上やアイデアの発見が期待されるところである。そのためには、民間のAI開発業者による競争原理に委ねるのが最も適している。民間のAI開発業者が、AI技術を駆使して企業開示情報を的確かつ効率的に収集するとともに、アルゴリズムなどのAI手法を駆使して個々の投資家が検索・分析し易いように整理されたデータパッケージとして一般投資家に提供できるようにすれば、このAI開発は飛躍的に発展するであろう。しかし、ここで、著作権の問題が障害となる。近時、書籍をスキャナーで読み取りデータにする「自炊」の代行業が著作権法に違反するとされ、最高裁判所で確定した。一般消費者が私的に使用するためであっても、間に入る業者が「複製」又は「整理」する場合には、著作権法に違反する可能性が生じる。これを踏まえれば、現状では、多くのAI開発業者はこの分野に参入することを躊躇するであろう。

オープンデータに関する政府の取り組みでは解決されないこと

前掲の「オープンデータ基本指針」では、各府省庁が保有するデータは全てオープンデータとして公開することを原則とする旨が定められている。例えばEDINETで見ることのできるデータは金融庁が保有するデータであるからこれに含まれる。前記の通り、オープンデータはその二次利用が積極的に促進されるのであるが、その際の適用ルールとして「政府標準利用規約(第2.0版)」が制定されている。EDINETの利用規約もこの「政府標準利用規約(第2.0版)」に準じて作成されている。そこでは、複製、公衆送信、翻訳・変形等の翻案等、自由に利用できる旨が明記されている一方で、下記のような留保がされている。

記

第三者の権利を侵害しないようにしてください
コンテンツの中には、第三者（国以外の者をいいます。以下同じ。）が著作権その他の権利を有している場合があります。第三者が著作権を有しているコンテンツや、第三者が著作権以外の権利（例：写真における肖像権、パブリシティ権等）を有しているコンテンツについては、特に権利処理済であることが明示されているものを除き、利用者の責任で、当該第三者から利用の許諾を得てください。

これを見れば分かる通り、オープンデータとされた情報については、国が保有する著作権に対する侵害は生じないものの、国以外の第三者（すなわち開示企業）が保有する著作権に対する侵害の問題は何ら解決されないのである。政府のオープンデータに関する取り組みは、企業開示情報の積極的な二次利用を促進するという概念的な出発点として評価できる面はあるが、AI活用に当たって生じる著作権法上の問題は何ら解決されない。

提言

この著作権法上の問題を制度的に解決する方策としては、以下の三つの段階が考えられる。

① 著作権法の改正により解決する（前記のように「法令」や「判決」と同様に権利の目的から除外する）。

② 開示企業が開示情報に係る著作権を放棄する仕組みを作る。

③ 開示企業が開示情報の二次利用に係る著作権の不行使を宣言することのできる仕組みを作る。

オープンデータに関する国の著作権の取扱についても、同様の議論がなされた結果、当面は③の方向で解決が図られていることを考えれば、企業の保有する著作権についても同様に③の解決が適当であろう。具体的には、EDINET等の開示媒体において企業毎に開示情報の二次利用に関する欄を設け、自社の開示情報の中に何らかの著作権が含まれていると認識しており、かつその二次利用を許諾しない企業は、その欄で二次利用を認めない部分を特定してその旨を表明できるようにする。そのような表明のない部分は開示情報の二次利用に係る著作権の不行使を宣言したものとみなすことを開示ルールとして明記する。このようにすることにより、AIが情報を収集する際に、二次利用を許諾しない企業の情報を自動的に排除することが可能になる。記入欄の設け方等は開示媒体の運営者の工夫に委ねるが、ここで重要なのは、著作権の不行使を原則とし、かかる原則に従わない企業に例外的にかつ限定的にその旨を表明させることである。そもそも企業情報の開示は、投資家に見てもらってこれを有効に活用してもらうことを目的とする「使われるための情報開示」なのであるから、開示する企業側の意図としても、AIによる情報収集を拒否する理由は原則としてない筈であり、むしろ歓迎されるべきものである。したがって、二次利用を認めない旨を表明する企業には、該当部分に特に著作権（創作性）が認められると考える根拠を示させる等により、「面倒だから念のため包括的に全部許諾しない」という安易な対応を取る企業が現れないように運用すべきである。

このような取り組みは、金融庁や環境省など企業開示情報を扱う国の各機関で統一的に行うともに、東京証券取引所などの国に準じる公共性のある機関についても同様の取り組みを行うよう指導・監督すべきである。

以上

企業情報の開示・提供のあり方についての意見書のPDF

[1] 「予算が要らない、最大に評価される三本目の矢 ―投資家保護のため、情報開示の枠組みである『コーポレート・ガバナンス・コード』の制定」、ニコラス　ベネシュ、平成25年10月24日、https://bit.ly/2rKL8dK 。

「日本経済の復活のため、コーポレート・ガバナンス・コードの早期制定を」、（ニコラス　ベネシュの日本経済再生本部（金融資本市場・企業統治改革グループ）・金融調査会合同会議へのプレゼン資料、2014年2月6日）、ページ２、https://blog.bdti.or.jp/wp-content/uploads/2021/05/日本経済再生本部―Benesプレゼン資料-2-6-2014-1.pdf　　。

[2] 私は、開示情報の収集、比較及び分析の重要性について、先日、コーポレートガバナンス・コードの改訂に関するパブリックコメントとして以下のような意見を述べたところです。

「CGコードは、各企業のガバナンス体制及び具体的なプラクティスの開示を要求し、投資家がこうした情報の比較分析を容易にできるようにすることによってスチュワードシップを効率的に機能させるという明確な目的のもとに提案されました。これは株主が企業との間で建設的な対話を行うために必要不可欠なものであり、現に、CGコードでは開示の充実に向けた多くの原則が設けられました。ところが、実際には、こうした目的はほとんど達成されていません。これは、各企業のCG報告書内の情報の収集、比較及び分析が容易でないことに起因しています。日本のCGコードの各原則は、英米のコード（又は上場基準）と比較すると、相当程度曖昧な内容になっていますので（これは日本では監査役会設置会社、監査等委員会設置会社及び指名委員会等設置会社の3つのガバナンス体制を選択できることにも由来しています。）、単に「CGコードに従っています」というだけでは、当該企業において実際にどのようなプラクティスが行われているのかを把握することは困難です。そこで、個々の項目毎に具体的に何が行われているのかを開示させ、その内容を企業間で比較及び分析することが極めて重要になります。そうすることにより、初めて、いかなるガバナンス体制やプラクティスが企業業績と相関関係があるのか、また、どの企業の取り組みが優れていて、どの企業の取り組みが不十分なのかを知ることができ、投資家と企業との建設的な対話にも繋がります。そのような企業間の比較及び分析がなされないとすれば、企業において「ベスト・プラクティス」を追求する（より良いコーポレート・ガバナンスを志向する）インセンティブがなくなり、ゆくゆくはコーポレート・ガバナンス自体が衰退していくことにもなりかねません。

もともとこのような企業間の比較分析を想定してCGコードを政府に提案した私としては、このようにCG報告書内の情報の収集、比較及び分析を容易に行うことのできない現状は残念でなりません。」（https://blog.bdti.or.jp/2018/04/27/cgcpubcombenes/　をご参照ください。）

[3] 日本は米国より叙述的な文章による開示データ（「テキスト」）が中心である非財務情報のXBRLのタグ付けをある程度進めてきました。それに対して米国は財務情報についてより多くの詳細タグを用いているようです。米国は自然言語処理がよりやりやすい英語圏としての存在から生じる安心感があるのか、非財務情報の文書情報を特定するタグは日本ほどありません。英国の場合には、最近より文章のタグをつける方針を打ち出しています。つまり日本はいい方向に行っていますが、先端で走るのに頑張らなければなりません。( “XBRL Tagging Guide – FRC Taxonomies”, Financial Reporting Council, December 2017,　https://www.frc.org.uk/getattachment/14a2c050-f5cb-4b29-8db9-7e94665fa7fe/Tagging-Guide-FRC-Taxonomies-December-2017.pdf をご参照ください。)

[4] また、上記のこととは別に、XBRLのコーポレートガバナンス報告書をエクセルにコンバートすると、一つのセルに先頭の約 1,024 文字のみが表示されるので、11項目の合計文字が1,024 文字を超えると、その後の開示情報（文章）は読めなくなって、保存できません。

[5] A “data bank”.

[6] とても複雑な分野ですが、以下のURLをご参照すれば、これらの作業の重要性を確認できます。

https://deeplearning4j.org/ja/troubleshootingneuralnets#regularization
http://www.kogures.com/hitoshi/webtext/db-seikika/
https://persol-tech-s.co.jp/hatalabo/it_engineer/365.html
https://deepage.net/features/numpy-normalize.html
http://karoten512.hatenablog.com/entry/2017/11/18/193332

[7] https://www.fsa.go.jp/search/20130321/2b_1.pdf　、ページ12：「インライン XBRL ファイル分割時の注意」、https://www.fsa.go.jp/search/20130321/2b_1.pdf　、ページ19：「目次項目のレベル」をご参照ください。

[8] “XBRL Tagging Guide – FRC Taxonomies”, Finanical Reporting Council, December, 2017, https://www.frc.org.uk/getattachment/14a2c050-f5cb-4b29-8db9-7e94665fa7fe/Tagging-Guide-FRC-Taxonomies-December-2017.pdf をご参照ください。また “XBRL: Deep-dive – Digital future of corporate reporting”, FRC, December 2017, page 19: “This report on XBRL is the first of a series of technology deep-dives. The next report will focus on Blockchain. Anyone who is interested in discussing AI, AR and VR for production, distribution or consumption of corporate reporting, should contact the Lab:　financialreportinglab@frc.org.uk . Once all the relevant technologies have been reviewed, we will pull together the key learnings from each report to create a vision for the future corporate communication process.” https://www.frc.org.uk/getattachment/9279091c-a4e9-4389-bdd6-d8dc5563b14a/DigFutureXBRLDec.pdf　.

[9] 米国のSECは明らかにこの視点を持っています。SEC Keynote Address, “The Role of Machine Readability in an AI World” , Scott W. Bauguess, Deputy Chief Economist and Deputy Director, Division of Economic and Risk Analysis, SEC, at Financial Information Management (FIMA) Conference 2018, May 3, 2018, https://www.sec.gov/news/speech/speech-bauguess-050318。”To be sure, electronic access is a necessary component of machine readability. But it is an insufficient condition. For advanced machine learning algorithms to generate unique insights, there must be structure to the information being read.”

[10] ”Allegiant Shareholders in Japan”, by Dr. Ryoko Ueda and Ken Hokugo, Governance, July 16 #265, p.7-8、https://bit.ly/2Ffs3UD　。

[11] 日本の平均売上総利益率は15-30%であり50-60%を超えることは稀なので、殆どの場合には投資株式の簿価の金額以上の売上がなければ純利益貢献が当該他社の少数（零細）持ち分を保有するリスク及び資本コストに見合うことはない（確率はゼロに等しい）と考えられます。

取締役、役員、投資家など、誰でも投稿できる！

金融審議会ディスクロージャーWGに係る意見 (ニコラス・ベネシュ）

企業情報の開示・提供のあり方についての意見書

ニコラス　ベネシュ(個人として)
平成30年5月18日

別紙

企業開示情報の著作権の取扱についての提言

平成30年1月19日

コメントを残すコメントをキャンセル

企業情報の開示・提供のあり方についての意見書

ニコラス ベネシュ(個人として) 平成30年5月18日

別紙

企業開示情報の著作権の取扱についての提言

平成30年1月19日

コメントを残す コメントをキャンセル

ログイン

ニコラス　ベネシュ(個人として)
平成30年5月18日

コメントを残すコメントをキャンセル