Text and Data Mining at Springer Nature

シュプリンガーネイチャーのテキストデータマイニング

シュプリンガーネイチャーのTDMポリシー

シュプリンガーネイチャーは、新たな研究技法の重要性を認識し、イノベーションのサポートを目標としています。私たちは科学系出版物の増加とTDMソフトウェアツールの進歩に伴い、TDMを可能にするための、より形式化されたプロセスが必要となることを十分理解しており、研究者のため可能な限り単純化するよう日々努力を重ねています。

オープンアクセスで発表されるジャーナル論文は増え続けています。シュプリンガーネイチャーのオープンアクセスコンテンツの多くはCC-byでライセンスされているため、通常こうした出版物には、制約なくTDMを実施することができます。
 

購読コンテンツがある学術機関の研究者向けTDM

シュプリンガーネイチャーでは、購読されている雑誌や書籍には非商用研究目的である限り、所属機関経由で対象研究者にTDM権限を提供しています。

研究者は、購読中(およびオープンアクセス)のジャーナル論文および書籍をTDM目的でシュプリンガーネイチャーのコンテンツ・プラットフォームから直接ダウンロードいただけます。必要な論文の選定には、PubMedやWeb of Scienceのほか、シュプリンガーネイチャーのMetadata APIなど、既存の検索方法やツールを用いて行うことができます。シュプリンガーネイチャーのTDM APIを使用したい場合は、APIキーを依頼できます。APIを使用すると、追加のクエリパラメータとコンテンツリクエストに際し、より高い帯域幅(1分あたり150リクエスト)が提供されます。

研究者は、TDMプロジェクトの期間中、ダウンロードしたコンテンツのセキュリティを保護するため、合理的な手段を用い、コンテンツを安全な内部サーバーに保存し、第三者がアクセスできない状態にする必要があります。

ダウンロードについて十分考慮し、ダウンロードを適切な回数に制限することで、シュプリンガーネイチャーのシステムおよびサーバーに過度の負荷をかけないようご注意ください。
 

学術機関および行政機関向けTDM

購読中の学術機関および行政機関は、シュプリンガーネイチャーの標準TDM条項に従い、追加費用なしで、すべての新規および更新購読契約にTDM権限を含めることができます(シュプリンガーネイチャーの特定のデータベース製品を除く)。既存の購読者も、契約更新時期以前に同じ条項に従い、TDM権限を追加することができます。

シュプリンガーネイチャーのTDM APIを使用する場合は、追加費用が発生します。


企業向けTDM(商用研究目的)

シュプリンガーネイチャーでは、商用研究目的のTDMについて標準TDM条項のほか、TDM APIを有料で提供しています。この場合、非商用研究の制約は適用されません。

企業のお客様による有料のご利用についてはこちらよりお問合せ下さい。

なお、Copyright Clearance Centerではシュプリンガーネイチャーを含む25のSTM出版社発行の出版物を網羅したテキストマイニング・ソリューションを提供しています。

TDM各種サービス

購読者向けTDM

シュプリンガーネイチャーでは、メタデータAPIやフルテキストAPIなど、非常に多彩なTDMツールを購読者に用意しており、オープンアクセスおよび購読中のコンテンツでご使用いただけます。APIに関するページをご覧いただき、ご不明な点がございましたらTDMチーム までお問い合わせください。


非購読者向けTDM

非購読者には、オープンアクセス・フルテキストAPI (https://api.springernature.comを参照)など、オープンアクセスリソースのための多彩なTDMツールを用意しています。有料コンテンツへアクセスする際のTDM要件には適宜対応しています。シュプリンガーネイチャーまでお問合せください。


オープンアクセスコンテンツ用TDM

オープンアクセスコンテンツには、強力なオープンアクセス・フルテキストAPI (https://api.springernature.com)を提供しています。オープンアクセスAPIを通じ、BMC(旧BioMed Central)やSpringerOpenジャーナルなど、シュプリンガーネイチャーのオープンアクセスXMLの500,000件以上のオンライン文書のメタデータやフルテキスト(入手可能な場合)を提供します。

イメージマイニングについて

現在、イメージマイニング向けのAPIは提供しておりません。
 

論証マイニング(argumentation mining)について

“論証マイニングは、テキスト内の論証を自動的に検出、分類、構造化することを目的としています。したがって、論証マイニングは、一連の論証の内容、言語構造、前後の論証の関係、内在する概念的な信条の認識、さらに特定のトピックの包括的な一貫性の下での理解といった、完全な論証分析の重要な要素となります。” (Mochales, R. & Moens, MF. Artif Intell Law (2011) 19: 1. https://doi.org/10.1007/s10506-010-9104-x)

論証マイニングは、テキストマイニングのサブセットと考えることができます。論証マイニングプロジェクトで、非オープンアクセスコンテンツのローカルへの保存をご計画の場合はTDMチームまでお問い合わせください。オプションについてご提示いたします。

TDM ツールおよびメソッド

API

シュプリンガーネイチャーでは、TDM活動を支援するための様々なAPIを用意しています。

  • メタデータAPI:オンラインドキュメントのメタデータおよびアブストラクト(ジャーナル論文、ブックチャプター、プロトコルなど)
  • メタAPI:オンラインドキュメントの新たなバージョンのメタデータ(追加フィールドとソースコンテンツへのリンク付与)
  • オープンアクセスコンテンツ用フルテキストAPI:シュプリンガーネイチャーオープンアクセスXMLで提供されているフルテキスト・コンテンツ
  • オープンアクセスコンテンツおよび有料コンテンツ用フルテキストAPI(要ライセンス):すべてのシュプリンガーネイチャー XMLで提供されているフルテキスト・コンテンツ
  • ジャーナル・ヘッダ・データAPI:ジャーナルIDに基づくXMLを提供する「ジャーナルレベル」のAPI
  • 引用API(Citations API)


APIの詳細、サンプル、APIキーのサインアップの方法などについては、下記をご覧ください:
https://api.springernature.com.

メタデータ・デリバリー

シュプリンガーネイチャーでは、JATS、Dublin Core、ONIX、MARCレコードなどの様々なフォーマットで、メタデータ・ハーベスティング(OAI-PMH)を含む、様々なプロトコル(ftp/ftps、sftp)を用いて直接メタデータを配信するオプションもご用意しています。

メタデータ・ダウンローダを介して直接メタデータをダウンロードすることもできます。ダウンロードの際は以下へアクセスしてください:
metadata.springernature.com
メタデータの配信に関するご要望は、DDSサポートチームまでご連絡ください。

Crossref TDM サービス

crossref

シュプリンガーネイチャーは、Crossref TDMワーキンググループに参加しており、全出版社のTDMを対象としたCrossrefサービスを推奨しています。

詳細については、 http://tdmsupport.crossref.org/ をご覧ください。

用語集

TDM
テキストデータマイニング

TDM(Text and Data Mining)は、大量のテキストやデータリソースを検索、パターンの検出、関連性の発見、意味解析、コンテンツとアイデアやニーズとの関連性を学習するなどの目的で選択・分析し、調査・研究などに必要な価値ある情報を提供する自動プロセスです。

Argumentation mining
論証マイニング

“論証マイニングは、テキスト内の論証を自動的に検出、分類、構造化することを目的としています。したがって、論証マイニングは、一連の論証の内容、言語構造、前後の論証の関係、内在する概念的な信条の認識、さらに特定のトピックの包括的な一貫性の下での理解といった、完全な論証分析の重要な要素となります。” (Mochales, R. & Moens, MF. Artif Intell Law (2011) 19: 1. https://doi.org/10.1007/s10506-010-9104-x)

XML parsing
XML解析

"XML構文解析とは、XML文書を読み取り、その文書にアクセスするためのインターフェースをユーザーのアプリケーションに提供するプロセスです。"  (Li C. (2009) XML Parsing, SAX/DOM. In: LIU L., ÖZSU M.T. (eds) Encyclopedia of Database Systems. Springer, Boston, MA. https://doi.org/10.1007/978-0-387-39940-9)

API

“APIはアプリケーション・プログラミング・インターフェイスの略語です。APIは、ビジネスサービスや企業資産をアプリケーション開発者に公開し、利用できるようにします。アプリケーションは、スマートフォン、タブレット端末、キオスク端末、ゲーム機、コネクテッドカーなど、様々なデバイスにインストールしてアクセスすることができます。APIの例として、地図上で所定の場所を探すためのGoogle Maps API、ゲームやコンテンツ共有のためのFacebook API、製品情報を提供するAmazon APIなどがあります。開発者は、これらのAPIを使用して、優れたユーザー体験を提供できる革新的なアプリを構築することができます。例えば、異なる旅行会社のAPIを利用して、同じホテルにおける各旅行会社の価格を比較し表示するアプリの構築が可能です。ユーザーは、十分な情報を得たうえで判断し、もっとも良い提案をした会社を通じてホテルを予約できます。ユーザーは、自分で比較する手間を省くことができ、全体的なエクスペリエンスを向上させることができます。このようにAPIは優れたユーザーエクスペリエンスの提供に貢献します。"(De B. (2017) API Management. Apress, Berkeley, CA.  https://doi.org/10.1007/978-1-4842-1305-6)

API key
APIキー 

“APIキーは、APIを使用するアプリケーションを識別し、アプリを認証するシンプルなメカニズムを提供します。APIキーは、APIによりどのアプリケーションがAPIを使用しているかを判別します。APIキーは一般的に、長く連なったランダムな文字であり、通常HTTPクエリパラメータまたはヘッダーとして渡されるため、アプリケーション認証のAPI要求で簡単に使用することができます。APIキーは、アプリID、クライアントID、アプリ・キー、コンシューマ・キーなどの名称でも知られています。” (De B. (2017) API Management. Apress, Berkeley, CA. https://doi.org/10.1007/978-1-4842-1305-6)

XML
拡張マークアップ言語

“XML (Extensible Markup Language) は、ツリー構造を用いてデータをモデル化する標準規格です。ドキュメント構造を定義する規則で構成されており、定義済みの構造と整合性のあるデータを保管できるようになっています。したがって、XMLは、実際のドキュメントがどのように処理されるかについて記述する必要のない、データ構造の定義のためのフレームワークです。” (Lupp M. (2008) Extensible Markup Language. In: Encyclopedia of GIS. Springer, Boston, MA. https://doi.org/10.1007/978-0-387-35973-1)

IE
情報抽出

“IE(Information extraction)は、文書や音声記録から事前に指定したファクトを抽出し、それらを構造化表現(データベースなど)に変換する作業です。” (Ji H. (2009) Information Extraction. In: LIU L., ÖZSU M.T. (eds) Encyclopedia of Database Systems. Springer, Boston, MA. https://doi.org/10.1007/978-0-387-39940-9)

NLP
自然言語処理

“NLP(Natural Language Processing)は、人間の言語の理解と生成のための計算法およびアルゴリズムの開発を目的としています。” (Rus V. (2013) Natural Language Processing. In: Runehov A.L.C., Oviedo L. (eds) Encyclopedia of Sciences and Religions. Springer, Dordrecht. https://doi.org/10.1007/978-1-4020-8265-8)

お問合せ

undefined undefined

TDMに関するお問合せはこちらから。