白書: インフォプロと人工知能

はじめに

「思考機械」や人工知能が話題になり始めた当初、一部のマスコミの反応は懐疑的だった。ビクター・フランケンシュタインのモンスターや、映画『2001年宇宙の旅』の宇宙船に搭載されたコンピューター「HAL 9000」は、善良な市民ではなく、使いやすいテクノロジーでもなかった。これら二つの例は、人間の思考プロセスと意思決定を模倣して魂のない絶大な力をもつ創造物を生み出すことの、威力と危険性の両方を示している。


今日、機械学習の進歩とビッグデータの登場、コンピューター性能の飛躍的な向上に伴い、職場と家庭の両方に人工知能(AI)が入り込んできている。工場の現場では協働ロボット、いわゆる「コボット」が人間と共に働き、部品を届け、反復作業や危険な作業を行っている。NetflixやAmazon、Pandoraは、顧客にパーソナライズしたおすすめを提示するために、ユーザーの行動を監視している。スマートホームデバイスを利用すれば、じゅうたんに掃除機を掛けたり、庭土の水分をチェックしたり、少なくなってきた洗剤を追加注文したり、冷蔵庫の中にある賞味期限切れの食べ物をチェックしたりすることもできる。

図書館とAI


今のところ、主流のAIアプリケーションの多くは、賢い人間ができるようなことを、より安く、より効率的にこなしている。しかし情報プロフェッショナルや、テレビのゲーム番組の熱心な視聴者たちは、Watson(自然言語クエリーが処理できるIBMの質問応答システム)が2011年にクイズ番組『Jeopardy!』で二人のチャンピオンに圧勝する様子を目撃して以来、いつレファレンスデスクが絶大な力を持つコンピューターに乗っ取られる日が来るのかと、考えるようになった。


IBMのWatson Healthはクイズ王からさらに進化し、シュプリンガー・ネイチャーのゲノム研究に関するコンテンツにさらに深い洞察をもたらしている。(*)この提携により、当社の主要5タイトルのフルテキストがWatson Healthに統合され、関連情報の発見可能性が向上する。Watsonは、個々のクエリーや、各ユーザーが情報を検索する際のナビゲーションを分析・学習することで、主要な概念とそれぞれのやり取りの関係について理解を深める。シュプリンガー・ネイチャーは、AIを利用して文献から抗体使用データを抽出するディスカバリー・プラットフォームのBenchSci.comとも提携している。コンテンツプロバイダーや出版社が自然言語処理や機械学習などのツールに精通するようになれば、検索機能を強化するこのような提携に対して、インフォプロたちの期待もさらに高まるだろう。


図書館でも、顧客対応業務と裏方業務の両方で人工知能の影響が現れはじめている。図書館のウェブサイトに、質問に対して(利用)案内ができるチャットボットを導入すれば、利用者に図書の返却日を知らせたり、関連する図書館のリソースを提案したりするほか、簡単な情報のリクエストにも応じることができる。チャットボットの対応は、きめ細かなレファレンスデスクの代わりになることはあり得ないが、このような知的アシスタントを利用すれば、図書館員がよくある日常の質問に答える必要性を減らし、例外的、または困難なリクエストを情報プロフェッショナルに直接まわすことができる。


機械学習や音声・画像認識テクノロジーは、デジタルコレクション(テキスト、画像、音声、およびデータセット)を解析して、トピックと対象物を特定し、メタデータを割り当て、テキスト以外の検索と発見を実行するために利用されている。インフォプロが機械学習を応用すれば、分類体系を強化して検索の再現率と精度の両方を高めることができる。この分野の初期のプロジェクトでは、AIテクノロジーを歴史的画像コレクションに応用し、見出し語を統一したり、説明文から名称や日付、場所を抽出したりするほか、視覚パターン認識を利用して類似画像を特定したりする試みも行われている。


インフォプロがSpringer Nature SciGraph Explorer(scigraph.springernature.com)などのデータ可視化ツールを利用すれば、 概念と研究者、研究機関の意外な関連性を特定することもできる。では、このレベルのテキスト分析をAIで強化された図書目録に応用したらどうなるのか。図書館と情報センターは、新たな洞察が得られるようなコンテンツとオープンソースツールへのアクセスを強化することで、その機関のイノベーションと発見をサポートできるようになるだろう。


シュプリンガー・ネイチャーの舞台裏で活躍するAI

シュプリンガー・ネイチャーでは、IBM Watson HealthやSciGraph Explorerなどのよく知られたプロジェクトだけでなく、インフラにもAIを導入し、書誌引用分析ツールで引用文献から構造化されたデータを生成し、クロスレファレンスを通じて出版物の発見可能性を強化している。自然言語処理ツールは、出版物のコーパス全体の解析に基づいて人工的に生成されたキーワードをSpringerLinkの出版物に追加し、関連情報の検索精度を向上する。また当社は英国のThe Open Universityと提携し、データマイニング技術で自動的に生成され、人手を介さずに定期的に更新される、コンピューターサイエンス関連トピックを分類する「Computer Science Ontology」を開発している。これらのツールは人がマニュアルで行うよりも、グローバルな視点でより的確なトレンドを見い出し、より客観的な索引作成と情報検索を行うことができる。

インフォプロの新たな役割

検索エンジンが登場して間もない頃、インフォプロたちはユーザーがワールドワイドウェブの荒野を探検する際の、通訳兼ガイドとしての役割を果たさなければならなかった。そして、利用者のクエリーを強化して絞り込むカスタム検索エンジンを設計して、頻繁に検索されるトピックの研究ガイドを構築し、内部リソースにアクセスするための検索ツールを開発した。


今日もインフォプロたちは、単にアクセス数の多いウェブサイトの開発をめざすのではなく、最良の答えを見つけ出すという図書館本来の理念を軸にして、新しい知識発見ツールの設計に携わっている。広告付きのサーチエンジンは、ユーザーの活動を追跡・収益化する金銭的なインセンティブがあるだけではなく、情報を脱文脈化してその正確性と信頼性を判断する手掛かりを切り離し、ウェブサイトの深淵から単一のページを浮かび上がらせる傾向がある。


カスタムサーチエンジンを構築し、LibGuidesを開発した実績があることから、インフォプロたちがAIを応用した新たな知識発見ツールの設計に携わることもあり得る。最良の情報を提供するというインフォプロのフォーカスを新しいツールに活かすことも可能だ。


アルゴリズム解析による株取引や、コンピューターを応用した医用画像診断など、ハイエンドな環境で利用されることの多いAIだが、どんな規模の情報センターでもそれぞれの組織内で果たすべき役割を見つけ出すことができるだろう。公共図書館はメイカースペースを拡大してバーチャルリアリティーのラボを設置したり、機械学習ツールに関するワークショップを開催したりすることができる。組織内の情報センターはIT部門と協働し、特定のユーザーグループにとって有用なオープンソースのデータセットやテキスト・データマイニングツールを識別し、そのキュレーションを行うことができる。


最近、ロード・アイランド大学が図書館内にAIラボを開設し、学生や教職員、研究者を対象に、データマイニングやロボット工学、機械学習と関連テクノロジーのほか、それらのテクノロジーが持つ倫理的な意味について学習する機会を提供している。同様のモデルは組織の規模に応じて、さまざまな図書館の環境に応用することができる。


オンラインカタログや統合図書館システムに、レコメンドシステムのアルゴリズムを組み込めば、図書館リソースの発見可能性を強化することも可能だ。小規模な情報センターや図書館員も、AIの概念やアプリケーションをユーザーに提供することができる。まずは内部向けのブログやウェブページを作成し、顧客に関心を持ってもらえそうなAI関連の記事やビデオのリンクを掲載するのも良いだろう。TED Talksだけでも人工知能に関するトピックが約300もあり、これ以外にもポッドキャストやオンラインコースなど、専門外の人たちを対象にしたリソースが数多く存在する。「AI For Everyone(みんなのAI)」や「Machine Learning 101(機械学習入門)」など、探究心を刺激するようなテーマで気軽な昼食会やVR会議を行うこともできる。  無料または低料金のIBM Watson Assistantを利用して図書館のチャットボットを開発し、比較的易しいAI導入例のデモンストレーションをすることも可能だ。


情報源を評価することはインフォプロの重要なスキルである。図書館の蔵書のためにリソースを選び、ユーザーに最良の費用対効果をもたらしてくれるデジタルコンテンツを購読することと同様に、インフォプロは研究グループと協力し、機械学習やビッグデータのプロジェクトに最適なデータセットを選定することができる。情報源やリソースの質を評価するテクノロジーに精通しているインフォプロならば、使われているデータがその意図に則って正確に現実の世界に反映されるようにできるはずだ。インフォプロは、どのようにしてデータセットがつくられ、データが収集されたのか、どこにバイアスが潜んでいるのか、そして、もっと新しいデータセットが入手可能かどうかに注目する。


インフォプロは、AIテクノロジーをデジタルコレクションに導入する戦略的なポテンシャルを評価することができる。たとえば、国勢調査データや歴史的価値のある手書き原稿、ニュース記事、公文書などの歴史的コンテンツは、テキスト・データマイニングツールを応用した新しい方法で分析すれば、これまで知られていなかった文化や社会、歴史のトレンドを浮き彫りにできるだろう。地理的な位置情報を追加し、固有名詞を特定し、時間的な相関関係を識別するための日付設定ができる検索ツールを応用すれば、既存のコレクションを強化する機会を見出すことができる。


AIプロジェクトを立ち上げる際、インフォプロはユーザーのプライバシーとセキュリティーの問題に関する組織内のディスカッションをリードすることもできる。いまやAmazon Echoなどの家庭用スマートスピーカーで録音された内容が殺人事件を解決するための捜査対象になり、個人データの閲覧や利用に関する懸念は単に理論的なものではない。EUの一般データ保護規則(General Data Protection Regulation: GDPR)が制定され、他の地域でもプライバシーに関する規則が計画・制定されるようになると、個人データに対する意識が高まり、どんな情報が収集され、その情報が何に使われるのかに関心が集まるようになった。組織内の情報の流れを独自の視点で観察できるインフォプロならば、AIアプリケーションに使われているデータセット内の個人情報の保護を提唱することができる。

「AIに関してインフォプロが持つ最大のインパクトは、AIの開発、具体的には開発を行う人たちに影響をおよぼすことであり、命令行やアルゴリズムとは無関係な2つの分野、すなわち倫理と理念をもってそれを行うことができる」

Daniel Lee( ARC Business Solutions社の起業情報ソリューションズ担当ディレクター )

今後の展望

真の意味で革新的なテクノロジーに共通して言えるのは、「AIはどのようにして我々の仕事のやり方を改善してくれるのか」という問いかけが的外れということだ。ウェブが最初に登場したとき、Eコマースがホワイトカラーの職業にどのようなインパクトを与えるかを予測できた人はほとんどなかった。ウェブサイトによって中間業者の排除が可能になると、旅行代理店や不動産業者、保険代理店などの職業が破壊的な影響を受け、日常の会計業務や法務までもクラウドベースのサービスで行えるようになった。電子ブックとその他のデジタルコンテンツの普及は、規模の大小や公共・民間の違いに関係なく、図書館の見た目と機能に劇的な変化をもたらした。


単純なAIツールは、情報プロフェッショナルを解雇せずに既存の図書館業務を支援できる。すぐに参照可能な質問はチャットボットに回答させることで、スタッフを単純業務から解放し、インフォプロには文脈を完全に理解しなければならないような複雑な質問に注力してもらったり、状況に応じて最適なリソースをユーザーに提案・指示してもらったりすることが可能である。


AIが持つ本当のインパクトは既存の図書館業務を改善することではなく、図書館の利用者が思いもよらなかった情報のニーズに応えられるまったく新しい機能を実現することだ。インフォプロは、クライアントが情報についてどのように考え、どのように情報を検索・利用するのかを理解している。AIを組織に導入する機会を捉えることもできる。テキスト・データマイニングツールを内部のデータセットに導入し、既存データから新たな洞察を得られるようプロジェクトチームを支援することができる。また、データ可視化ツールを利用すれば、出版された文献の中からユーザーが意外な関連を見つける手助けをすることも可能だ。


図書館の役割が物理的な蔵書から、情報へのオンラインアクセスを提供することへ変化するのに伴い、図書館はAIツールを利用して情報だけでなく、ディープインテリジェンス、すなわち「サービスとしての洞察」を提供するようになるだろう。


インフォプロはAIの広がりを調査して、サービスのインフラ(IaaS)を提供する準備を行い、ユーザーグループにとってどんなツールが適切かを判断することができる。Nature Machine Intelligenceやシュプリンガー・ネイチャーの電子ブック「Intelligent Technologies and Robotics Collection」などのソースは、人工知能と関連テクノロジーのトレンドについて幅広い視野の情報をもたらしてくれる。非技術者向けのコースは、CourseraやLinkedIn Learning(旧Lynda)などのオンライン学習プラットフォームを通して提供されている。機械学習とAIのパイオニアの一人であるAndrew Ng氏もCourseraで「AI for Everyone(みんなのAI)」というタイトルの非専門家向けコースを提供している。(coursera.org/learn/ai-for-everyone)


インフォプロは組織内で情報がどのように流れているのかを観察・調査する練習を行い、まったく新しい方法で情報を変換、または利用可能なことを特定することができる。図書館には高度なAIツールやリソースに費やす予算がなかったとしても、インフォプロは必要なテクノロジーやデータセットに投資できるようなプロジェクトチームやグループと連係することが可能だ。図書館が維持するAIラボの例として、オープンソースのAIプラットフォーム、精選されたオープンアクセスデータセットのコレクション、既にAIイニシアティブに関与している組織内のグループへのリンクなどが挙げられる。


これまでに複雑なBoolen Search(ブール検索)クエリーを構成する技術を磨き、情報源を管理するために少なくともHTMLコーディングの知識を伝えてきたように、現在、インフォプロたちはPythonなどのスクリプト言語や、Tableauなどのデータ可視化ツール、IBM Watson Assistantなどのチャットボット開発プラットフォームに精通するようになった。


多くの人たちにとって人工知能は日常の図書館業務とかけ離れた存在のようにみえるが、その潜在的なインパクトを理解することで、インフォプロたちがAIに関する対話を促進し、組織内の情報の価値を高めるのを助けることができるだろう。

Springer Nature の 人工知能・AI関連コンテンツ

Intelligent Technology and Robotics

イーブック・コレクション

P_Intelligent Technology & Robotics Cover_2019_JP_S

Nature Machine Intelligence

オンラインジャーナル

Nature Machine Intelligence