長文を「AI」が3行程度に要約?してくれる『IMAKITA』

この一週間ほど、記事にしようかどうかをずっと迷いながら、何度か色々な形で繰り返し試してみました。

今回記事にしたのは、自分なりの使い方が見えてきたからです。

IMAKITA Document Squeezer って

イマキタさんが作ったのかと思っていましたが、違ったようです。

ネットで、「今北産業」と目にするので、そこから来たようです。

「今北産業」は、ネットで使われる俗語らしく「今来たので、これまでの流れを三行で説明して」→「今来た三行で」→「今北産業」ということのようです。

知っている方には、何を今更ですが、知らない人も多いのではないかと思いますので、先程知ったばかりですが、説明させてもらいました。

ということで、「長い文章を3行程度に圧縮するサービス」ということです。

IMAKITA エンジンの特徴

厳密には、要約と言うよりも Buzzword(バズワード:日本語と英語で違ったり、色々な意味合いがあるようですが、ここでは、「頻度の高い単語」で良いと思います)を、AIが長文から選出して、文章全体の中で特に重要度の高いセンテンスを、指定された行数で選出するシステムのようです。

要約できる文章は、日本語、中国語、英語、スペイン語、ドイツ語、フランス語、ポルトガル語、イタリア語になり、日本語は、「。」「!」「?」で、中国語は「。」、それ以外は、「.」で、区切りとしています。

なお、具合によって、サーバーエラーで「503」が出るようですが、フォームの再投稿で大半は解決するとのことです。

使い方

  1. https://www.qhapaq.org/imakita/ にアクセスします。
  2. 行数などを指定します(デフォルト5行になっています)。
  3. テキストボックスに文章を入れます。
  4. Squeezeボタンを押して、文書量によりますが少し待ちます。
  5. 「Summary of the Document」欄に、要約(Buzzwordを考慮して選出した文章)が表示されます。

使用上の注意

  • 無保証
  • 文章が長すぎると落ちる
  • 日本語、英語以外の言語は動作チェックのみ

要約結果について

まずは、開発者自身で上手くできた例を挙げていますので、以下をご覧ください。

DeepMind社が出したAlphaZeroの論文

https://deepmind.com/blog/alphazero-shedding-new-light-grand-games-chess-shogi-and-go/

英語なので、要約された英語文をGoogleさんに翻訳してもらいました。

AlphaZeroは、チェス、将棋、Goのゲームに、3つのゲームすべてで同じアルゴリズムとネットワークアーキテクチャを使用して適用します。

チェスでは、AlphaZeroはわずか4時間(300,000ステップ)後に初めてStockfishを上回りました。 将棋では、AlphaZeroが2時間後にElmoを上回りました(110,000歩)。 GoではAlphaZeroがAlphaGo Lee(9)よりも30時間後(74,000ステップ)パフォーマンスが優れていました。

Goでは、AlphaZeroがAlphaGo Zero(9)を打ち負かし、ゲームの61%を獲得しました。

チェスでは、AlphaZeroがStockfishを打ち負かし、155試合で勝利し、1,000試合で6試合を失った(Fig。

将棋では、AlphaZeroがElmoを破り、98勝を達成しました。

AlphaZeroの論文→文章要約エンジンIMAKITAで要約→Googleで翻訳

なお、開発者の方も論文、演説、ニュースあたりが得意なようだと言っていますので、実際に試してみます。

独自に試した

ストーリーは苦手かも

小説をためしましたが、Buzzwordを選出して、重要なセンテンスを選ぶという行為には、なじまないようです。

つまり、頻度の高い単語が重要になるという考え方では、小説のストーリーは要約できないでしょう。

当然ですよね…小説を要約したら面白くもなんともありません。

誰もが知っている有名な「あの小説」や「この小説」を、いままで読んだことがないので、いまさら読む気もしません。

そこで、要約できたらいいなと思って試してみたのですが、そんなに甘くはありませんでした。

暗喩や皮肉も難しいかも

ある事柄について、著者の考えを文章にまとめているような記事の場合、皮肉的なことも含まれることがあります。

はっきり言わない暗黙的な何かは、Buzzwordを選出できないので、スルーしてしまいます。

ですので、表の部分だけがまとめられた内容になっていました。

まあ、人間でもわからない人はいますから…

事実記載、説明などは得意かも

ニュースについては、開発者の方も言われているように、それなりに上手く要約できていたと思います。

http://news.livedoor.com/

ライブドアニュースで「ざっくり言うと」として、各ニュースを3行に要約してあるのですが、そこでいくつかを比較してみました。

同じような要約には、なりませんでしたが、ある程度納得できる結果でした。

もちろん、選んだニュースによっては、全然違う結果も有りえますので、気になった方は、実際に試してみることをオススメします。

なお、今後は、論文、演説あたりの長文の要約に使ってみたいと思います。

まとめ

IMAKITA Document Squeezer 長い文章を3行程度に圧縮するサービス

IMAKITA エンジンの特徴

Buzzwordを、AIが長文から選出して、文章全体の中で特に重要度の高いセンテンスを、指定された行数で選出するシステム

利用方法は

IMAKITA Document Squeezerにアクセスし、テキストボックスに文章を入れ、Squeezeボタンを押すだけです。

開発者の方は、論文、演説、ニュースあたりが得意なようだと言っています。

シェアする

フォローする