この一週間ほど、記事にしようかどうかをずっと迷いながら、何度か色々な形で繰り返し試してみました。
今回記事にしたのは、自分なりの使い方が見えてきたからです。
IMAKITA Document Squeezer って
イマキタさんが作ったのかと思っていましたが、違ったようです。
ネットで、「今北産業」と目にするので、そこから来たようです。
「今北産業」は、ネットで使われる俗語らしく「今来たので、これまでの流れを三行で説明して」→「今来た三行で」→「今北産業」ということのようです。
知っている方には、何を今更ですが、知らない人も多いのではないかと思いますので、先程知ったばかりですが、説明させてもらいました。
ということで、「長い文章を3行程度に圧縮するサービス」ということです。
IMAKITA エンジンの特徴
厳密には、要約と言うよりも Buzzword(バズワード:日本語と英語で違ったり、色々な意味合いがあるようですが、ここでは、「頻度の高い単語」で良いと思います)を、AIが長文から選出して、文章全体の中で特に重要度の高いセンテンスを、指定された行数で選出するシステムのようです。
要約できる文章は、日本語、中国語、英語、スペイン語、ドイツ語、フランス語、ポルトガル語、イタリア語になり、日本語は、「。」「!」「?」で、中国語は「。」、それ以外は、「.」で、区切りとしています。
なお、具合によって、サーバーエラーで「503」が出るようですが、フォームの再投稿で大半は解決するとのことです。
使い方
- https://www.qhapaq.org/imakita/ にアクセスします。
- 行数などを指定します(デフォルト5行になっています)。
- テキストボックスに文章を入れます。
- Squeezeボタンを押して、文書量によりますが少し待ちます。
- 「Summary of the Document」欄に、要約(Buzzwordを考慮して選出した文章)が表示されます。
使用上の注意
- 無保証
- 文章が長すぎると落ちる
- 日本語、英語以外の言語は動作チェックのみ
要約結果について
まずは、開発者自身で上手くできた例を挙げていますので、以下をご覧ください。
DeepMind社が出したAlphaZeroの論文
https://deepmind.com/blog/alphazero-shedding-new-light-grand-games-chess-shogi-and-go/
英語なので、要約された英語文をGoogleさんに翻訳してもらいました。
AlphaZeroは、チェス、将棋、Goのゲームに、3つのゲームすべてで同じアルゴリズムとネットワークアーキテクチャを使用して適用します。
チェスでは、AlphaZeroはわずか4時間(300,000ステップ)後に初めてStockfishを上回りました。 将棋では、AlphaZeroが2時間後にElmoを上回りました(110,000歩)。 GoではAlphaZeroがAlphaGo Lee(9)よりも30時間後(74,000ステップ)パフォーマンスが優れていました。
Goでは、AlphaZeroがAlphaGo Zero(9)を打ち負かし、ゲームの61%を獲得しました。
チェスでは、AlphaZeroがStockfishを打ち負かし、155試合で勝利し、1,000試合で6試合を失った(Fig。
将棋では、AlphaZeroがElmoを破り、98勝を達成しました。
AlphaZeroの論文→文章要約エンジンIMAKITAで要約→Googleで翻訳
なお、開発者の方も論文、演説、ニュースあたりが得意なようだと言っていますので、実際に試してみます。
独自に試した
ストーリーは苦手かも
小説をためしましたが、Buzzwordを選出して、重要なセンテンスを選ぶという行為には、なじまないようです。
つまり、頻度の高い単語が重要になるという考え方では、小説のストーリーは要約できないでしょう。
当然ですよね…小説を要約したら面白くもなんともありません。
誰もが知っている有名な「あの小説」や「この小説」を、いままで読んだことがないので、いまさら読む気もしません。
そこで、要約できたらいいなと思って試してみたのですが、そんなに甘くはありませんでした。
暗喩や皮肉も難しいかも
ある事柄について、著者の考えを文章にまとめているような記事の場合、皮肉的なことも含まれることがあります。
はっきり言わない暗黙的な何かは、Buzzwordを選出できないので、スルーしてしまいます。
ですので、表の部分だけがまとめられた内容になっていました。
まあ、人間でもわからない人はいますから…
事実記載、説明などは得意かも
ニュースについては、開発者の方も言われているように、それなりに上手く要約できていたと思います。
ライブドアニュースで「ざっくり言うと」として、各ニュースを3行に要約してあるのですが、そこでいくつかを比較してみました。
同じような要約には、なりませんでしたが、ある程度納得できる結果でした。
もちろん、選んだニュースによっては、全然違う結果も有りえますので、気になった方は、実際に試してみることをオススメします。
なお、今後は、論文、演説あたりの長文の要約に使ってみたいと思います。
まとめ
IMAKITA Document Squeezer 長い文章を3行程度に圧縮するサービス
IMAKITA エンジンの特徴
Buzzwordを、AIが長文から選出して、文章全体の中で特に重要度の高いセンテンスを、指定された行数で選出するシステム
利用方法は
IMAKITA Document Squeezerにアクセスし、テキストボックスに文章を入れ、Squeezeボタンを押すだけです。
開発者の方は、論文、演説、ニュースあたりが得意なようだと言っています。
コメント