daily tech

専門分野から最も遠い分野を単語ベクトルから探す

自分の専門分野と全く異なる分野を探している方向け。

発想力を高めるには?

この投稿の背景は、発想力を高めるにはどうればよいかという、昔からある話題を電車で読んでいたことがきっかけです。その記事には自身の専門分野とは全く異なる知識に接し刺激を受けることで発想力が高まる、と述べられていました。これも昔からある内容ですね。引き出しは多いほどチャンスは増えるということです。ただし、引き出しの中身をうまくお互いに結び付ける力も必要だと管理人は考えます。これはまた別の機会に。
さて、全く別の分野を探すにはどうすればよいでしょうか。可能な限り自身の専門と関連がない分野のほうがいいのではないか。管理人はそう考えました。しかし、ここで問題が一つ。自身との関連が遠いほど、その分野には疎いわけで突き詰めると「存在そのものを認知できていない」可能性があります。あるかもわからないのものを認知することはできません。ではどうすればよいか、を今回は考えてみました。

単語ベクトルを利用して専門から遠い分野を探す

簡単な方法 業界地図

まず思いついた方法は、業界地図などの情報をあたることです。書籍化もされているこれらの情報を学生時代の進路の参考や就活時点での情報収集で利用した方も多いと思います。

単語の意味を数値化する単語ベクトル

もちろんこれらの情報を当たるでもよいと思います。しかし、今回の投稿はせっかくなので少し違った角度からアプローチしてみます。それは単語ベクトル(分散表現)の距離で分野間の距離を考えて見るというものです。管理人がお仕事の都合で、自然言語処理をかじっていまして、その関連で思いつきました。単語ベクトル自体の説明は他のサイトの解説にお任せしますが、ざっくりいうと単語の意味をベクトル課して扱うことができます。これにより、例えば「”王”+”女性”=”女王”」といった単語同士を計算させることができます。
この単語ベクトルは、ベクトル化している関係で意味が近い単語同士の距離が小さくなるという性質を持ちます。翻すと、意味が遠い単語ほど距離が多いくなります。これを分野に適用します。すなわち自分の専門分野の単語ベクトルと最も遠い単語ベクトルを持つ単語の分野が、最も関連が遠い異分野とみなせるのではないか、と考えました。

あとがき

今回の理論はあくまで仮説です。単語の集合であるコーパスのデータがよくなければ、まともな結果にならないでしょう。また良い感じに結果が出てきたとしてもそれは単語ベクトル的な側面で評価した最も遠い異分野であって、本当にその分野が最も遠い分野であることは言い切れません。ただし、業界地図を眺めて、「知らなかった分野だから最も遠い分野だ」と言い切るよりは説得力がある評価です。このような形で言葉(意味)の近さを数値化できることによって、今までにない評価が可能になることは、面白いと思います。また別の利用法を探してみたいですね

-daily, tech
-, ,