テキストマイニング |
図は、日本国憲法前文をAIが分析した結果を表示したものです。 これは「 テキストマイニング 」と言われる手法で作られています。 「テキストマイニング」(テキストデータ採掘)とは、定型化されていない文章の集合からなるテキストデータをフレーズや単語に分解して詳細に解析し、有用な情報を抽出する分析手法、とのことです。 「スコアが高い単語を複数選び出し、その値に応じた大きさで図示しています。 単語の色は品詞の種類で異なっており、青色が名詞、赤色が動詞、緑色が形容詞、灰色が感動詞を表しています。 単語をクリックすることで、詳しい本文をご覧いただけます。 」と表示されています。 以下のサイトで体感出来ます。 『走れメロス』、メールに添付した「雨にも負けず」、ご自身の著作でも試して見ることが出来ます。 AIは、どう分析するのか?一つの考え方として面白いと思います。 [ テキストマイニングとは?やり方やツールまで解説 ] また、一つの文章の構造を分析するサイト「KNP」もあります。 木の枝のように見事に分かれる系統樹、すっきりします。 | ||