無番地

趣味のこととか。

トピックモデルでアイドル楽曲大賞2013の結果から「イイキョク」を分類してみた

ハロプロ楽曲大賞アイドル楽曲大賞の投票結果を見ていると、「イイキョク」といってもいろいろあるのだなぁと感じます。投票者にはそれぞれ好みがあるので、同じ系統の曲(Aという曲に投票した人はBという曲にも投票しやすい)とか、様々な観点(アップテンポだったらAという曲、バラードだったらBという曲に投票する)のような関係が見られるとおもしろそうです。

そこで、新聞記事から記事のトピック(=話題)を自動分類するときに使われる「トピックモデル」というモデルを使って、楽曲大賞の投票結果から、「イイキョク」を統計的に自動分類してみました。

今回は、第2回アイドル楽曲大賞2013・メジャーアイドル楽曲部門の投票結果をもとに分類してみます*1

ハロプロ楽曲大賞2013もやりました
ultramarine.hatenadiary.jp
 

方法の簡単な説明*2

いま考えていることは、投票者の立場に立つと、以下のような状況です*3

  • 20本のダーツの矢を持っている
  • ダーツの的は10個あって*4、それぞれの的に書いてある曲や、その曲の当たりやすさがいろいろ
  • 1本ずつ好きな的を選んで矢を投げる(つまり、20本同じ的に投げても、2本ずつ10個全部に投げてもOK)
  • 当たった曲に、矢1本あたり0.5ポイント投票する

 

結果

先に楽曲大賞そのものの順位を見ておきましょう。1位が恋するフォーチュンクッキー、2位がアイドルばかり聴かないで、3位が君の名は希望、などとなっています。投票者1867人×20本で37340本の矢が的に向かって投げられたことになります。

以下で得られた的を10個示しますが、このときに「どんな的に分類してほしいか」という指定はまったく行っていません。統計的に勝手に分類されてきた結果です。

 

どんな的があるか(=「イイキョク」はどんな分類なのか)

それぞれのダーツの的がどんなものかを円グラフにしました。それぞれの的で選ばれやすい上位10曲が示されています。ここに並ぶ曲を見ると、それぞれの的がどんな的なのかが推測できるというわけです。

<的1>選ばれた回数:2519回

f:id:umrn:20151211114930p:plain
THE ポッシボーアップアップガールズ(仮)吉川友とならぶいわゆるハロプロの的です。ハロプロ出身者が出した曲の中での「イイキョク」がこの的の上位に来ているというわけです。

<的2>選ばれた回数:3259回

f:id:umrn:20151211114931p:plain
乃木坂46HKT48など、48/46系グループで、いわゆる「イイキョク」と評される曲が並んでいる的です。以下に出てくる的6=AKB、的10=SKEと比べると、偏りのない(比較的多くの人が納得できる)的だと思います。

<的3>選ばれた回数:4657回

f:id:umrn:20151211114932p:plain
Negicco東京女子流、ライムベリーなど、いわゆる「楽曲派」と呼ばれる平均的なイメージが並んでいる印象ですね。9位に恋するフォーチュンクッキーが入っているのもそういう特徴を良く表しているのではないでしょうか。

<的4>選ばれた回数:5821回

f:id:umrn:20151211114933p:plain
選ばれた回数が最大の的。BiS、でんぱ組.incさくら学院、BABYMETALなど的3とは少し傾向の違う「音楽好き」が選びそうな的です。この的は選ばれた回数が多いので、的を20個とかに増やせば細分化される可能性がありそう。

<的5>選ばれた回数:4862回

f:id:umrn:20151211114937p:plain
全体の4位にランクインした私立恵比寿中学を1位に、BABYMETALやももいろクローバーZが入っている的です。言語化は難しいですが*5、これも直感的には納得できる的です。

 

<的6>選ばれた回数:2959回

f:id:umrn:20151211114938p:plain
AKBの的です。あるいは、渡辺麻友さんに投票した人が残りの4曲ぶんをAKBに割り振っただけかもしれませんが…*6

<的7>選ばれた回数:3168回

f:id:umrn:20151211114939p:plain

<的8>選ばれた回数:4028回

f:id:umrn:20151211114940p:plain
この2つの的は若干説明しづらいかな…という印象。別に悪い意味ではなくて「その他の的」みたいな感じだと思います。

<的9>選ばれた回数:4103回

f:id:umrn:20151211114947p:plain
Dorothy Little Happy、Party Rockets、ひめキュンフルーツ缶と、かつての仙台・STEP ONEと愛媛・マックルでひとつの的を形成しています。納得の結果でしょう*7

<的10>選ばれた回数:1964回

f:id:umrn:20151211114948p:plain
SKEの的。おそらく第2回アイドル楽曲大賞の結果に若干の疑問を引き起こしたであろう的がコレです*8。他の的と比べて顕著なのは、選ばれた回数が少なく、上位10曲が的の全体に対して占める割合がとても大きいこと。

できあがった的(=イイキョクの分類)をどう考えるか

的7や的8は若干わかりにくいですが、予想以上にくっきりと傾向が分かれたと思います。繰り返しになりますが、別に「AKBの曲は1つの的にまとめてね」などと指定しているわけではなくて、投票結果を統計的に処理したら勝手にこのように分類されるというのがトピックモデルのすごいところです。

的1=ハロプロ出身者、的2・6・10=48/46系の的は、それぞれの的の上位曲が的全体に占める割合が大きいです。つまり特定の曲に票が集まっているということですが、これはおそらく2通りの解釈が可能です(実際はその両方なのだと思います)。

  • ハロプロや48/46系の特定の曲以外の曲を知らない投票者が多い
  • ハロプロや48/46系はたくさん曲は出すけどイイキョクは限られている

上位の曲はどの的から選ばれたのか

これが最大の注目点だと思います。ほとんどの場合薄すぎて見えないだけで*9、いちおうすべての的にすべての曲が書かれているので、どの的を経由してそれぞれの曲に矢が当たったのかということを見れば、その曲がどういう観点で票を集めたのかが分かるわけです。
f:id:umrn:20151211223425p:plain

1位:恋するフォーチュンクッキーは、的2・6=48/46系から選ばれていることは確かに多いものの、他の的からも順当に選ばれています。この曲が広く愛されている曲であることを裏付けます。また、5位のでんぱ組や9位のおはガールも、特定の層から愛されているというよりはむしろ、いろいろな層に受け入れられていると考えられます。実際にも、これらの曲は投票者1人あたり2pts(ダーツの矢なら4本)前後という、上位曲としては非常に小さい値となっています。大量点を投票する人がいるのではなくて、多くの人がちょっとずつ加点していった結果だといえます。12位の制服のマネキンなんかもこのパターン。

一方、3位の乃木坂、4位のエビ中、6位の渡辺麻友さん、8位のポッシボーが特定の層に支えられているというのも比較的わかりやすい結果だと思います*10

そして、意外といえば意外なのか、やはりといえばやはりなのか、2位・7位のNegiccoは実は的3という特定の層に支えられていることがよく分かります。10位のBiSもでしょうか。

ところで、上位10曲にまったく出現しない的が、ほとんどSKE48関連の曲で構成される的10です。このことから、アイドル楽曲大賞2013の投票者には、2013年のSKEの曲も他のアイドルの曲も横断的に「イイキョクだな」と捉えた人がほとんどいない、ということが分かります*11

どんなふうに的が選ばれているか

投票者がどの的に何本の矢を放ったかも推定されているので、それぞれの投票者が何個の的に向かって投げたかを見ます。半分近い人は1個の的に投げ続けていて、的の数が増えるにつれて減っていき、5個の的に投げ分けている人がわずかにいるといった状況。

1個 2個 3個 4個 5個
872 783 193 17 2

つまり、特定の1つの「イイキョクの分類」から投票先を選ぶ人が半分くらいで、2つの「イイキョクの分類」から選ぶ人が残り半分くらいという感じです。

ちなみに、それぞれの的に投げた延べ人数を、その的に通算何本の矢を投げたかで色分けしたグラフがこれ。
f:id:umrn:20151211212223p:plain
的6(AKB)や的10(SKE)には、20本投げ続ける人の割合が大きいようにも見えますが、ハッキリしたことは分かりません。ほかにも、2つの的を選ぶ組み合わせなんかも調べてみると面白いかもしれません。

おわりに

楽曲大賞の結果は、トータルのランキングと、グループごとのランキングとで見るのが通常の見方だと思います。今回は、その単純な見方だと分からない、「イイキョクがどんな系統に潜在的に分類されているのか」ということを探ってみました。

「楽曲派」とか「パフォーマンス重視」などというと「結局は主観」とか「揉め事の原因」みたいな雰囲気を感じる今日このごろ。それならば、主観に頼らず、みなさんの意見を統計的に分類したものに名前をつけたほうが良いのではないかと思ったわけです。たとえば、「楽曲派」と言っても特定のグループばかり聴いている人が多くて信用ならん、というのはその通りだと思っています。これに対して、今回の結果だけからいうと、的3をたくさん選ぶような人のことを楽曲派というのだと思います。楽曲大賞ですから、他の的を選んでいる人だって楽曲という基準で投票しているわけですね。

的10の影響かどうかは分かりませんが、昨年から、アイドル楽曲大賞では投票上限3.0ptsという統計的にかなり強い制約が課されることになりました。同じ曲に7本目以降の矢が刺さったらそれはなかったことにして投げ直すと考えると、その制約の強さが実感できるかと思います。その制約の下で行われた昨年の結果も分析したいところですが、昨年については各投票者がどの曲に何ポイント投票したのかの全情報は公開されていないようです。

つぎにやるかもしれないこと

→再掲:ハロプロ楽曲大賞2013もやりました
ultramarine.hatenadiary.jp

*1:余力があればほかの結果にも適用していきます

*2:ここでは真剣な説明には立ち入りませんが、「トピック」が「イイキョクの分類」、「文章」が「一人ひとりの投票結果」、「単語」が「曲」、「単語の出現数」が「投票得点」です

*3:厳密には、この想定では投票先が5曲になるとは限りませんが、今回はこれで良いことにします

*4:本当は、的が何個あるか自体も推定できますが、今回は「10個の的がある」と事前に決めました

*5:良い意味で意識高いというイメージ

*6:実はさよならクロールは名曲として評価されていた! みたいな結果にならなかったので個人的にはちょっと残念w

*7:こんなにハッキリ出るとは思ってなかったです

*8:個人的には「マツムラブ!」は賛成カワイイ!と思いますが!(意味不明)

*9:要はフレンドパークIIのパジェロをさらに薄くした感じ

*10:特に「ラッパ練習中」はすべての得票が的6からのもので、実際にも1人あたり5.5点が投票されています

*11:だからといって決して組織票だなどというつもりはありません。投票者は、自分が知っている曲の中から投票するのだから、他のアイドルの曲を聞いたことがなければ、あるいは良いと思わなければ、こうなるのは自然なことです