無番地

趣味のこととか。

トピックモデルによるアイドル楽曲大賞2015の分析

アイドル楽曲大賞2015の結果が全部公開されたので、さっそくトピックモデルに放り込んでみました。

方法

簡単にまとめると、

  • ダーツの的がいくつか(今回は10個)ならんでいる
  • それぞれのダーツの的にいろいろな当たりやすさ(面積)で曲が書いてある
  • 「好きな的を選んで」「1本投げて」「当たった曲に0.5ポイント投票する」
  • これを20回繰り返す
  • これを全投票者が行った結果が、投票結果

大切なのは、的があらかじめ決まっているのではなくて、投票結果だけをもとに、的がどんなものであったのかを統計的に推定するというところです。詳しくは過去の記事をご覧ください。ultramarine.hatenadiary.jp


結果

楽曲大賞の順位は、Negiccoのワンツーフィニッシュとなっています。僅差の3位にアイドルネッサンス。投票者1232人×20本で24640本の矢が的に向かって投げられたことになります。

今回の順位に直結することだけ先にまとめておきます。

推定された的

10個を順に示します。大事なことなのでもう一度書きますが、このときに「どんな的に分類してほしいか」という指定はまったく行っていません。統計的に勝手に分類されてきた結果です。

<的1>選ばれた回数:3235回

f:id:umrn:20151231140442p:plain
全体の上位にある曲がそのまま入っているという、いわばオールマイティーな的ですが、でんぱ組.inc清竜人25も、Negiccoやアイドルネッサンスとの親和性が高いということを示唆しています。

<的2>選ばれた回数:1912回

f:id:umrn:20151231140443p:plain
さくら学院/武藤彩未/BABYMETAL、Perfume東京パフォーマンスドールというネーミングは難しいですが腑に落ちる的。

<的3>選ばれた回数:2251回

f:id:umrn:20151231140445p:plain
Dorothy Little Happy、callmeを中心とする的*1。ここにもアイドルネッサンスNegiccoが割り込んでいることが見て取れます。1位のねぇバーディアではなく2位の光のシュプールのほうが割り込んでいるのが興味深いところでしょうか。

<的4>選ばれた回数:2347回

f:id:umrn:20151231140434p:plain
ゆっふぃーとベビレが固まるものの上位3曲はそれらではないという的ですが、これも何となくイメージはつかめそうです。的3には光のシュプールが紛れていましたが、こちらにはねぇバーディアが紛れています*2

<的5>選ばれた回数:3043回

f:id:umrn:20151231140435p:plain
圧倒的Negiccoの的。他の的にも紛れ込んでいるけれど、元々の支持層みたいなところに大きな的を持っているというのが、2015年のNegiccoの圧勝を良く表しています。同じところにEspecia、WHY@DOLLという面々。

<的6>選ばれた回数:1818回

f:id:umrn:20151231140436p:plain
いまだ健在、ハロプロの的です。的の中の上位10曲が占める割合も大きめ。コレをどう考えるかは難しいところです*3

<的7>選ばれた回数:3106回

f:id:umrn:20151231140437p:plain
エビ中の的ですね。しかしここでも1位に割り込んでいるNegiccoどんだけ強いのかと。

<的8>選ばれた回数:2118回

f:id:umrn:20151231140438p:plain
圧倒的アイドルネッサンスの的。3位4位を占めた勢いはダテじゃありません。この的8と的5との選ばれた回数の差がそのまま順位に反映されているということでもあります。

<的9>選ばれた回数:2252回

f:id:umrn:20151231140439p:plain
ミライスカートと乃木坂の的であると推定結果は主張します。みなさんに納得していただけるかは分からないです。まぁ、結果を信頼するなら、たとえば「ナモナイオト」は「命は美しい」っぽくもあるんじゃないですかね*4

<的10>選ばれた回数:2558回

f:id:umrn:20151231162544p:plain
48系(AKB48/SKE48/HKT48)とiDOL Street系(SUPER☆GiRLS/Cheeky Parade/GEM)とが一緒になった的です。48系の的にアイスト勢が加わってきた*5という状況は、昨今の情勢からすれば納得できるのではないかと思います。

2013年の結果との比較

上位の曲の選ばれ方

上位の曲がどの的を選んだうえで投票されたかを示したグラフです。一目瞭然ですが、2013年と違ってどの曲も多くの的を経由して投票されています。
f:id:umrn:20151231140441p:plain

以下が2013年。

f:id:umrn:20151211223425p:plain

トピックモデルでアイドル楽曲大賞2013の結果から「イイキョク」を分類してみた - 無番地

また、それぞれの的で特定の曲が占める割合も小さくなりました。つまり、円グラフのothersの面積が増えました。これらのことは、投票者が聞く曲が多様になっているということを示唆しています。いろいろな的をまたがって曲を聞くような人が増えてきている(もしくはそれ以外の投票者が減っている)のだと思われます。

的同士の比較

以下のような変化がありました。

2013年 説明 2015年 説明 備考
的1 ハロプロ 的6 ハロプロ 変わらず
的2 48/46系 的9
的10
的9:ミラスカ/乃木坂
的10:48/アイスト
分離統合?
的3 Negicco/女子流/ライムベリー 的5 Negicco/Especia/WHY@DOLL いわゆる楽曲派?
的4 BiS/でんぱ組/さ学 的2
的1
的2:さ学/Perfume
的1:でんぱ組/清竜人25/オールマイティー
さ学系とでんぱ系で若干分離?
的5 エビ中/ももクロ 的7 エビ中 単独でひとつの的
的6 AKB48 的10 48/アイスト ラッパ練習中の的でしたからね…
的7 - - 的1/2/4あたりに分散?
的8 - - 的1/2/4あたりに分散?
的9 Dorothy/ひめキュン 的3 Dorothy/callme ひめキュン勢はどこに分散したのだろう…
的10 SKE48 的10 48/アイスト ツムラブ!の的でしたからね…
- - 的4 ゆっふぃー/ベビレ 新しい的(?)
- - 的8 アイドルネッサンス 新しい的

※2013年の結果はこちら。
ultramarine.hatenadiary.jp

気になる点としては、

  • 48/46系の的が3個から1個*6に減少
  • アイストと48系でひとつの的
  • ハロプロの箱庭感
    • 結局「大型グループ」を聞く人とそれ以外を聞く人はかなり強く分かれているのかもしれません。
  • 乃木坂が48系ではない的に移動
    • この結果だけで言うのは適切ではありませんが、現状で乃木坂のほうが幅広い支持を得ているのだとは思います*7
    • これが、たとえば、同じ乃木坂でも「あらかじめ語られるロマンス」みたいな曲が上位にランクインしてくるようになると、もう少し的の様相にも変化があるんじゃないかと想像します。
  • いわゆる楽曲派の的が、Negicco/東京女子流/ライムベリーからNegicco/Especia/WHY@DOLLに変化
  • 女子流はドロシーの的に統合されていて、ドロシーの的にあったひめキュンが分散している印象
  • アイドルネッサンスの的が登場
    • これらを無理に楽曲派などと呼ぶ必要は無いので、もはや「楽曲派」は死語なのかも?

などでしょうか。

チラ裏

  • 分析にあたって、ウェブサイトの情報をスクレイピングしてデータセットを作成していますが、コレが実は結構大変です(笑)
    • まあ、データベースをいただけないか伺えば良いのでしょうけれど…
  • 一連の分析における問題点として、以下があります。
    • 投票は(4曲以下でも6曲以上でもなく)5曲という制約が組み込まれていない(1曲以上・無限曲に投票可能という想定でモデルを推定している)
    • 投票は(9.5ポイント以下でも10.5ポイント以上でもなく)10ポイントという制約が組み込まれていない(0.5ポイント以上・無限ポイントを投票可能という想定でモデルを推定している)
  • このような「制約条件(具体的には定数和出現数・定数和単語数)付きトピックモデル(?)」についてご存じの方は、ぜひご連絡いただけますと幸いです*8
  • 2013年の結果だけ見るとLatent Dirichlet Allocationのトピックモデルじゃなくて単純なUnigram Mixtures*9でも良いんじゃないかと思っていましたが、2015年をやってみるとやはりトピックモデルが良さそうです*10

*1:こうやって書くと切ないですね…少なくとも楽曲大賞という文脈では、いまもドロシーとcallmeは一緒なのです

*2:裏付けはありませんが直感的にはこれも理解できる…?

*3:投票者のバイアスなのか、それとも本当にこれらのグループはハロプロファンがいなければやっていけないのか…

*4:やっぱ無理矢理かな…

*5:むしろアイストの的に48系が同居しているというのが正しい表現か

*6:的9と的10で0.5個ずつというイメージ

*7:実感には合うかと

*8:実社会での応用可能性も高いと思っています

*9:今回の例で単純にいうと、まず的を1つ選んで、その的に矢を20本投げ続けるという制約を入れて的を推定するモデル

*10:推定結果を見ても、2つ以上の的に投げ分ける人が2013年よりも多いです