How to make Dramatic Positive Review Sites

TVドラマに関するポジティブな批評のみを集めたサイト構築を目指した取り組み

Dramatic Positive Review vol.3 ドラマの情報を集める

目次はこちら(作成予定)。前回はこちら。次回はこちら(作成予定)。

さて、今回はドラマ番組の情報を入手する手段を考える。レビューをするのに必要な情報は何があるだろうか。いくつかのサイトを調べてみたが(Yahoo!JAPAN テレビ、ザテレビジョン、みんなのドラマレビュー、Wikipedia)概ねこんな感じだろうか。

タイトル、キャスト、脚本、音楽、主題歌、制作、放送局、シーズン、話数、放送時間、原作、演出、プロデューサー、公式ページ、概要、別名、監修、国・地域、言語

Wikipediaにもそれなりの情報が載っていそうだったので、ここから情報をとってみようか。DBpediaの方が構造化されているが、情報が限定されている印象がある。例えば、アンサングシンデレラは、Wikipediaにはあるが、 https://ja.wikipedia.org/wiki/%E3%82%A2%E3%83%B3%E3%82%B5%E3%83%B3%E3%82%B0%E3%82%B7%E3%83%B3%E3%83%87%E3%83%AC%E3%83%A9 DBpediaにはない。 http://ja.dbpedia.org/page/%E3%82%A2%E3%83%B3%E3%82%B5%E3%83%B3%E3%82%B0%E3%82%B7%E3%83%B3%E3%83%87%E3%83%AC%E3%83%A9

うむ。ドラマのRDFを見たら、必要な情報はそれなりに乗っていたので((例)http://ja.dbpedia.org/data/%E8%B8%8A%E3%82%8B%E5%A4%A7%E6%8D%9C%E6%9F%BB%E7%B7%9A.n3)ここから情報をとるSPARQLをざっと書く。

select distinct *
where { ?s dbpedia-owl:genre    dbpedia-ja:テレビドラマ ;
foaf:name ?title;
dbpedia-owl:abstract ?abstract;
dbpedia-owl:starring ?cast;
dbpedia-owl:country dbpedia-ja:日本;
prop-ja:脚本 ?scenarioWriter;
prop-ja:演出 ?enshutu;
prop-ja:プロデューサー ?producer;
prop-ja:制作局 ?seisaku;
prop-ja:放送局   ?kyoku;
prop-ja:放送時間 ?airtime;
prop-ja:放送回数 ?times;
dbpedia-owl:openingTheme ?ot;
dbpedia-owl:endingTheme ?et;
foaf:homepage ?homepage
.
  } LIMIT 100

DBpediaのエンドポイント投げたところ 一応取れた。

URLと日本語が混在している結果が見にくいが、複数のクエリを分けて投げて、URLはパースすることで情報を得ることとしたい。 続く。