こんにちは。検索・編成部の原島です。
大学の研究者にお会いすると、「クックパッドのデータを研究に使用したいんですが...」と相談されることがあります。料理に関する研究をしているけれど、実際のデータがないため、なかなか研究が進まないという相談です。
料理に関する研究が進まないのは、クックパッドにとっても残念なことです。これらの研究は、クックパッドのサービスを改善するための「芽」でもあります。データがないだけで芽が育たないのは、非常に悲しい話です。
このような現状を打破するため、本日から、クックパッドのデータを研究者に公開します。このエントリでは、我々が準備してきたデータ公開の仕様について QA 形式で解説します。
誰が利用できるの?
申請していただいた研究者です。ただし、公的機関(e.g. 大学、独立行政法人)の研究者に限ります。申請時には、クックパッドと国立情報学研究所(後述)による審査があります。
何が利用できるの?
レシピと献立に関するデータです。レシピについては、クックパッドで 2014 年 9 月 30 日までに公開されたレシピが利用可能です。各レシピに付随するデータは以下のとおりです。
- タイトル
- 材料
- 手順
- つくれぽ(「作りましたフォトレポート」の略)
- etc
献立については、クックパッドで 2014 年 9 月 30 日までに公開された献立が利用可能です。各献立に付随するデータは以下のとおりです。
- タイトル
- 調理時間
- ポイント
- コツ
- etc
レシピ・献立ともに、公開するのは、クックパッド上で誰でも閲覧できるデータ(クロール可能なデータ)だけです。
どうすれば利用できるの?
国立情報学研究所(以下、NII)が運営する情報学データリポジトリで利用申請を受け付けています。NII は、情報学分野の研究を促進させるため、様々なデータを集約しています。そして、それらを利用するための統一的な窓口を設置しています。クックパッドのデータも、NII の協力の下で公開しています。
http://www.nii.ac.jp/dsc/idr/cookpad/cookpad.html
利用手順は下図のとおりです。申請の審査も含めて、申請してから 1 〜 2 週間でデータを利用できます。
いつから利用できるの?
本日(2 月 24 日)から申請を受け付けます。
なぜ公開するの?
最後に公開の動機です。データを公開する一番の動機は、冒頭でも述べたとおり、料理に関する研究を促進させたいというものです。
料理に関する研究をしている人は沢山います。最近では、料理に関する研究会や国際会議なども開催されています。しかし、データがないことで、多くの研究が行き詰っています。これは非常に残念なことです。
今回のデータ公開は、これらの研究を支援するものです。データがあれば、既存の研究を発展させたり、新しい研究を創出させることができるかもしれません。そして、それらは、まわりまわって、クックパッドのサービスを改善するための芽となります。
また、別の動機として、悪質なクロールを減らしたいというものがあります。
残念ながら、研究者の中には、クックパッドのデータを使用するため、悪質なクロールを行う方がいます。短時間に膨大なリクエストが送られると、最悪の場合、クックパッドのサービスに影響が出る恐れがあります。
しかし、クックパッドがデータを公開すれば、わざわざクロールする必要はありません。公開されているデータを利用する方が、圧倒的に楽です。そして、悪質なクロールが減れば、サービスの健全性も向上します。
まとめ
本日からクックパッドのデータを研究者に公開します。公開するのはレシピや献立に関するデータです。利用申請は NII で受け付けています。本件を通して、沢山の研究が前進すれば幸いです。
データ公開は、私と会員事業部の有賀、同部の村田で運用しています。本件に関するお問い合わせなどありましたら、recipe-corpus [at] cookpad.com までご連絡ください。よろしくお願いします。