Hack Day 2016ハッカソンに参加しました!

このエントリーをはてなブックマークに追加

今週からHousmartで働く松江です!

先日、Yahoo! Japanさんが主催する日本最大級のハッカソンイベントであるHack Day 2016に参加してきたのでこの場を借りてご紹介します。

作ったもの

スライド: https://speakerdeck.com/matsue/kizukai-at-hack-day-2016

KizukAIという、飲み会でちょっとした気遣いのできるAIを作りました。

KizukAIは飲み会のテーブルに置くことを想定して作られており、出来ることは以下の3つです。

  1. ビールがなくなったことを検知してビールの追加注文、またはお冷の注文を行う
  2. みんなの笑顔を検知して、合いの手を入れたり一緒に笑う
  3. 飲み会中の自然な笑顔画像を集めておく

1つ目の機能は、まさしく夢のビールのオートデプロイです!!

使ったもの

主に以下のデバイス・APIを使用して作りました。

THETA Sは、以下のようにドキュメントに書かれているようにAPIが変更され、先代よりもAPIが扱いやすいものになっていました。

RICOH THETA API v2は、Google社のOpen Spherical Camera API Version 1.0(OSC)に準拠しています。
https://developers.theta360.com/ja/docs/v2/api_reference/

ClarifaiはGoogle Cloud Visionのように、画像に写っている物体や状況に関する情報を返してくれるAPIを提供しています。 例えば以下のビール画像であれば”Beer, Glass, Foam, Cold, Drink, Indoor”といった情報が得られます。 泡があること、冷たいこと、室内であることも認識されていて驚きです。

動画にも同等のことができるようなので、そちらも使うと面白いことができそうです。

苦労したところ・工夫したところ

Clarifaiの前はGoogle Cloud Visionの使用を検討していましたが審査が間に合いませんでした。 Google Cloud Visionは現在プレビュー版を提供している段階で、使用するには申請が必要です。 審査には時間がかかるので、利用を検討する方は早めに申し込んでおくと良いと思います。

追記: Google Cloud Visionのベータ版の提供が始まり、申請すればすぐ使えます。

ビールの認識精度も上がらずに思考錯誤をしました。 開発会場で撮影されたビール画像は、背景が白いためかオフィスの写真と判定されビールとなかなか判定されませんでした。 ここは背景に暗めの色の布を置くことで判定率が上がりました。 しかし、白い背景を黒でデータ上で塗りつぶしたり、画像からビールジョッキ部分だけの切り抜いただけではビールの判定率はあまり変わりませんでした。 実際の居酒屋でテストしたところ、ビールが持ち上げられて卓上から離れている時間以外はほぼ認識できていたので、暗めの部屋や十分な泡もビールっぽさとして必要なのかもしれません。

また、開発会場内ではWifi使用者が多かったせいか、THETAのWifi転送速度が非常に遅かったため、デモの90秒以内に画像転送できるよう転送するサイズを小さくするといった工夫もしていました。 TEHTAはWifi接続してAPIを叩く必要があるため、操作するデバイスにはLANケーブルなど別のネットワークが必要なことも注意が必要です。

さいごに

今回の作ったものはこちらのレポジトリに置いています。

https://github.com/housmart/kizukai

また、幸いにも入賞することができ、CerevoさんのHackeyを頂いたので、これを使ってまた何か作ったらレポートしようと思います!

Yahoo! Japanさん、非常に楽しいイベントをありがとうございました!

このエントリーをはてなブックマークに追加