DroidKaigi 2021にクックパッド社員が登壇します & アフターイベントを開催します!

こんにちは、モバイル基盤部の茂呂(@slightair)です。

エンジニアが主役のAndroidカンファレンス、DroidKaigi 2021 の開催がいよいよ来週にせまってきました。 今年は10/19(火)から3日間、オンラインで開催されます。

droidkaigi.jp

クックパッドは、本カンファレンスにゴールドスポンサーとして協賛しています。 そして、クックパッドに所属するこやまカニ大好きが登壇します。登壇スケジュールと内容を紹介させてください。

登壇情報

Day2

10/20(水) 14:40〜 (25分)

2020年代の WebView 実装 / こやまカニ大好き

Jetpack Compose 時代になってもおそらく無くならない、古くて最新の View の話をします。

歴史あるアプリには大抵、 WebView でしかアクセスできない画面や機能があると思います。 WebView で開くページにセッション情報を引き継ぐための認証の仕組みや、カスタム JavaScript を動かすための仕組みもあるかもしれません。 WebView の履歴を Fragment 内で goBack() するための特殊な実装や、ドキュメントには存在しない謎の openFileChooser() メソッドを見かけた開発者もいるかもしれません。

本セッションでは8年の歴史を持つクックパッドアプリの秘伝の WebView 実装を最新化した経験を元に、現在の WebView 実装のベストプラクティスと古い WebView の改善方法について説明します。

発表者のコメント

こやまカニ大好きです。好きなカニはトラフカラッパです。 本セッションでは歴史あるクックパッドアプリの経験を元に、WebViewとうまく付き合っていくための工夫についてお話します。 WebViewが好きな方も嫌いな方も興味がない方もWebViewとの付き合いは止められないと思うので、この機会にぜひWebViewの話を聞いてみて下さい。

After Party DroidKaigi 2021 を開催します!

また DroidKaigi の後夜祭として、「After Party DroidKaigi 2021」というイベントをクックパッド主催で10/28(木) 19:00 からオンラインにて開催します!

cookpad.connpass.com

本イベントは YouTube Live にて配信し、アーカイブ視聴も可能にする予定です。ご都合のつく形での参加をぜひご検討ください。

イベントではクックパッド社員がカンファレンスでは採択されなかったトークを発表したり、DroidKaigi に参加してどんなことを感じたか皆さんのコメントや質問を拾いながらお話しする予定です。 DroidKaigi の余韻に浸りたい、発表を見てクックパッドのAndroid開発についてもっと知りたいという方がいましたら、ぜひこちらのイベントにもご参加ください。お待ちしております。

※ 本イベントはDroidKaigi実行委員会より名称利用の許可を受け、DroidKaigi 2021に協賛しているクックパッド株式会社が主催するものです。

おわりに

カンファレンスには、多くの社員が参加する予定です。トークに関すること、After Party などに関してご質問やご感想などございましたら、お気軽にお声がけください!

クックパッドでは、Android のサービス開発に一緒に取り組んでくれる仲間を募集しています。トークを見て少しでも興味を持っていただいた方にはこちらをご参照いただけましたら幸いです。

info.cookpad.com

カジュアル面談も行っていますので、クックパッド社員と話をしてみたいという方はお気軽にお申し込みください。

docs.google.com

それでは、カンファレンスでお会いしましょう!

今すぐ ALB のアクセスログをクエリする

クックパッドマートでサーバーサイドなどのソフトウェアエンジニアをしている石川です。

この記事では、クックパッドマートとは全然関係なく、私が正社員として新卒入社する前、2020 年初頭に技術部 SRE グループで就業型インターンをしていた際に実装したシステムについてご紹介します。

ALB のアクセスログ

弊社では AWS の Elastic Load Balancing (ELB) を多用しており、Application Load Balancer (ALB) が多くのウェブアプリケーションで利用されています。

ところで ALB はアクセスログを Amazon S3保存することができます。このアクセスログにはアクセス先の IP アドレスやリクエスト URL の他、レスポンスのステータスコード、レスポンスまでにかかった時間、User-Agent などの情報が記録されています。

これらの情報は分析の役に立ちます。ロードバランサーは典型的にはユーザーからのアクセスが最初に到達する場所であるため、たとえばエラーとなったアクセスがどこでエラーになったかの調査に ALB のアクセスログが役に立つ場合があります。

また、他にも社内だと以下の用途で ALB のアクセスログが使われたことがありました。

  • 特定のエンドポイントのレスポンスタイム分布の分析
  • 特定の User-Agent を持つリクエスト数の調査
  • 負荷試験のアクセスパターンを作る際の参考データ
  • 非推奨にしたエンドポイントへのアクセス数の調査
  • 499 Client Closed Request の頻度調査

(ただし、ALB のアクセスログはベストエフォートで記録されていることには注意が必要です。ドキュメントにも “We recommend that you use access logs to understand the nature of the requests, not as a complete accounting of all requests.” と書かれています。)

Athena を使ったクエリ

では実際にアクセスログを分析したいとなったとき、どうすれば良いでしょうか。ログが記録されたテキストファイルをダウンロードして手元でスクリプトを実行することでも分析できますが、このようなやり方を毎回繰り返すのは煩わしいですし、素朴な実装だと実行時間もそれなりにかかります。

そこで、ここでは Amazon Athena を使う方法について考えます。Athena は S3 に置かれた大量のデータファイル群に対して SQL で柔軟かつ高速にクエリができるサービスです。S3 に置かれている大量の ALB ログを素早く分析したいという今回のケースにはぴったりです。

実際、AWS のドキュメントには Athena で ALB ログをクエリするためにテーブルを作る SQL のサンプルが書かれています: https://docs.aws.amazon.com/athena/latest/ug/application-load-balancer-logs.html

このようにテーブルを作っておくと、たとえば「GET /users の最近のレスポンスタイムの平均」をクエリしたり「POST /a/deprecated/endpoint に最近目立ったアクセスがあるかどうか」をクエリしたりでき、便利です。具体的には以下のような SQL を書くことになります *1

select
    count(*) as log_count
    , date(from_iso8601_timestamp(logs.time)) as log_date
from
    alb_access_logs.cookpad as logs
where
    date(from_iso8601_timestamp(logs.time)) >= date '2021-09-01'
    and logs.request_verb = 'POST'
    and logs.request_url like '%/a/deprecated/endpoint'
group by 2
order by 2

注意点として、Athena の料金はクエリ時にスキャンされたデータサイズについての従量課金制です。不必要に過去のログすべてに渡ってスキャンすると無駄に課金されてしまいます。クエリにかかる時間を考えても無駄です。

そこでパーティションを利用します。ALB ログが保存されている S3 key には year/month/day が含まれているので、ここについてパーティションを作り、クエリ時に year/month/day について絞り込むことでスキャンサイズを落とすことができます。*2

とはいえ、ALB ログを分析したくなる度にその ALB について Athena でテーブルを作ってパーティションを作って……とするのは面倒です。あらかじめ作ってあった方が便利ですし、日常的な調査をより機敏に行うことができるでしょう。

ということで ALB ログをいつでも Athena で分析できるようにこのあたりを自動化しよう、というのが、私がインターンで取り組んだタスクでした。

テーブルおよびパーティション作成の自動化

さて、それでは自動化いたしましょう。やることは単純で「まだテーブルが作られていない ALB についてテーブルを作り、まだ作られていないパーティションについてパーティションを作る」というバッチを実装すれば良いです *3。今回パーティションは year/month/day 単位で付けようとしているため、実装したバッチは日次で実行すれば良いでしょう。

実装について考えます。テーブル作成部分については Athena で行う方法を先述しましたが、今回のバッチでは Athena の API を使うのではなく、Athena と統合して利用できるAWS Glue の API を使うことにしました。これは、生の SQL を実行することになる Athena よりも「テーブルを作る」などの操作ごとに API が用意されている Glue の方がより細かく権限管理できるためです。また今回の使い方だと Glue の利用にかかる料金は非常に安く、費用面でも問題になりませんでした。

この方針で、テーブル作成とパーティション作成を行ってくれるバッチを Ruby で実装しました。実装するにあたって一番複雑であろう、ログをパースするための正規表現が先述のとおり AWS のドキュメントに掲載されているため、後は AWS SDK を使って実装していくのみでした。このバッチは、社内のバッチ実行基盤である kuroko2 を使って日次で実行されるように設定しました。

このように作成したバッチは私の就業型インターンの期間中に運用が始まり、現在に至るまで特に大きな問題もなく動き続けています。

まとめ

この記事では、ALB のアクセスログを Athena でクエリしやすくするためにバッチを書いた話をご紹介しました。このシステムによって、日々の業務の中でほんの時々必要となるちょっとした作業を減らすことができました。同時に、Athena や Glue にそこまで詳しくなくても SQL がある程度書ければアクセスログをクエリできるという状態を作ることもできました。

このように、インターンの中で現実の問題を解決でき、社内のエンジニアリング環境を少し向上できた、面白いインターンであったと今更ながら考えています。

最後に、クックパッドでは、サービス開発や基盤開発にチャレンジする就業型インターンを通年募集しています。気になった方は是非ウェブサイトよりご応募ください:

info.cookpad.com

*1:すぐ下に書いてあるように、更にパーティションについても絞り込む必要はあります。

*2:更に、ALB ログは 1 行 1 アクセスログで保存されているテキストファイルなので、Parquet などのデータフォーマットに変換することでよりスキャンサイズを落とせる可能性があります。ただし今回は変換にかかる金銭コストと ALB ログへのクエリ頻度を天秤にかけ、この変換までは行っていません。

*3:もっと言うと不要になったテーブルやパーティションを削除しても良いです。

iOSDC Japan 2021 に社員7名が登壇します

こんにちは、モバイル基盤部の茂呂(@slightair)です。 発表される前は何も考えていなかったのに、あたらしい iPad mini の紹介ページを見ていたらちょっと欲しくなってきてしまいました。う〜む。

さて、毎年Appleの新製品やらOSアップデートの一般公開やらワクワクすることが続く季節ですが、ついにやってきましたね! iOSDC Japan 2021 が今週末 9/17(金)〜9/19(日)、オンラインで開催されます!

iosdc.jp

トークのご紹介

クックパッドは、ゴールドスポンサーをさせていただいております。

今回クックパッドからは7名のトークを採択いただき、登壇することになりました! ここで紹介させてください。

Day1

9/18(土) 11:30〜

Track C(40分)

  • 登壇者: あおい / @aomathwift
  • タイトル: 機能ごとに動作するミニアプリでプレビューサイクルを爆速にした話

fortee.jp

Track D(40分)

  • 登壇者: 生井智司 / @ainame
  • タイトル: App Store用スクリーンショットの自動生成をアラビア語対応してSwiftUIで実装してみた

fortee.jp

9/18(土) 13:30〜

Track E(20分)

  • 登壇者: uzzu / @uzzu
  • タイトル: StoreKit のこれまでとこれから

fortee.jp

9/18(土) 17:35〜

Track A(5分)

  • 登壇者: あつや / @n_atmark
  • タイトル: SwiftUI.Textを使いこなす5分間

fortee.jp

Day2

9/19(日) 10:50〜

Track E(20分)

  • 登壇者: yujif / @yujif_
  • タイトル: 自己管理の夢と Screen Time API

fortee.jp

9/19(日) 11:30〜

Track A(40分)

  • 登壇者: giginet / @giginet
  • タイトル: 大規模なアプリのマルチモジュール構成の実践

fortee.jp

9/19(日) 13:30〜

Track B(20分)

  • 登壇者: いまじん / @mrimjn
  • タイトル: MultipeerConnectivityを使った動画のリアルタイム端末間共有 〜料理動画撮影アプリの事例〜

fortee.jp

After Party iOSDC Japan 2021 を開催します!

またiOSDC の開催後、「After Party iOSDC Japan 2021」というイベントをクックパッド主催で 10/1(金)19:00からオンラインにて開催します!

cookpad.connpass.com

このイベントでは、カンファレンスでは惜しくも採択されなかったトーク、発表を終えての裏話、発表には入りきらなかった話などをお話しします。クックパッドのiOS開発ってどうなっているんだろう?どんな社員が働いているんだろう?という疑問のある方、クックパッドに興味のある方、なんかイベントがあるならとりあえず行くぜ!という方がいましたら、ぜひこちらのイベントにもご参加ください。お待ちしております。

※このイベントは「iOSDC Japan 2021実行委員会」が運営するものではありません。

おわりに

カンファレンスには、他にも多くの社員が参加する予定です。トークに関すること、After Party などに関してご質問やご感想などございましたら、お気軽にお声がけください!

クックパッドでは、iOSのサービス開発に一緒に取り組んでくれる仲間を募集しています。トークを見て少しでも興味を持っていただいた方にはこちらをご参照いただけましたら幸いです。

info.cookpad.com

それでは、カンファレンスでお会いしましょう!