PLAID Engineer Blog

PLAID Engineer Blog


PLAID Engineer Blog

algorithm

A/Bテストより無駄なく最適化できる?バンディットアルゴリズムを試してみた

こんにちは、プレイドの@wikrshです。 プレイドが提供しているKARTEでは、サイトに来訪するユーザに応じて様々な接客アクションを行う機能を提供しています。 接客アクションのようなウェブサイト上の施作の効果を検証する方法としてはA/Bテストが有名だと思いますが、今回のエントリーではA/Bテスト以外の手法としてバンディットアルゴリズムをざっくりと紹介したいと思います。 A/Bテストとバンディットアルゴリズム バンディットアルゴリズムは、いくつかの施作を実験しながら実験中に得られる効果もできるだけ大きくしたい、という目的のためのアルゴリズムです。 例えばECサイトの商品画像としてAとBの2つの画像の内どちらを表示した方が購入確率が上がるかということを知りたい場合、…

Wataru IkarashiWataru Ikarashi

大規模データを解析するストリーミングアルゴリズムをサクッと見てみる

こんにちは、プレイドの @makinoy といいます。 私たちはKARTEというサービスを提供していますが、解析色が非常に強いサービスなので社内では解析周りのアルゴリズムの利用検討をよく行っています。 その流れで、最近ストリーミングアルゴリズムについて検討したので、代表的なものをちょっとここで書いてみることにします。 この紹介では、”大規模データ解析のためのストリーミングアルゴリズムをサクっと見てみる”をテーマにしようと思います。 ストリーミングアルゴリズムとは、一連のデータの流れであるストリームを処理するアルゴリズムです。 データは次々にやってくるので、基本的にひとつのデータ単位(イベント)に対して1回だけ処理をするのが特徴です。大量なデータを処理するために、ひとつ…

Yuki MakinoYuki Makino

機械学習 x PySparkでアルゴリズム開発をサクサクやる検証

こんにちは、プレイドの @nashibao です。 ちょっと前になりますが、PySparkの勉強会向けにPySparkの機械学習ライブラリであるmllibを弄ってみたりして面白かったので共有しようと思います。 コンテンツ 実験の動機 PySparkの紹介 MLLibのアルゴリズムの拡張 感想 この検証はPyData Tokyo #3の発表にかこつけて行われたので、その時の発表資料も貼っておきます。 PyData Tokyo Meetup #3での発表資料 実験の動機 分散環境での機械学習は実装が面倒なので、どこで実験するかは結構重要かな、と思います。その中でPythonが研究者周りでよく使われてる & ライブラリが豊富 & Spar…

Naoki ShibayamaNaoki Shibayama