PLAID Engineer Blog

PLAID Engineer Blog


PLAID Engineer Blog

streamingalgorithm

大規模データを解析するストリーミングアルゴリズムをサクッと見てみる

こんにちは、プレイドの @makinoy といいます。 私たちはKARTEというサービスを提供していますが、解析色が非常に強いサービスなので社内では解析周りのアルゴリズムの利用検討をよく行っています。 その流れで、最近ストリーミングアルゴリズムについて検討したので、代表的なものをちょっとここで書いてみることにします。 この紹介では、”大規模データ解析のためのストリーミングアルゴリズムをサクっと見てみる”をテーマにしようと思います。 ストリーミングアルゴリズムとは、一連のデータの流れであるストリームを処理するアルゴリズムです。 データは次々にやってくるので、基本的にひとつのデータ単位(イベント)に対して1回だけ処理をするのが特徴です。大量なデータを処理するために、ひとつ…

Yuki MakinoYuki Makino