Tag Archives: 分散

高速な分散処理エンジンApache Sparkの操作を対話シェルで試してみる!

スクリーンショット 2015-01-03 17.09.12

最近、規模の大きなデータを、高速に処理する方法を調べています。 Apache Sparkは高速な分散処理エンジン 「高速に」といっても、「スループットが高い」という意味と、「レスポンスが早い」という意味があります。 「スループットが高い」というのは、一定時間にどれだけたくさんの処理ができるかです。「 ... Read More »

分散SQLクエリエンジンPrestoをMac OS Xにインストール

スクリーンショット 2014-11-08 0.47.07

Webサービスの運用にデータを活用する場合、まず改善のための仮説を立てます。そして、その仮説が正しいか検証するために、データベースから関連するデータを抽出します。 このデータを抽出する作業は、解析内容が複雑になるほど、そしてデータが多いほどに、時間がかかります。 データを抽出するのに時間がかかると、 ... Read More »

Scroll To Top