内容へ移動
ClownWiki
ユーザ用ツール
ログイン
サイト用ツール
検索
ツール
文書の表示
以前のリビジョン
バックリンク
最近の変更
メディアマネージャー
サイトマップ
ログイン
>
最近の変更
メディアマネージャー
サイトマップ
トレース:
temporary:mapreduce
この文書は読取専用です。文書のソースを閲覧することは可能ですが、変更はできません。もし変更したい場合は管理者に連絡してください。
====== MapReduce ====== > map処理をreduce処理の2段階に分けてデータの処理を行う。 > map処理は、分割されたデータの断片に何らかの加工を施し、必要な情報を抽出する。 > reduce処理は、map処理で抽出した情報を束ねて、データ全体についての整理された処理結果を得る。 > > MapReduceシステムはデータを分割し、必要な数のコンピュータを使って並列にmapとreduceを実行し、処理結果を返す。 ====== Hadoop ====== > Apache Hadoopは大規模データの分散処理を支えるJavaソフトウェアフレームワークであり、フリーソフトウェアとして配布されている。 http://ja.wikipedia.org/wiki/Apache_Hadoop ====== Hive ====== > Apache HiveはHadoop互換のファイルシステム(たとえばAmazon S3)に格納された大規模データセットの分析を行う。使用には、map/reduceを完全にサポートしたSQLライクな「HiveQL」という言語を用いる。クエリの高速化のため、ビットマップインデックスを含めたインデクス機能も実装している。 http://ja.wikipedia.org/wiki/Apache_Hive ====== Pig ====== > PigはMapReduceのラッパー*であり、簡単なデータフローを記述するだけで、Map関数とReduce関数に変換し、Hadoop上で分散処理を実行することが可能です。 http://itpro.nikkeibp.co.jp/article/COLUMN/20120418/391529/
temporary/mapreduce.txt
· 最終更新: 2025/02/16 13:53 by
127.0.0.1
ページ用ツール
文書の表示
以前のリビジョン
バックリンク
文書の先頭へ