Hadoop

Hadoopについてまとめてみた

しばらくHadoopについて挑戦してきたので、いままでの成果をチュートリアル風にまとめてみました。 Hadoopをとりあえず動かしてみるために これは以下の記事で触れた内容を再編成したものです。 Hadoopセットアップ-その1(スタンドアロンモード) adoopセット…

MahoutでLDA…のはずだった

今日は(前回の続きで)mahoutをいじっていたんですが、 全然うまくいきませんでした… 最後の最後でフリーズするんですよね。 反復学習が終わっておそらくもう終了するであろうというタイミングです。 INFO driver.MahoutDriver: Program took 75878 ms (Minut…

Mahoutセットアップ

前記事に引き続き、本日連続更新であります! さて、Mahoutをインストールしましょう。 MahoutはHadoop上で動作する機械学習フレームワークです(たぶん)。 数年前に見つけて以来ずっと興味があったのですがそもそもHadoopがよくわからないレベルだったので …

Hadoopアップデート

大変間が空いてしまいました… またしばらく放置してしまっている間に、Hadoopがバージョンアップしています。 バージョン1.0.4が最新安定板のようです。 ちなみに我が家のhadoop(疑似分散モード用)はバージョン1.0.0でした。

Hadoopセットアップ-その3(完全分散モード)

いやーかなり間が空いてしまいました… 重い腰をあげて3台(仮想環境に)セットアップしました! 3台にhadoopをセットアップする ひとまず、前々回の記事の通り、hadoopをrpmからインストールしました。 ホスト名はそれぞれ、hadoop1、hadoop2、hadoop3です。(…

Hadoopセットアップ-その2(疑似分散モード)

前回から少し時間が経ってしまいましたが、Hadoopセットアップの続きを行います。 今度は疑似分散モードに設定します。 設定ファイル編集 まずは公式サイトにあるようにそのまま設定します。

Hadoopセットアップ-その1(スタンドアロンモード)

久しぶりにHadoopを使ってみようと思います。 hadoopには以前から興味があり、試しにさわった程度の経験はありますが かなり忘れてしまっているので、もはや手探り状態です。 まずは公式サイトのドキュメントに従ってインストールします。