Hiveでパーティションを利用する - OpenGroovehiveにパーティションを導入すれば、パーツを指定してクエリを発行できるので、余計な読み込みを抑えて効率よく処理することができる。…ということで、チャチャッと演習(といいつつ長い)。 テーブル作成。 以下太字で示しているパーティションのkeyは、データに含まれていない値でかまわない。 hive> CREATE TABLE sales( id INT, shop_id STRING, date_id...
girled hive, data, Hadoop, ビッグデータ, データストア, 分散データストア, YARN, Apache それなりのaccess_logをHiveでselectするとクエリが止まったりDatanode死んだりしてて原因よくわかんなかったけど適度にパーティション切ればいけそうな気がしたのっ今日試す!